Remove Pickle-wrapping of Java objects in PySpark.

If we support custom serializers, the Python worker will know what type of input to expect, so we won't need to wrap Tuple2 and Strings into pickled tuples and strings.
author: Josh Rosen <joshrosen@apache.org> 2013-11-03 11:03:02 -0800
committer: Josh Rosen <joshrosen@apache.org> 2013-11-03 11:03:02 -0800
commit: 7d68a81a8ed5f49fefb3bd0fa0b9d3835cc7d86e (patch)
tree: f189e5af2716bfb2473ce5ce063ddddebe30f646 /python/pyspark/context.py
parent: a48d88d206fae348720ab077a624b3c57293374f (diff)
download: spark-7d68a81a8ed5f49fefb3bd0fa0b9d3835cc7d86e.tar.gz
spark-7d68a81a8ed5f49fefb3bd0fa0b9d3835cc7d86e.tar.bz2
spark-7d68a81a8ed5f49fefb3bd0fa0b9d3835cc7d86e.zip
1 files changed, 5 insertions, 5 deletions
diff --git a/python/pyspark/context.py b/python/pyspark/context.py
index a7ca8bc888..0fec1a6bf6 100644
--- a/python/pyspark/context.py
+++ b/python/pyspark/context.py
@@ -42,7 +42,7 @@ class SparkContext(object):
 
     _gateway = None
     _jvm = None
-    _writeIteratorToPickleFile = None
+    _writeToFile = None
     _takePartition = None
     _next_accum_id = 0
     _active_spark_context = None
@@ -125,8 +125,8 @@ class SparkContext(object):
             if not SparkContext._gateway:
                 SparkContext._gateway = launch_gateway()
                 SparkContext._jvm = SparkContext._gateway.jvm
-                SparkContext._writeIteratorToPickleFile = \
-                    SparkContext._jvm.PythonRDD.writeIteratorToPickleFile
+                SparkContext._writeToFile = \
+                    SparkContext._jvm.PythonRDD.writeToFile
                 SparkContext._takePartition = \
                     SparkContext._jvm.PythonRDD.takePartition
 
@@ -190,8 +190,8 @@ class SparkContext(object):
         for x in c:
             write_with_length(dump_pickle(x), tempFile)
         tempFile.close()
-        readRDDFromPickleFile = self._jvm.PythonRDD.readRDDFromPickleFile
-        jrdd = readRDDFromPickleFile(self._jsc, tempFile.name, numSlices)
+        readRDDFromFile = self._jvm.PythonRDD.readRDDFromFile
+        jrdd = readRDDFromFile(self._jsc, tempFile.name, numSlices)
         return RDD(jrdd, self)
 
     def textFile(self, name, minSplits=None):
author	Josh Rosen <joshrosen@apache.org>	2013-11-03 11:03:02 -0800
committer	Josh Rosen <joshrosen@apache.org>	2013-11-03 11:03:02 -0800
commit	7d68a81a8ed5f49fefb3bd0fa0b9d3835cc7d86e (patch)
tree	f189e5af2716bfb2473ce5ce063ddddebe30f646 /python/pyspark/context.py
parent	a48d88d206fae348720ab077a624b3c57293374f (diff)
download	spark-7d68a81a8ed5f49fefb3bd0fa0b9d3835cc7d86e.tar.gz spark-7d68a81a8ed5f49fefb3bd0fa0b9d3835cc7d86e.tar.bz2 spark-7d68a81a8ed5f49fefb3bd0fa0b9d3835cc7d86e.zip