[SPARK-2674] [SQL] [PySpark] support datetime type for SchemaRDD

Datetime and time in Python will be converted into java.util.Calendar after serialization, it will be converted into java.sql.Timestamp during inferSchema(). In javaToPython(), Timestamp will be converted into Calendar, then be converted into datetime in Python after pickling. Author: Davies Liu <davies.liu@gmail.com> Closes #1601 from davies/date and squashes the following commits: f0599b0 [Davies Liu] remove tests for sets and tuple in sql, fix list of list c9d607a [Davies Liu] convert datetype for runtime 709d40d [Davies Liu] remove brackets 96db384 [Davies Liu] support datetime type for SchemaRDD
author: Davies Liu <davies.liu@gmail.com> 2014-07-29 12:31:39 -0700
committer: Michael Armbrust <michael@databricks.com> 2014-07-29 12:31:39 -0700
commit: f0d880e288eba97c86dceb1b5edab4f3a935943b (patch)
tree: 90475addac0ecb27d1a26f05ebb52e9628cd97ff /core/src
parent: e3643485de8fdaf5c52b266fead1b13214f29d5e (diff)
download: spark-f0d880e288eba97c86dceb1b5edab4f3a935943b.tar.gz
spark-f0d880e288eba97c86dceb1b5edab4f3a935943b.tar.bz2
spark-f0d880e288eba97c86dceb1b5edab4f3a935943b.zip
1 files changed, 2 insertions, 2 deletions
diff --git a/core/src/main/scala/org/apache/spark/api/python/PythonRDD.scala b/core/src/main/scala/org/apache/spark/api/python/PythonRDD.scala
index d87783efd2..0d8453fb18 100644
--- a/core/src/main/scala/org/apache/spark/api/python/PythonRDD.scala
+++ b/core/src/main/scala/org/apache/spark/api/python/PythonRDD.scala
@@ -550,11 +550,11 @@ private[spark] object PythonRDD extends Logging {
   def pythonToJavaMap(pyRDD: JavaRDD[Array[Byte]]): JavaRDD[Map[String, _]] = {
     pyRDD.rdd.mapPartitions { iter =>
       val unpickle = new Unpickler
-      // TODO: Figure out why flatMap is necessay for pyspark
       iter.flatMap { row =>
         unpickle.loads(row) match {
+          // in case of objects are pickled in batch mode
           case objs: java.util.ArrayList[JMap[String, _] @unchecked] => objs.map(_.toMap)
-          // Incase the partition doesn't have a collection
+          // not in batch mode
           case obj: JMap[String @unchecked, _] => Seq(obj.toMap)
         }
       }
author	Davies Liu <davies.liu@gmail.com>	2014-07-29 12:31:39 -0700
committer	Michael Armbrust <michael@databricks.com>	2014-07-29 12:31:39 -0700
commit	f0d880e288eba97c86dceb1b5edab4f3a935943b (patch)
tree	90475addac0ecb27d1a26f05ebb52e9628cd97ff /core/src
parent	e3643485de8fdaf5c52b266fead1b13214f29d5e (diff)
download	spark-f0d880e288eba97c86dceb1b5edab4f3a935943b.tar.gz spark-f0d880e288eba97c86dceb1b5edab4f3a935943b.tar.bz2 spark-f0d880e288eba97c86dceb1b5edab4f3a935943b.zip