[SPARK-5868][SQL] Fix python UDFs in HiveContext and checks in SQLContext

Author: Michael Armbrust <michael@databricks.com> Closes #4657 from marmbrus/pythonUdfs and squashes the following commits: a7823a8 [Michael Armbrust] [SPARK-5868][SQL] Fix python UDFs in HiveContext and checks in SQLContext
author: Michael Armbrust <michael@databricks.com> 2015-02-17 13:23:45 -0800
committer: Michael Armbrust <michael@databricks.com> 2015-02-17 13:23:45 -0800
commit: de4836f8f12c36c1b350cef288a75b5e59155735 (patch)
tree: 14b2a5d381c4b399bd6c549d0cb329d464d2bd87 /sql
parent: 9d281fa56022800dc008a3de233fec44379a2bd7 (diff)
download: spark-de4836f8f12c36c1b350cef288a75b5e59155735.tar.gz
spark-de4836f8f12c36c1b350cef288a75b5e59155735.tar.bz2
spark-de4836f8f12c36c1b350cef288a75b5e59155735.zip
2 files changed, 5 insertions, 1 deletions
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/SQLContext.scala b/sql/core/src/main/scala/org/apache/spark/sql/SQLContext.scala
index 31afa0eb59..709b350144 100644
--- a/sql/core/src/main/scala/org/apache/spark/sql/SQLContext.scala
+++ b/sql/core/src/main/scala/org/apache/spark/sql/SQLContext.scala
@@ -113,6 +113,7 @@ class SQLContext(@transient val sparkContext: SparkContext)
   protected[sql] lazy val analyzer: Analyzer =
     new Analyzer(catalog, functionRegistry, caseSensitive = true) {
       override val extendedResolutionRules =
+        ExtractPythonUdfs ::
         sources.PreWriteCheck(catalog) ::
         sources.PreInsertCastAndRename ::
         Nil
@@ -1059,7 +1060,7 @@ class SQLContext(@transient val sparkContext: SparkContext)
   @DeveloperApi
   protected[sql] class QueryExecution(val logical: LogicalPlan) {
 
-    lazy val analyzed: LogicalPlan = ExtractPythonUdfs(analyzer(logical))
+    lazy val analyzed: LogicalPlan = analyzer(logical)
     lazy val withCachedData: LogicalPlan = cacheManager.useCachedData(analyzed)
     lazy val optimizedPlan: LogicalPlan = optimizer(withCachedData)
 
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/pythonUdfs.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/pythonUdfs.scala
index 3a2f8d75da..69de4d168a 100644
--- a/sql/core/src/main/scala/org/apache/spark/sql/execution/pythonUdfs.scala
+++ b/sql/core/src/main/scala/org/apache/spark/sql/execution/pythonUdfs.scala
@@ -205,6 +205,9 @@ case class EvaluatePython(
   extends logical.UnaryNode {
 
   def output = child.output :+ resultAttribute
+
+  // References should not include the produced attribute.
+  override def references = udf.references
 }
 
 /**
author	Michael Armbrust <michael@databricks.com>	2015-02-17 13:23:45 -0800
committer	Michael Armbrust <michael@databricks.com>	2015-02-17 13:23:45 -0800
commit	de4836f8f12c36c1b350cef288a75b5e59155735 (patch)
tree	14b2a5d381c4b399bd6c549d0cb329d464d2bd87 /sql
parent	9d281fa56022800dc008a3de233fec44379a2bd7 (diff)
download	spark-de4836f8f12c36c1b350cef288a75b5e59155735.tar.gz spark-de4836f8f12c36c1b350cef288a75b5e59155735.tar.bz2 spark-de4836f8f12c36c1b350cef288a75b5e59155735.zip