[SPARK-6092] [MLLIB] Add RankingMetrics in PySpark/MLlib

Author: Yanbo Liang <ybliang8@gmail.com> Closes #6044 from yanboliang/spark-6092 and squashes the following commits: 726a9b1 [Yanbo Liang] add newRankingMetrics 33f649c [Yanbo Liang] Add RankingMetrics in PySpark/MLlib (cherry picked from commit 042dda3c5c25b5ecb6ae4fd37c85b211b01c187b) Signed-off-by: Xiangrui Meng <meng@databricks.com>
author: Yanbo Liang <ybliang8@gmail.com> 2015-05-11 09:14:20 -0700
committer: Xiangrui Meng <meng@databricks.com> 2015-05-11 09:14:26 -0700
commit: 017f9fa6749d21e0277fe568484679fa5a7a5aa0 (patch)
tree: 0278774faf58b901c8878d44672e1d1b2e83aed6 /mllib/src
parent: da1be15cc6191f077e282a480bdcc2950fd9c5e8 (diff)
download: spark-017f9fa6749d21e0277fe568484679fa5a7a5aa0.tar.gz
spark-017f9fa6749d21e0277fe568484679fa5a7a5aa0.tar.bz2
spark-017f9fa6749d21e0277fe568484679fa5a7a5aa0.zip
1 files changed, 10 insertions, 0 deletions
diff --git a/mllib/src/main/scala/org/apache/spark/mllib/api/python/PythonMLLibAPI.scala b/mllib/src/main/scala/org/apache/spark/mllib/api/python/PythonMLLibAPI.scala
index 8c30ad4b39..f4c4775965 100644
--- a/mllib/src/main/scala/org/apache/spark/mllib/api/python/PythonMLLibAPI.scala
+++ b/mllib/src/main/scala/org/apache/spark/mllib/api/python/PythonMLLibAPI.scala
@@ -32,6 +32,7 @@ import org.apache.spark.api.java.{JavaRDD, JavaSparkContext}
 import org.apache.spark.api.python.SerDeUtil
 import org.apache.spark.mllib.classification._
 import org.apache.spark.mllib.clustering._
+import org.apache.spark.mllib.evaluation.RankingMetrics
 import org.apache.spark.mllib.feature._
 import org.apache.spark.mllib.fpm.{FPGrowth, FPGrowthModel}
 import org.apache.spark.mllib.linalg._
@@ -50,6 +51,7 @@ import org.apache.spark.mllib.tree.model.{DecisionTreeModel, GradientBoostedTree
 import org.apache.spark.mllib.tree.{DecisionTree, GradientBoostedTrees, RandomForest}
 import org.apache.spark.mllib.util.MLUtils
 import org.apache.spark.rdd.RDD
+import org.apache.spark.sql.DataFrame
 import org.apache.spark.storage.StorageLevel
 import org.apache.spark.util.Utils
 
@@ -923,6 +925,14 @@ private[python] class PythonMLLibAPI extends Serializable {
     RG.gammaVectorRDD(jsc.sc, shape, scale, numRows, numCols, parts, s)
   }
 
+  /**
+   * Java stub for the constructor of Python mllib RankingMetrics
+   */
+  def newRankingMetrics(predictionAndLabels: DataFrame): RankingMetrics[Any] = {
+    new RankingMetrics(predictionAndLabels.map(
+      r => (r.getSeq(0).toArray[Any], r.getSeq(1).toArray[Any])))
+  }
+
 
 }
author	Yanbo Liang <ybliang8@gmail.com>	2015-05-11 09:14:20 -0700
committer	Xiangrui Meng <meng@databricks.com>	2015-05-11 09:14:26 -0700
commit	017f9fa6749d21e0277fe568484679fa5a7a5aa0 (patch)
tree	0278774faf58b901c8878d44672e1d1b2e83aed6 /mllib/src
parent	da1be15cc6191f077e282a480bdcc2950fd9c5e8 (diff)
download	spark-017f9fa6749d21e0277fe568484679fa5a7a5aa0.tar.gz spark-017f9fa6749d21e0277fe568484679fa5a7a5aa0.tar.bz2 spark-017f9fa6749d21e0277fe568484679fa5a7a5aa0.zip