[SPARK-3443][MLLIB] update default values of tree:

Adjust the default values of decision tree, based on the memory requirement discussed in https://github.com/apache/spark/pull/2125 : 1. maxMemoryInMB: 128 -> 256 2. maxBins: 100 -> 32 3. maxDepth: 4 -> 5 (in some example code) jkbradley Author: Xiangrui Meng <meng@databricks.com> Closes #2322 from mengxr/tree-defaults and squashes the following commits: cda453a [Xiangrui Meng] fix tests 5900445 [Xiangrui Meng] update comments 8c81831 [Xiangrui Meng] update default values of tree:
author: Xiangrui Meng <meng@databricks.com> 2014-09-08 18:59:57 -0700
committer: Xiangrui Meng <meng@databricks.com> 2014-09-08 18:59:57 -0700
commit: 50a4fa774a0e8a17d7743b33ce8941bf4041144d (patch)
tree: 18089ba49e1450cf1b76238c9b435883f7003474 /examples/src/main
parent: 7db53391f1b349d1f49844197b34f94806f5e336 (diff)
download: spark-50a4fa774a0e8a17d7743b33ce8941bf4041144d.tar.gz
spark-50a4fa774a0e8a17d7743b33ce8941bf4041144d.tar.bz2
spark-50a4fa774a0e8a17d7743b33ce8941bf4041144d.zip
2 files changed, 3 insertions, 3 deletions
diff --git a/examples/src/main/java/org/apache/spark/examples/mllib/JavaDecisionTree.java b/examples/src/main/java/org/apache/spark/examples/mllib/JavaDecisionTree.java
index e4468e8bf1..1f82e3f4cb 100644
--- a/examples/src/main/java/org/apache/spark/examples/mllib/JavaDecisionTree.java
+++ b/examples/src/main/java/org/apache/spark/examples/mllib/JavaDecisionTree.java
@@ -63,7 +63,7 @@ public final class JavaDecisionTree {
     HashMap<Integer, Integer> categoricalFeaturesInfo = new HashMap<Integer, Integer>();
     String impurity = "gini";
     Integer maxDepth = 5;
-    Integer maxBins = 100;
+    Integer maxBins = 32;
 
     // Train a DecisionTree model for classification.
     final DecisionTreeModel model = DecisionTree.trainClassifier(data, numClasses,
diff --git a/examples/src/main/scala/org/apache/spark/examples/mllib/DecisionTreeRunner.scala b/examples/src/main/scala/org/apache/spark/examples/mllib/DecisionTreeRunner.scala
index cf3d2cca81..72c3ab475b 100644
--- a/examples/src/main/scala/org/apache/spark/examples/mllib/DecisionTreeRunner.scala
+++ b/examples/src/main/scala/org/apache/spark/examples/mllib/DecisionTreeRunner.scala
@@ -52,9 +52,9 @@ object DecisionTreeRunner {
       input: String = null,
       dataFormat: String = "libsvm",
       algo: Algo = Classification,
-      maxDepth: Int = 4,
+      maxDepth: Int = 5,
       impurity: ImpurityType = Gini,
-      maxBins: Int = 100,
+      maxBins: Int = 32,
       fracTest: Double = 0.2)
 
   def main(args: Array[String]) {
author	Xiangrui Meng <meng@databricks.com>	2014-09-08 18:59:57 -0700
committer	Xiangrui Meng <meng@databricks.com>	2014-09-08 18:59:57 -0700
commit	50a4fa774a0e8a17d7743b33ce8941bf4041144d (patch)
tree	18089ba49e1450cf1b76238c9b435883f7003474 /examples/src/main
parent	7db53391f1b349d1f49844197b34f94806f5e336 (diff)
download	spark-50a4fa774a0e8a17d7743b33ce8941bf4041144d.tar.gz spark-50a4fa774a0e8a17d7743b33ce8941bf4041144d.tar.bz2 spark-50a4fa774a0e8a17d7743b33ce8941bf4041144d.zip