[SPARK-8207] [SQL] Add math function bin

JIRA: https://issues.apache.org/jira/browse/SPARK-8207 Author: Liang-Chi Hsieh <viirya@gmail.com> Closes #6721 from viirya/expr_bin and squashes the following commits: 07e1c8f [Liang-Chi Hsieh] Remove AbstractUnaryMathExpression and let BIN inherit UnaryExpression. 0677f1a [Liang-Chi Hsieh] For comments. cf62b95 [Liang-Chi Hsieh] Merge remote-tracking branch 'upstream/master' into expr_bin 0cf20f2 [Liang-Chi Hsieh] Merge remote-tracking branch 'upstream/master' into expr_bin dea9c12 [Liang-Chi Hsieh] Merge remote-tracking branch 'upstream/master' into expr_bin d4f4774 [Liang-Chi Hsieh] Add @ignore_unicode_prefix. 7a0196f [Liang-Chi Hsieh] Fix python style. ac2bacd [Liang-Chi Hsieh] Merge remote-tracking branch 'upstream/master' into expr_bin a0a2d0f [Liang-Chi Hsieh] Merge remote-tracking branch 'upstream/master' into expr_bin 4cb764d [Liang-Chi Hsieh] For comments. 0f78682 [Liang-Chi Hsieh] Merge remote-tracking branch 'upstream/master' into expr_bin c0c3197 [Liang-Chi Hsieh] Add bin to FunctionRegistry. 824f761 [Liang-Chi Hsieh] Merge remote-tracking branch 'upstream/master' into expr_bin 50e0c3b [Liang-Chi Hsieh] Add math function bin(a: long): string.
author: Liang-Chi Hsieh <viirya@gmail.com> 2015-06-19 10:09:31 -0700
committer: Davies Liu <davies@databricks.com> 2015-06-19 10:09:31 -0700
commit: 2c59d5c12a0a02702839bfaf631505b8a311c5a9 (patch)
tree: c0ede7dd0a7430000473d1ff3a78cb2da5751bf4 /python/pyspark
parent: 43c7ec6384e51105dedf3a53354b6a3732cc27b2 (diff)
download: spark-2c59d5c12a0a02702839bfaf631505b8a311c5a9.tar.gz
spark-2c59d5c12a0a02702839bfaf631505b8a311c5a9.tar.bz2
spark-2c59d5c12a0a02702839bfaf631505b8a311c5a9.zip
1 files changed, 14 insertions, 0 deletions
diff --git a/python/pyspark/sql/functions.py b/python/pyspark/sql/functions.py
index acdb01d3d3..cfa87aeea1 100644
--- a/python/pyspark/sql/functions.py
+++ b/python/pyspark/sql/functions.py
@@ -35,6 +35,7 @@ from pyspark.sql.column import Column, _to_java_column, _to_seq
 __all__ = [
     'array',
     'approxCountDistinct',
+    'bin',
     'coalesce',
     'countDistinct',
     'explode',
@@ -231,6 +232,19 @@ def approxCountDistinct(col, rsd=None):
     return Column(jc)
 
 
+@ignore_unicode_prefix
+@since(1.5)
+def bin(col):
+    """Returns the string representation of the binary value of the given column.
+
+    >>> df.select(bin(df.age).alias('c')).collect()
+    [Row(c=u'10'), Row(c=u'101')]
+    """
+    sc = SparkContext._active_spark_context
+    jc = sc._jvm.functions.bin(_to_java_column(col))
+    return Column(jc)
+
+
 @since(1.4)
 def coalesce(*cols):
     """Returns the first column that is not null.
author	Liang-Chi Hsieh <viirya@gmail.com>	2015-06-19 10:09:31 -0700
committer	Davies Liu <davies@databricks.com>	2015-06-19 10:09:31 -0700
commit	2c59d5c12a0a02702839bfaf631505b8a311c5a9 (patch)
tree	c0ede7dd0a7430000473d1ff3a78cb2da5751bf4 /python/pyspark
parent	43c7ec6384e51105dedf3a53354b6a3732cc27b2 (diff)
download	spark-2c59d5c12a0a02702839bfaf631505b8a311c5a9.tar.gz spark-2c59d5c12a0a02702839bfaf631505b8a311c5a9.tar.bz2 spark-2c59d5c12a0a02702839bfaf631505b8a311c5a9.zip