1,python的码农涉猎Hadoop,首选pyspark
2,开发spark应用,需要知道的几个点:
【1】SQL语句:insert into / overwirte【2】DataFrame的常用API【3】UDF函数【4】Kafka组件使用【5】Avro序列化【6】RDD的坑:谨防嵌套使用
本文共 194 字,大约阅读时间需要 1 分钟。
1,python的码农涉猎Hadoop,首选pyspark
2,开发spark应用,需要知道的几个点:
【1】SQL语句:insert into / overwirte【2】DataFrame的常用API【3】UDF函数【4】Kafka组件使用【5】Avro序列化【6】RDD的坑:谨防嵌套使用
转载于:https://my.oschina.net/cn0512/blog/2962594