Python最热,PyTorch增速是TF的13倍:2019机器学习工具调查来了

2019年,做数据分析和机器学习,大家都喜欢什么样的工具?著名的数据分析社区KDnuggets发布调查,给出了最新结果。

乾明 发自 凹非寺

量子位 报道 | 公众号 QbitAI

2019年,做数据分析和机器学习,大家都喜欢什么样的工具?

著名的数据分析社区KDnuggets发布调查,给出了最新结果:

Python持续领跑;2019年有近半用户使用过深度学习工具;PyTorch增长速度是Tensorflow的13倍……

近20年来,KDnuggets每年都会进行一次调查,来研究数据分析和机器学习领域各个工具的使用情况,已然成为观测这一行业变化与趋势的重要参考依据。

Python依旧最热,R语言持续下降

首先,他们给出的是总榜。将数据分析和机器学习领域所有的工具,包括编程语言、框架等放在一起比较:

Python使用比例为65.8%,与2018和2017年相比持续增长。

排名第二的是名为RapidMiner数据分析软件平台,使用比例为51.2%,与2018年相比,略有下降。

R语言再次下降,回落到46.6%。但与2018年相比,下降速度已经有所放缓。

被Salesforce花费157亿美元重金收购的Tableau,排名第十,使用比例为22.1%。

在这个总榜中,深度学习框架Tensorflow(31.7%)和Keras(26.6%)等也都现身,不过增速与2018年相比,都有放缓。

虽然Pytorch没有出现在这个榜单中,但增速已不容小觑。

Pytorch势头凶猛

哪种工具增速最快?调查给出的结果是BigML,同比增长了199%;其次是Julia,增长150%。

对于机器学习领域来说,最值得注意的是PyTorch,增长达到76%。

这一增长速度是什么概念呢?比较一下便知道。

调查显示,2019年,有近一半(49.8%)被调查者都用过深度学习工具。

最热的是Tensorflow,但其增长速度仅为5.8%,PyTorch排在第三,占比11.3%,但增速是达到了75.5%,是Tensorflow的13倍。

相比之下,如DeepLearning4J(-25.6%)、Caffe(-58.3%)等工具,都出现了大幅度下降。

Spark是大数据工具王者

在大数据分析领域,Apache Spark(21.0%)最热,但与2018年相比,还是出现了下降(-2.3%)。

Hadoop: Open Source Tools(12.1%)虽然位于第二,但其依旧保持着10%以上的增速(10.2%)。

编程语言,排名前五只有Python在涨

最后,只看数据分析和机器学习领域中使用到的编程语言的话,排名前五的编程语言中,除了Python有0.2%的增长,其他的几种语言,比如R语言(-4.0%)、SQL语言(-17.2%)、Java(-17.7%)、Unix shell/awk(-13.4%)等都在下降。

相比之下,Julia(150.4%)、Perl(25.2%)、Lisp(46.1%)等语言都在快速增长。

关于这项调查

这项调查中,普通的参与者平均选择了6.1种不同的工具。

其中,有180名参与者只选择了一种工具。这种情况下,KDnuggets判定其不能代表在数据分析/机器学习领域工作的人们,因此将这些选择删除了。

调查链接:

https://www.kdnuggets.com/2019/05/poll-top-data-science-machine-learning-platforms.html

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ’ᴗ’ ի 追踪AI技术和产品新动态

版权所有,未经授权不得以任何形式转载及使用,违者必究。