一般来说,计算机专业的毕业生会远比统计系的毕业生多,但并不代表python比r的用户多。其实除了计算机、数学、工程等少量专业,绝大多数专业的学生编程能力都不强,一般都用stata/spss/sas等更简单实用的语言,要想让他们从这些语言直接到python,其实是有点跳跃,或许过渡到r是更现实的选择,因此很容易找到很多社会科学、经济、政治、生物的人用R写了各种各样的package,而python还是那几个pandas,numpy等基础包。
我倾向于认为社会的发展方向是分工越来越细,而不是要求人的技术水平越来越全面。懂一些编程对日常工作有没有帮助?肯定有!但为了这点帮助需不需要学习python?99%是不需要,或许R,甚至excel vba就足够了。社会不需要把所有人变成程序员。
至于在纯数据分析领域的R vs python问题,python在大规模数据处理上会有优势,直接点说就是“数据量大于内存”的时候会有优势。现在的内存都是8G、16G的水平,说实话,除了互联网有更大的数据量,很多领域都没有。运算速度大家一样的,Rcpp vs cython,半斤八两;你能并行我也能并行,这些都是一样的。
统计系的人在统计素养的训练上会强一些,但这属于soft skill,计算机专业的人一般认为自己coding这些hard skill强,也顺便推理到自己soft skill也强,这是最大的误区。计算机的人做数据分析,往往偏重于降低误差,比如cross validation之类的,会用比较暴力的方法,对t-stat, p-value, r^2其实概念其实是不懂的,Andrew Ng也没教...或许一个纯计算机背景的team,苦做1年,死劲把误差降低,但一个做统计的人路过一看,你这里犯了个小错误哦,这个东西不是平稳的喔,这个样本不能这么切,等等。。。或许一年的工作就是garbage in garbage out了。。。