目录

1. 什么时候和如何使用R?

2. 什么时候和如何使用Python?

3. R的优点

4. R的优点亦或是不足

5. R的不足

6. Python的优点

7.Python的优点亦或是缺点:可视化

8.Python的缺点


python可以做数据分析 python做数据分析有哪些缺点_数据分析

图片来源:https://www.datacamp.com/tutorial/r-or-python-for-data-analysis

为帮助开发者小伙伴快速学习快速提高,我开辟了《新手上路常见问答》栏目,将大家的问题汇集起来,希望能给大家一些快速导引,避免给自己挖坑,少走弯路。

关于R和Python在数据科学的应用,今天我们来做一下比较。

1. 什么时候和如何使用R?

如果数据分析任务需要对各个服务器进行独立计算或分析,建议使用R。它非常适合研究和探索性工作,几乎可以用于任何类型的数据分析,因为大量的软件包和易于使用的测试通常可以提供快速启动和运行所需的工具。 R也能在大数据解决方案中应用。

R提供了以下热门软件包:

dplyr,plyr和data.table用来轻松操作包,

stringr处理字符串,

zoo用于正常和不规律的时间序列,

ggvis,lattice和ggplot2可视化数据,

caret用于机器学习

2. 什么时候和如何使用Python?

当数据分析任务需要与Web应用程序集成或者统计代码需要合并到生产数据库中时,可以使用Python。作为一个完全成熟的编程语言,它是实现生产使用算法的好工具。

利用NumPy / SciPy(科学计算)和pandas(数据处理)包,Python可用于数据分析,matplotlib可以用来画图,scikit-learn是机器学习的应用包。

3. R的优点

  • R有很好的可视化工具包

可视化数据通常比原始数字更有效,也更易被理解。可视化软件包ggplot2,ggvis,googleVis和rCharts都有很好的功能。

  • R有较好的生态系统

R拥有丰富的很前沿的包生态系统和活跃的社区。可在CRAN,BioConductor和Github下载R包,可以通过Rdocumentation搜索所有R包。

  • R是数据科学的通用语言

R由统计学家开发。他们可以通过R代码和软件包来交流想法和概念,不一定需要计算机科学背景才能开始。此外,R在学术界之外越来越多地被采用。

4. R的优点亦或是不足

R的出现,帮助了统计学家,但是增加了计算机的运行时间。虽然由于编写代码不足,R的运行速度很慢,但是有很多包可以提高R的性能,如pqR,renjin和fastR,Riposte等等。

5. R的不足

R学习起来不是很容易,特别地,如果从GUI进行统计分析会非常困难。如果对R不熟悉,即使查找包也可能很耗时。

6. Python的优点

  • 可以使用IPython笔记本轻松使用Python和数据。

可以轻松地与同事共享笔记本,而无需安装任何程序,可以大大减少组织代码、输出和笔记文件的开销,可以提高工作效率。

  • Python是一种简单直观的通用语言

Python是一种简单直观的通用语言。学习起来很容易,也提高了开发程序的效率。

此外,Python测试框架是一个内置易使用的入门测试框架,可以进行良好的测试覆盖,代码的重用性和可靠性能得到保障。

7.Python的优点亦或是缺点:可视化

Python有一些很好的可视化库,例如Seaborn,Bokeh和Pygal。此外,与R相比,Python的可视化通常更复杂,展示结果也并不理想。

8.Python的缺点

Python是R的挑战者。它不提供数百种必需R包的替代方法。

做数据分析时,究竟用R还是Python呢,根据以上的比较,大家应该会有一些判断了吧。