如下是我自己总结的各软件应该如何使用:
1. SAS: 用于处理海量数据,当数据上百万,千万的时候R和 Matlab就已经很难再胜任。个人觉得主要原因在于:Matlab, R 读取的数据都放在内存里,一旦数据过大就会导致处理速度变慢,尤其在笔记本上跑的时候。而SAS读入的数据都存在临时文件夹里,只有在执行语句的时候才把对应的数据调出来,所以内存管理很有效。SAS还有一点很好的地方在于:逻辑库的运用。数据集都是用Table 保存的。我自己在做研究时,最初的原始数据集都偏向用SAS处理。各个变量和数据来源都呈现得很清晰。不过我个人不喜欢用SAS做分析,感觉语言太繁杂,不直接。平时用最多目测就是SQL 功能
2. R:我用R的原因包括:1)涉及字符处理我都用R,感觉比SAS,Matlab方便,尤其是在用数据框结构时,比Matlab 处理得快很多。2)统计测试较全, R的包很方便,做初步测试的时候很便捷。Matlab 的包就很麻烦,的自己手都添加 3)我觉得最重要的还是,R读取的数据格式叫广泛,我有些数据用SAS, Matlab读出来都有问题,不过用R读,效果就很好。
3. Matlab : 如果数据是纯数字类型的,我首选Matlab。做模拟实验,或者数值算法,尤其是蒙特卡洛模拟,它都是首选。例如在做有关衍生品定价方面的研究时,用Matlab 就很方便。
4. Stata: 我觉得做研究的话,Stata的统计分析已经很全了,尤其是做计量经济学。我一般做研究的时候喜欢先用R或者Matlab做测试;等思路基本通顺后,就改用Stata. 目前写的Paper后面的所有表格基本都是用Stata生成的,很方便。
希望以上内容能对各位有所帮助