提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


看书标记——关于R语言

  • chapter 1



【R语言 商务数据分析实战1】


chapter 1

R语言数据分析概述

常用数据操作packages
dplyr:快速数据操作和数据查询
data.table:使用短小灵活的语法操作数据
reshape2:灵活的数据排列与聚合处理
tidyr:方便对数据进行整理、传播和收集
lubridate:时间数据的处理
stringi/sringr:基于ICU的字符串处理方案

常用绘图packages
ggplot2:强大的绘图统计和计算图形系统的实现
lattice:一个强大优雅的高级数据可视化系统
rChats:交互式JS绘图
plotly:使用plot.ly进行交互式ggplot2和Shiny绘图

常用Wed技术和服务packages
Shiny:创建简单的Web交互应用
Rcurl:常规的网络客户端接口(HTTP/FTP等)
httr:使用友好的Rcrul封装
XML:生成和解析XML的工具
rvest:使用CSSSelect和XPath语法进行简单的Web信息抓取

高性能与并行计算packages
parallel:R语言的并行计算平台
SparkR:R连接Spark的程序包
Rcpp:在R中提供高效的API,使得函数更快执行
compiler:使用JIT提高R代码速度
foreach:使用并行来执行循环

常用数据库管理packages
RODBC:使用ODBC连接数据库
RJDBC:使用JDBC连接数据库
DBI:在R和数据库管理系统之间定义一个公共接口
RMySQL:R与MySQL的接口
ROracle:R与Oracle的接口
RPostgreSQL:R与PostgreSQL的接口
RHive:R与Apache Hive的接口

数据挖掘和机器学习packages
arules:关联规则和频繁项集
C50:C5.0决策树和基于规则的模型
caret:分类和回归训练
forecast:基于ARIMA、ETS、STLM、TBATS和神经网络的时间序列预测
glmnet:lasso和elastic net正则化广义线性模型
nnet:神经网络预测模型
rattle:图形界面式的数据挖掘工具箱(还需要RGtk2包)
tree:分类和回归树

自然语言处理packages
jiebaR:中文分词Python
tm:一个全面的文本挖掘框架(对中文不友好)
zipfR:词频分布统计模型
NLP:基本自然语言处理功能
topicmodels:LDA主题模型
word2vec:将词字符转换为词向量

金融packages
quantmod:定量金融模型和交易框架
TTR:与技术交易规则相关的数据和功能函数
xts:可扩展的时间序列
tseries:金融时间序列分析和计算
fAssets:金融资产分析和建模

语言接口packages
rJave、jvmr、rJython、rPython、R.matlab、rpy2