模块1 Python数据分析概述
1.1 数据分析简介
1.1.1 什么是数据分析
1.1.2 数据分析的范畴
1.2 数据分析的流程
1.2.1 需求分析
1.2.2 数据抽取
1.2.3 数据预处理
1.2.4 数据分析与建模
1.2.5 模型评估
1.2.6 最终部署
1.3 Python和数据分析
1.3.1 为什么选用Python
1.3.2 Python数据分析常用类库
1.4 案例:Python数据分析集成开发环境的部署
小结
习题1
模块2 Python语言基础
2.1 Python概述
2.1.1 Python的特点
2.1.2 Python应用的广泛性
2.1.3 开始使用Python
2.2 输入与输出
2.2.1 数据的输入
2.2.2 数据的输出
2.3 Python数据类型
2.3.1 标识符与变量
2.3.2 运算符与表达式
2.3.3 Python序列
2.4 Python流程控制
2.4.1 条件分支
2.4.2 循环结构
2.5 案例:青年歌手歌曲大奖赛评分
小结
习题2
模块3 NumPy计算基础
3.1 NumPy数组对象
3.1.1 NumPy中的N维数组
3.1.2 NumPy的ndarray对象基础
3.2 创建数组对象
3.2.1 数组属性
3.2.2 数组创建
3.2.3 数组数据类型
3.3 数组对象的操作
3.3.1 索引与切片
3.3.2 变换数组的形态
3.3.3 数组的运算
3.3.4 NumPy矩阵
3.4 利用NumPy进行统计分析
3.4.1 排序
3.4.2 清洗数据
3.4.3 统计函数
3.5 案例:图书销售价格统计分析
小结
习题3
模块4 pandas数据处理
4.1 pandas简介
4.1.1 什么是pandas
4.1.2 pandas的安装方法
4.1.3 pandas中的数据结构
4.2 数据准备
4.2.1 数据导入
4.2.2 数据导出
4.3 数据处理
4.3.1 数据清洗
4.3.2 数据抽取
4.3.3 排名索引
4.3.4 数据合并
4.3.5 数据计算
4.3.6 数据分组
4.3.7 日期处理
4.4 数据分析
4.4.1 基本统计
4.4.2 分组分析
4.4.3 分布分析
4.4.4 交叉分析
4.4.5 结构分析
4.4.6 相关分析
4.5 案例:个人贷款数据分析
小结
习题4
模块5 Matplotlib实现数据可视化
5.1 Matplotlib基础
5.1.1 pyplot基础语法
5.1.2 设置图形属性
5.2 Matplotlib数据可视化
5.2.1 散点图
5.2.2 线形图
5.2.3 直方图
5.2.4 条状图
5.2.5 饼图
5.2.6箱线图
5.3 案例:人口数据分析
小结
习题5
模块6 网络爬虫基础
6.1 网页数据的组织形式
6.1.1 HTML
6.1.2 XML
6.2 利用urllib获取数据
6.2.1 利用urllib处理HTTP协议
6.2.2 利用urllib爬取网络数据
6.3 利用BeautifulSoup4解析HTML文档
6.3.1 BeautifulSoup4中的对象
6.3.2 遍历文档树
6.4 案例:爬取豆瓣排名Top 100电影信息
小结
习题6
参考文献