《老钱------AI实战训练营的系列课程》= 多个案例学习《文本分类》
文本分类一直是NLP领域的热门应用,常用在舆情分析,文章分类,智能客服等多个场景。本课程以案例驱动出发。结合多个项目实战案例,协助学习者迅速学习文本分类项目。
课程特色:
1.案例驱动:专题技术,完整案例;
2.源码操作:内含完整程序源码和数据集;
3.实战指引:覆盖文本分类四大过程模型;
4.系统学习:一套完整的文本分类建设方法论,迅速学习文本分类的开发过程。包括深度学习方法,语料库方法等
适合人群:
1. 想要从事NLP的在校学生、NLP研发工程师、NLP产品经理,想要转型NLP的IT老兵。
2.具备Python基础,熟悉机器学习的基础理论
3.具备自然语言处理的基础知识
具体课程大纲如下:
1.文本分类概述
1.文本分类的定义与典型应用场景
2.文本分类的难点
3.文本分类的意义
4.文本分类技术实现的一般流程
1.文本预处理
2.文本表示与特征选择
3.构造分类器
4.分类
5.文本分类任务使用的技术有哪些
6.文本分类项目的评价方法
2.基于经典方法的文本分类算法项目实践-贝叶斯搜狗新闻文本分类
1.文本数据载入及清洗
2.把数据集分为训练集和测试集
3.中文分词
4.引入停用词典
5.文本特征提取
6.机器学习建模-贝叶斯原理
7.使用贝叶斯进行建模
8.文本特征提取
9.N-gram模型
10.模型效果测试与总结
3.大规模文本分类网络TextCNN概述
1.什么是TextCNN
2.为什么使用TextCNN
3.TextCNN原理介绍
1.CNN模型回顾
2.TextCNN网络结构
3.TextCNN优缺点
4.如何使用TextCNN
5.TextCNN模型应用场景
6.TextCNN开源实现方案介绍
4.TextCNN项目实践-基于TextCNN完成电影评论分类
1.项目背景
2.IMDB 电影影评数据集介绍
3.准备IMDB 电影影评数据与TextCNN环境
4.IMDB 电影影评数据预处理
5.TextCNN实现文本分类的原理
6.TextCNN模型搭建
7.TextCNN模型参数介绍
8.运行结果分析
9.TextCNN模型参数优化介绍
10.项目总结