向AI转型的程序员都关注了这个号????????????
机器学习AI算法工程 公众号:datayx
1、预处理
(1)、特征提取
- 对应文件:feature_extraction.py
最后结果:
(2)、结果评价
- 对应文件:tools.py
结果展示
2、基于情感词典的情感极性分析
—— sentiment analysis based on sentiment dict
- 对应文件:classifier.py DictClassifier
使用1:analyse_sentence
analyse_sentence(sentence, runout_filepath=None, print_show=False)
对单个句子进行情感极性分析
- sentence,待分析的句子
- 若runout_filepath指定,则将分析结果写入该文件;
- 若print_show为True,则在控制台输出分析结果。
运行实例:
输出实例:
几种情感分析方法比较
基于词典
- 准确率:准确率较高(80%以上),随着人工工作量的增加,准确率增加
- 优点:易于理解
- 缺点:人工工作量大
基于k_NN
- 准确率:很低(60% - 70%)
- 优点:思想简单、算法简单
- 缺点:准确率低;耗内存;耗时间
基于Bayes
- 准确率:还可以(70% - 80%)
- 优点:简单,高效,运算速度快,扩展性好
- 缺点:准确率不高,达不到实用
基于最大熵
- 准确率:比较高(83%以上)
- 优点:准确率高
- 缺点:训练时间久
基于SVM
- 准确率:最高(85%以上)
- 优点:准确率高
- 缺点:训练耗时
代码 获取:
关注微信公众号 datayx 然后回复 极性 即可获取。
AI项目体验地址 https://loveai.tech
一个实时的、百度外卖评论的细粒度情感分析demo
不断更新资源
深度学习、机器学习、数据分析、python
搜索公众号添加: datayx
机大数据技术与机器学习工程
搜索公众号添加: datanlp
长按图片,识别二维码