中科院ICTCLAS工具
原创
©著作权归作者所有:来自51CTO博客作者isping的原创作品,请联系作者获取转载授权,否则将追究法律责任
中科院的ICTCLAS工具是目前国内有名的中文分词工具,分词准确率很高且具有词性标注的功能,在ICTCLAS的官方网站上可以下到最新的免费版供研究使用。前段时间搞情感分类时用了一下,效果不错,不过好像分词结果中没有去掉停用词,如果想去掉停用词的话得自己写个过滤程序,不过这也简单。用了一下,给这个工具的评价很高,可以说简单易用,可以处理整个文件的,也可以处理内存里一段话,可以自定义词典,而且具有C++,C#,JINI等接口。
使用的时候,最简单的方法是只需要把Data文件夹、Configure.xml,ictclas30.h,ICTCLAS30.lib,ICTCLAS30.dll和你的调用该接口的源文件放在同一个文件夹下面即可以。
在调用文件中加入头文件include "ictclas30.h"及#pragma comment(lib,"ICTCLAS30.lib")。
上一篇:C++模板

提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
最高等级,首批通过!文心快码通过中国信通院可信AI智能编码工具评估
最高等级,首批通过!文心快码通过中国信通院可信AI智能编码工具评估
百度 混合云 数据安全 文心快码 智能编程助手 -
中科院实习(9)
子那都是很简单的模型,所以感觉不难。用Spin表达一个实用的模型
工作 qq 建模 内存溢出 搜索 -
中科院实习(8)
转移到人大的朋友这边来了,又是一个新环境,早上自然又醒的很早了。这里没有农
工作 文档 电话 重传 文件系统 -
中科院实习(3)
依然8:00到达实验室,依然是马老师早早到了,和他聊了几句,关于我住哪里的问题,另外还送了我几颗荔枝...
linux 汇编 情感 文档 工具 -
中科院实习(7)
今天是到北京的第八天。昨夜,风雨大作。今天傍晚,蓝天白云,西边万里祥光,东边泛着青色辉泽。真可谓天朗气清。这清爽的日子
文档 工作 金山 生活 Word -
学习中科院薛景瑄C++c++ c语言 数据 虚函数 派生类