自动分词与词性标注评测有助于学习NLP,并且理解其更深的含义
资源简介:自动分词与词性标注评测有助于学习NLP,并且理解其更深的含义
上传时间: 2017-06-03
上传用户:2404
资源简介:学习汉语自动分词与词性标注软件的组件化有助于更好的理解中文分词系统
上传时间: 2017-06-03
上传用户:WMC_geophy
资源简介:给定带有分词和词性标注信息语料,从中总结单词的词频,并按照出现次数排序输出
上传时间: 2013-12-25
上传用户:Ants
资源简介:一个集分词、词性标注和格式转换的强大的工具包
上传时间: 2013-12-22
上传用户:ztj182002
资源简介:中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
上传时间: 2014-01-20
上传用户:水口鸿胜电器
资源简介:一个关于基于自动分词的企业文档搜索引擎设计与实现的优秀论文
上传时间: 2013-12-26
上传用户:123啊
资源简介:中文单词分词功能,有利于自然语言的学习与发展
上传时间: 2014-01-17
上传用户:gonuiln
资源简介:采用最大概率法的中文自动分词软件,分词准确率达到70 以上。
上传时间: 2014-01-15
上传用户:源码3
资源简介:计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一...
上传时间: 2014-01-02
上传用户:15736969615
资源简介:ICT分词程序接口 用以进行中文文本分词,词性标注。
上传时间: 2016-12-10
上传用户:AbuGe
资源简介:关于中文分词算法基本研究的介绍,综合的介绍了中文自动分词的原理及一般算法。
上传时间: 2014-01-27
上传用户:日光微澜
资源简介:汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 ...
上传时间: 2013-12-24
上传用户:ANRAN
资源简介:这是一个中科院中文词法分析器,能对输入的文本进行分词,词性标注,未登陆词识别等功能,正确率相当高,很有用哦
上传时间: 2014-01-23
上传用户:xiaoxiang
资源简介:庖丁分词模块,对中文分词效果不错,可以好好学习
上传时间: 2014-11-12
上传用户:waitingfy
资源简介:计算所汉语词法分析系统ICTCLAS.分词正确率高达97.58%(973专家组评测),未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,...
上传时间: 2014-01-09
上传用户:1079836864
资源简介:用于中文分词的切分词典,还有词性标注,以这个词典数据库为基础建立文本分类,文本检索或文本过滤可以节省很多时间.很全,强烈推荐!
上传时间: 2015-03-11
上传用户:lijinchuan
资源简介:对中文进行分词并对其词性标注;命名实体识别;新词识别;同时支持用户词典
上传时间: 2017-03-22
上传用户:kiklkook
资源简介:基于逆向最大匹配算法的分词及基于HMM模型的词性标注系统,包括了未登录词的识别、数据库的添加等内容。(需要手动修改数据库的路径才可以运行)
上传时间: 2017-06-24
上传用户:从此走出阴霾
资源简介:最大概率法分词的数据结构与算法,用这样的方法分词可以提高分词中歧义词的辨别率,非常经典啊
上传时间: 2014-01-25
上传用户:whenfly
资源简介:一个中文分词的实现及演示程序,可用与中文和英文词组的分割.
上传时间: 2015-04-18
上传用户:as275944189
资源简介:词性标注与隐马尔可夫模型.ppt,相当好的说明材料。
上传时间: 2013-12-16
上传用户:脚趾头
资源简介:用VB与数据库相连接实现中 文分词的程序,采用了正向 最大匹配算法。
上传时间: 2015-10-31
上传用户:lixinxiang
资源简介:一个可以将进行中文分词后的文档与标准文档进行比较的工具,可以测试分词识别的准确率、召回率等
上传时间: 2015-11-17
上传用户:wanqunsheng
资源简介:基于java语言的分词系统,可以标注词性、词频等信息,可用于二次开发
上传时间: 2016-05-13
上传用户:mikesering
资源简介:中文自动分类分词程序,已经打包成dll,里面有说明
上传时间: 2013-12-08
上传用户:kytqcool
资源简介:Classifier4J是一个很好的基于java的分类器,里面有Native bayes和KNN等方法的文本分类.另外还 提供了分词和自动摘要等功能
上传时间: 2016-08-14
上传用户:lwwhust
资源简介:Web挖掘技术在搜索引擎中的应用与实现 介绍了PageRange , 结构挖掘器 , 页面分析器,中文分词等技术
上传时间: 2016-09-21
上传用户:wweqas
资源简介:KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法 * 主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力 * 主要性能指标: * 分词准确度:90%以上(有待专家的权威评测) * 处理速度: 600KBytes/s
上传时间: 2016-10-14
上传用户:klin3139
资源简介:基于隐马尔科夫模型的分词标注程序,使用PASCAL语言编写
上传时间: 2013-12-23
上传用户:qw12
资源简介:基于词典的分词工具,用与对文本文件的分词
上传时间: 2017-03-15
上传用户:wpwpwlxwlx