给定带有分词和词性标注信息语料,从中总结单词的词频,并按照出现次数排序输出
资源简介:给定带有分词和词性标注信息语料,从中总结单词的词频,并按照出现次数排序输出
上传时间: 2013-12-25
上传用户:Ants
资源简介:一个集分词、词性标注和格式转换的强大的工具包
上传时间: 2013-12-22
上传用户:ztj182002
资源简介:中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
上传时间: 2014-01-20
上传用户:水口鸿胜电器
资源简介:学习汉语自动分词与词性标注软件的组件化有助于更好的理解中文分词系统
上传时间: 2017-06-03
上传用户:WMC_geophy
资源简介:自动分词与词性标注评测有助于学习NLP,并且理解其更深的含义
上传时间: 2017-06-03
上传用户:2404
资源简介:计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一...
上传时间: 2014-01-02
上传用户:15736969615
资源简介:用于中文分词的算法。包括逆向分词和反向分词
上传时间: 2015-11-09
上传用户:wfl_yy
资源简介:Classifier4J是一个很好的基于java的分类器,里面有Native bayes和KNN等方法的文本分类.另外还 提供了分词和自动摘要等功能
上传时间: 2016-08-14
上传用户:lwwhust
资源简介:本系统实现了分词和倒排索引,分词采用正向最大匹配,
上传时间: 2013-12-17
上传用户:luke5347
资源简介:ICT分词程序接口 用以进行中文文本分词,词性标注。
上传时间: 2016-12-10
上传用户:AbuGe
资源简介:这是一个中科院中文词法分析器,能对输入的文本进行分词,词性标注,未登陆词识别等功能,正确率相当高,很有用哦
上传时间: 2014-01-23
上传用户:xiaoxiang
资源简介:1. 先打开规则库,读入规则集 (可比较两个规则文件rule1.txt 和 rule2.txt的差异) 2. 选择经过分词和词性标注的文件,进行句法分析 3. 分析结果文件与测试文件在同一个目录下,文件后缀名为 .pcfg 4. 分析结束后,同时产生一个新的规则文件,后缀名为.new...
上传时间: 2013-12-28
上传用户:梧桐
资源简介:汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 ...
上传时间: 2013-12-24
上传用户:ANRAN
资源简介:用于中文分词的切分词典,还有词性标注,以这个词典数据库为基础建立文本分类,文本检索或文本过滤可以节省很多时间.很全,强烈推荐!
上传时间: 2015-03-11
上传用户:lijinchuan
资源简介:采用复杂数据结构从文件中生成一个带有拼音和词性信息的词典,用perl语言实现
上传时间: 2013-12-10
上传用户:jennyzai
资源简介:对中文进行分词并对其词性标注;命名实体识别;新词识别;同时支持用户词典
上传时间: 2017-03-22
上传用户:kiklkook
资源简介:基于逆向最大匹配算法的分词及基于HMM模型的词性标注系统,包括了未登录词的识别、数据库的添加等内容。(需要手动修改数据库的路径才可以运行)
上传时间: 2017-06-24
上传用户:从此走出阴霾
资源简介:中文信息处理方面的一个源码。此为一个分词软件,这个分词的算法虽然简单,但是原理和其他相同,是最大概率法分次。功能强大,代码简洁易懂。
上传时间: 2016-01-05
上传用户:hxy200501
资源简介:基于java语言的分词系统,可以标注词性、词频等信息,可用于二次开发
上传时间: 2016-05-13
上传用户:mikesering
资源简介:中文信息处理的分词词库,百度分词词库,用于中文信息处理的词库分析和源程序链接
上传时间: 2016-05-22
上传用户:标点符号
资源简介:实现中文信息处理中的汉语分词的功能,采用了正向最大和逆向最大的分词算法。
上传时间: 2014-12-01
上传用户:ljt101007
资源简介:计算所汉语词法分析系统ICTCLAS.分词正确率高达97.58%(973专家组评测),未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,...
上传时间: 2014-01-09
上传用户:1079836864
资源简介:一个中文分词的实现及演示程序,可用与中文和英文词组的分割.
上传时间: 2015-04-18
上传用户:as275944189
资源简介:对文件夹中的各文件的内容分词后按照词的内容进行统计和组织。
上传时间: 2014-01-16
上传用户:Divine
资源简介:一段关于中文信息分类的分词算法,他实现了信息过滤中的分词,为信息过滤的分类打下基础
上传时间: 2013-12-26
上传用户:zhaoq123
资源简介:基于词典和最大匹配算法的的中文分词组件,达到很好的分词准确率
上传时间: 2015-11-03
上传用户:yuzsu
资源简介:Hieu Xuan Phan & Minh Le Nguyen 利用CRF统计模型写的可用于英文命名实体识别、英文分词的工具(开放源码)。CRF模型最早由Lafferty提出,全名conditional random fields,该模型后来被广泛地应用在语言和图像处理领域,并随之出现了很多的变体。FlexCRF就是...
上传时间: 2014-01-07
上传用户:ggwz258
资源简介:中文信息处理方面的一个源码。此为一个词性标注软件,需要有事先做好的词典的支持。功能强大,代码简洁易懂。
上传时间: 2014-01-10
上传用户:koulian
资源简介:讲述面向信息检索的中文分词程序的PDF文档,
上传时间: 2016-01-13
上传用户:kikye
资源简介:通过隐马尔可夫模型做词性标注,即给定一个句子,得到它的最优词性序列
上传时间: 2016-01-25
上传用户:671145514