虫虫首页| 资源下载| 资源专辑| 精品软件
登录| 注册

ictclas

  • ictclas分词系统

    ictclas分词系统,文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ictclas(Institute of Computing Technology, Chinese Lexical Analysis System)

    标签: ictclas

    上传时间: 2017-02-18

    上传用户:569342831

  • 汉语词法分析系统ictclas(Institute of Computing Technology, Chinese Lexical Analysis System)

    汉语词法分析系统ictclas(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ictclas的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。该系统得到了专家的好评,并有多篇论文在国内外发表。

    标签: Technology Computing Institute Analysis

    上传时间: 2013-12-24

    上传用户:ANRAN

  • ictclas的API进行了包装

    ictclas的API进行了包装,提供了一个LexUtil的工具类,用来简化对ictclas的API的调用。 本项目是netbeans工程格式。

    标签: ictclas API 包装

    上传时间: 2014-08-28

    上传用户:ouyangtongze

  • 含有多个分词算法。毕业设计的时候获得的

    含有多个分词算法。毕业设计的时候获得的,希望对大家在汉字处理中能用的到。 ictclas算法,中科院,对名字识别能力很强。VC开发。 CSharp分词,向前匹配加向后最大匹配,C#开发,容易扩展。 小叮咚分词,由后向前最大匹配,C#开发。 xerdoc分词,基于ictclas的Java版本分词。 文本分词词典,分词的词典,可以提供分词数据源。

    标签: 算法 毕业设计

    上传时间: 2013-12-16

    上传用户:古谷仁美

  • XPDF:把pdf文档转化为TEXT文档的库

    XPDF:把pdf文档转化为TEXT文档的库,如需中文支持,请到官方网站下载中文语言包 HTM2TXT:把HTML文件转化为TEXT文件的库 ictclas:对中文字符串进行分词的库 PS2TXT:把Postscript文件转化为TEXT文件的源码

    标签: XPDF TEXT 文档

    上传时间: 2014-09-03

    上传用户:龙飞艇