利用最大匹配法进行汉语句子的分词 最大匹配算法是最常用的分词算法,简单实用正确率可达到80%以上
上传时间: 2013-12-02
上传用户:徐孺
最大概率分词法,这种分词算法能够较好的解决汉语分词中的歧义问题,但分词效率比最大匹配分词算法要低
上传时间: 2015-03-17
上传用户:569342831
最大概率法分词的数据结构与算法,用这样的方法分词可以提高分词中歧义词的辨别率,非常经典啊
上传时间: 2014-01-25
上传用户:whenfly
东大的一个分词程序。RuleForPn.dat,segment.dat,segrule.dat是分词动态库要使用的资源文件. userdict.dat是用户词典. CipSegSDK.dll,CipSegSDK.lib是动态库的文件. CipSegDll.h是头文件,供调用使用.
标签: dat RuleForPn CipSegSDK userdict
上传时间: 2015-04-02
上传用户:LIKE
这是一个基于Java的分词、N-gram统计、分段 、分句等功能的程序,支持多种语言
上传时间: 2013-12-20
上传用户:金宜
含有多个分词算法。毕业设计的时候获得的,希望对大家在汉字处理中能用的到。 ICTCLAS算法,中科院,对名字识别能力很强。VC开发。 CSharp分词,向前匹配加向后最大匹配,C#开发,容易扩展。 小叮咚分词,由后向前最大匹配,C#开发。 xerdoc分词,基于ICTCLAS的Java版本分词。 文本分词词典,分词的词典,可以提供分词数据源。
上传时间: 2013-12-16
上传用户:古谷仁美
中科院的分词动态连接库,不用我说了哈,在国内是大名顶顶哈
上传时间: 2014-01-22
上传用户:wangzhen1990
一套J2EE框架代码(struts+spring+hibernate),参照appfuse结构,解决更实际的问题.包括中文,分页等等.
标签: hibernate appfuse struts spring
上传时间: 2014-01-05
上传用户:zhuyibin
基于朴素贝叶斯算法实现的中文文本分类程序。可以对中文文本进行分类识别,使用时先对分类器进行训练,然后进行识别。该Beta版本仅支持对3类文本进行分类,使用简单的中文分词方法,本程序尚不具备实用性,用于算法研究和改进。
上传时间: 2013-12-22
上传用户:huql11633
java的分词操作的jar文件,很不错的
上传时间: 2013-12-14
上传用户:zhangjinzj