java使用lucene的demo、包含分词函数、搜索函数
上传时间: 2014-02-12
上传用户:671145514
它是文本分词程序代码的核心算法,可以为语言学者提供强大的分词功能。
上传时间: 2014-01-09
上传用户:731140412
实现中文切词功能,应用lucene.net和中科院的切词算法
上传时间: 2013-12-02
上传用户:lizhen9880
中科院分词 是一款非常不错的分词包 这个网站有毛病
上传时间: 2013-12-22
上传用户:努力努力再努力
基于java的一个分词程序 速度比较快 精确度比较高
上传时间: 2014-08-17
上传用户:龙飞艇
svm(支持向量机)分类算法本质上是二类分类器,实现多类分类的方法一般是将多类分类看作是多个一对多的二类分类器。本程序就是基于svmlight的svm多类分类器实现。对分类感兴趣的用户请参照。配合中文分词(参见我上传的程序),可实现中文多类分本分类。
上传时间: 2014-01-06
上传用户:anng
贝叶斯公式,文本分类,中文分词,在eclipse下打包重新编译通过的,方便实用和开发。
标签: 贝叶斯
上传时间: 2013-12-21
上传用户:thesk123
一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character Language Modeling)、医学文献下载/解析/索引(MEDLINE Download, Parsing and Indexing)、数据库文本挖掘(Database Text Mining)、中文分词(Chinese Word Segmentation)、情感分析(Sentiment Analysis)、语言辨别(Language Identification)等API。
上传时间: 2013-12-04
上传用户:15071087253
该源码用c++编写,实现了中文分词的功能。
上传时间: 2014-01-21
上传用户:wang0123456789
汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。该系统得到了专家的好评,并有多篇论文在国内外发表。
标签: Technology Computing Institute Analysis
上传时间: 2013-12-24
上传用户:ANRAN