将词库词与词表词进行统计,得到两者相同的部分,再找到完全不同的部分
资源简介:将词库词与词表词进行统计,得到两者相同的部分,再找到完全不同的部分
上传时间: 2015-12-26
上传用户:561596
资源简介:基于词库的中文分词组件,可以直接用于Lucene的索引建立。以及中文搜索。
上传时间: 2016-08-22
上传用户:llandlu
资源简介:是用来将掌上电脑与PC之间进行连接,并将掌上电脑的界面发送到PC上,可以通过PC观看
上传时间: 2014-11-23
上传用户:Miyuki
资源简介:输入一篇英文,程序将对里面每个单词的频率进行统计,从文件输入,而不是从键盘输入.
上传时间: 2013-12-25
上传用户:3到15
资源简介:基于正向最大匹配法的分词。采用hash表技术将一段连续的话用所给词库进行分词输出。
上传时间: 2016-06-08
上传用户:zhengjian
资源简介:...将该字符串变量与停用词表中的所有单词进行比较,若果该词在停用词表中出现过则不对其进行统计,否则在对该词进行词干抽取。 经过以上停用词、词干处理后得到的将是实际进行统计的“单词”(此时的“单词”实际上已经是所有具有相同词干的原是单词的统一...
上传时间: 2016-05-27
上传用户:tfyt
资源简介:python写的gbk分词分句程序 可以使用sogou或者谷歌输入法的词库进行分词
上传时间: 2014-01-13
上传用户:evil
资源简介:中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数!
上传时间: 2017-03-10
上传用户:xauthu
资源简介:海鹰词库编辑器 针对类似于海鹰词库的数据库的编辑器,可对数据库进行重复扫描、比较,从windows系统自带输入法码表转换数据等操作
上传时间: 2014-01-07
上传用户:爺的气质
资源简介:access中文词库,用于中文搜索,建议与lucene联系起来使用
上传时间: 2013-11-28
上传用户:songrui
资源简介:问题重述:有一个内含有大约40万条常用词汇的词库。现给定一篇文章,使用这个词库分析出常用词汇的出现次数,并按出现次数由高到低排序这些词语。 改进算法的思路: 1. 通常一篇文章所包含的词语远少于词库中40万的数量; 2. 数据库建立索引之后,可采用...
上传时间: 2017-02-25
上传用户:busterman
资源简介:在很大的一个词库中寻找所需的单词
上传时间: 2014-01-06
上传用户:love_stanford
资源简介:IMEGEN支持90万词库IMEGEN支持 90万词库 IMEGEN支持90万词库 IMEGEN支持90万词库 IMEGEN支持90万词库
上传时间: 2013-12-17
上传用户:笨小孩
资源简介:一款背单词的小程序,可以自己在自定义词库中加单词,运行环境JCreator
上传时间: 2013-12-17
上传用户:lanwei
资源简介:这是一个词库,包含“日汉”“汉英”。对于做自然语言理解、机器翻译、辅助翻译有基础作用。
上传时间: 2014-07-07
上传用户:三人用菜
资源简介:DDOS源码,若把此源码用词非法用途,与作者无关
上传时间: 2013-12-11
上传用户:离殇
资源简介:中文分词算法。Perl语言编写。wordlist.txt为词库。
上传时间: 2013-12-23
上传用户:小码农lz
资源简介:此程序解决的问题:较好的, 并适应短字符串的中文分词算法.根据词库 发现以换行符分隔的众多标题中的 top N 关键字并以此更新词库.是一个分类分词算法
上传时间: 2014-12-20
上传用户:lxm
资源简介:对文件夹中的各文件的内容分词后按照词的内容进行统计和组织。
上传时间: 2014-01-16
上传用户:Divine
资源简介:自己的一个判断词库的代码.能够很好的去除词库中的相同词汇.并保证词库的相异性
上传时间: 2013-12-15
上传用户:赵云兴
资源简介:这是一个向数据库输入词库的一个小的软件,用了还不错就是还得完善
上传时间: 2014-01-25
上传用户:exxxds
资源简介:字典软件MDICT的词库文件,内容是C的库函数,方便大家查询.MDICT有PC和PPC版本,大家请自己去GOOGLE搜索
上传时间: 2015-11-24
上传用户:star_in_rain
资源简介:自己写的一段分词程序,有2部分 第一个是词库的, 第二个是概略的
上传时间: 2015-12-13
上传用户:lili123
资源简介:词库素材,目前已有10万以上的词汇量,有中英文
上传时间: 2014-01-21
上传用户:yt1993410
资源简介:Java写的一个简单分词词库。效果还不错。
上传时间: 2014-01-08
上传用户:dyctj
资源简介:这是一个词库,对于那些做中文分词的人很有帮助的,是2000年的
上传时间: 2016-04-27
上传用户:wl9454
资源简介:CT工作站具有打印报告、病历管理、图像处理专家词库等功能
上传时间: 2016-04-30
上传用户:lizhen9880
资源简介:这是分词系统的词库,希望能对做分词的朋友有所帮助。
上传时间: 2013-12-19
上传用户:AbuGe
资源简介:中文信息处理的分词词库,百度分词词库,用于中文信息处理的词库分析和源程序链接
上传时间: 2016-05-22
上传用户:标点符号
资源简介:珍藏论文:中文信息学报知网与同义词词林的信息融合研究
上传时间: 2016-06-28
上传用户:aa54