自己用Markov模型做的一个整句物笔输入法的原型,提供两种模式,普通模式和无空格分词的模式。可以从文章中学习。
标签: Markov 模型 原型 输入法
上传时间: 2014-09-10
上传用户:星仔
C++一般的输入都不是作为宽字符集处理的,使用C++分词,如果能完成窄字符输入,但按宽字符取子串,基本上分词的问题就解决了
标签: 输入 宽 字符
上传时间: 2013-12-11
上传用户:源弋弋
刚上文机器翻译课,自己写的一个简单的正向最大匹配分词
标签: 机器翻译
上传时间: 2016-12-16
上传用户:woshiayin
编译器中词法分析部分,是基于正则表达式的词法分析,包括了代码,演示PPT,要分析的代码和分词结果
标签: 分 编译器
上传时间: 2013-12-30
上传用户:13160677563
停用词表,可以和词表结合用于分词,适用于任何开发环境。
标签:
上传时间: 2013-12-28
上传用户:Yukiseop
汉化CLucene今天,把CLucene的程序改了一下,可以支持汉字了·1·在vc6编译2·还不支持分词,但支持汉字,
标签: CLucene 汉化
上传时间: 2014-11-26
上传用户:qq21508895
关于中文中词语搭配的三篇论文,利用语义间的信息消解分词中的歧义问题,希望能给研究分词消歧的人一些帮助,谢谢!
标签: 论文
上传时间: 2017-05-11
上传用户:笨小孩
用java语言实现文本聚类,包括聚类前的数据预处理:分词、降维、建立向量空间模型等
标签: java 语言 文本聚类
上传时间: 2014-11-18
上传用户:zhoujunzhen
自己下载一个语料库,根据程序,计算权重,然后对语料库进行分词
上传时间: 2014-01-25
上传用户:zhangliming420
CRF工具包,最新版,windows下使用,已编译好可直接使用。分词,特征选择,机器学习
标签: CRF 工具包
上传时间: 2017-07-23
上传用户:zhengjian