「我是中國人」,ChineseTokenizer會將之分割為五個中文字:「我、是、中、國、人」,CJKTokenizer則會將之分割為「我是、是中、中國、國人」四個二節的詞。前者的問題是沒有考慮中文詞語的問題,如搜尋「國中」一樣搜尋到「我是中國人」。後者的問題則是制做了大量沒意義的詞如「是中」「國人」,讓索引沒必要地增大、降低搜尋效率。
标签:
上传时间: 2015-12-18
上传用户:stvnash
精通MFC程序 设计,第十六章源码,MFC多视,实现窗口分割,适合初学者。
标签: MFC 程序
上传时间: 2013-12-29
上传用户:15736969615
这是一个汇编应用的词法语法分析器,词法和语法分析封装在一个类CFenXi中, 程序在Visual C++6.0下调试通过. 程序采用单文档设计,利用了分割窗体技术
标签: 汇编 分析器 词法语法
上传时间: 2014-08-20
上传用户:c12228
您的大名: Email必须和注册会员时的Email相同 您的EMail: 文件: 最大100M,不要分割文件,名字不能太长 请用英文名,尽量和原工程文件名相同 只支持.rar, .zip, .gz文件后缀名 源码类别
标签: Email EMail 100M
上传时间: 2015-12-29
上传用户:凤临西北
视频监控方向,视频对象分割及跟踪方法研究
标签: 视频监控 方向
上传时间: 2014-01-01
上传用户:变形金刚
简单示例介绍DropDownList的高级用法,主要是级联、分割字符串等,值得参考。
标签: DropDownList
上传时间: 2014-01-16
上传用户:集美慧
一些图片!最大100M,不要分割文件,名字不能太长
标签: 100M
上传时间: 2013-12-22
上传用户:yyyyyyyyyy
小程序,关于语言的,最大100M,不要分割文件,名字不能太长
标签: 程序
上传时间: 2013-12-19
上传用户:wendy15
浏览程序,最大100M,不要分割文件,名字不能太长
上传时间: 2014-01-22
上传用户:hakim
这是师兄的优秀毕业论文,是关于快速立体匹配的,是基于图像分割的,希望对需要的朋友有所帮助
标签: 毕业论文
上传时间: 2016-01-29
上传用户:zuozuo1215