结巴中文分词包,使用Python进行编写的,比较好用 支持三种分词模式: - 精确模式,试图将句子最精确地切开,适合文本分析; - 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; - 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
标签: 中文分词
上传时间: 2018-06-04
上传用户:吓人的土豆
完成“快速拼写检查程序”的分析、设计和实现过程。 快速拼写检查程序基本功能说明如下: 1.进行拼写检查的文件以文本文件形式存储于外存上; 2.只检查文件中英文单词的拼写错误; 3.单词是用字母(a…z或A…Z)定义,任一非字母字符作为分隔符; 4.判断单词拼写正误的依据是词典,词典以文本文件形式存放于外存上; 5.词典文件第1行为词典的名称,以后每一行存放一个单词; 6.输出结果以文本文件形式存储,其格式为: 第1行:被拼写检查的文件名 + 词典名 第2行后的每一行: 出错单词 位于第x行 7.合理的GUI,注意GUI界面类与功能类的关系应比较松散。
上传时间: 2014-01-09
上传用户:ggwz258
词法分析的程序。核心函数是一个状态切换的函数 CAjaxParserDlg::Route。状态切换函数解根据一个 DFA 来对输入的文本进行分析。也就是说,如果你做一个新的DFA,就能分析新的词法。 DFA 的初始化在CAjaxParserDlg::OnInitDialog。
标签: CAjaxParserDlg Route 函数 DFA
上传时间: 2014-01-10
上传用户:qilin
Bison 是替代yacc的语法解析器. Bison能生成可以分析文本文件结构的程序.
上传时间: 2013-12-13
上传用户:chenjjer
编写一个文本文件分析程序,读入一个英文文本文件,统计其中单词、数字、标点符号等元素出现的次数,并记录单词总数。 提示:对文件的分析可以使用StreamTokenizer类
上传时间: 2013-12-18
上传用户:czl10052678
PL_0语言编译程序分析文本
上传时间: 2015-02-10
上传用户:it男一枚
在文本下编辑,把需要分析的程序写在zf-infile.txt内,程序的结尾必须以“@”标志符结束,程序结果输出在同目录内,文件名为zf-outfile.txt,此文件为自动生成。
上传时间: 2013-12-26
上传用户:z1191176801
文本编辑分析大师
上传时间: 2014-11-29
上传用户:cazjing
使用面向对象方法完成“快速拼写检查程序”的分析、设计和实现过程。快速拼写检查程序基本要求说明如下: 1.进行拼写检查的文件以文本文件形式存储于外存上;2.只检查文件中英文单词的拼写错误;3.单词是用字母(a…z或A…Z)定义,任一非字母字符作为分隔符;4.判断单词拼写正误的依据是词典,词典以文本文件形式存放于外存上;5.词典文件第1行为词典的名称,以后每一行存放一个单词;6.输出结果以文本文件形式存储,其格式为:第1行:被拼写检查的文件名 + 词典名 第2行后的每一行: 出错单词 位于第x行7.设计一个合理的GUI,注意GUI界面类与功能类的关系应比较松散。
上传时间: 2015-03-11
上传用户:372825274
一个c++de的词法分析此程序可以通过读一个文本文件来进行词法分析
上传时间: 2014-06-30
上传用户:无聊来刷下