计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97%以上,未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。该系统得到了专家的好评,并有多篇论文在国内外发表。 计算所汉语词法分析系统ICTCLAS同时还提供一套完整的动态连接库ICTCLAS.dll和相应的概率词典,开发者可以完全忽略汉语词法分析,直接在自己的系统中调用ICTCLAS,ICTCLAS可以根据需要输出多个高概率的结果,输出格式也可以定制,开发者在分词和词性标注的基础上继续上层开发。
上传时间: 2014-01-02
上传用户:15736969615
用 TCP/IP协议里的套接字(Socket)编程接口来实现一个聊天室.
上传时间: 2013-12-14
上传用户:天诚24
使用evc3.0开发的用于windows ce环境的汉字拼音输入发示例程序。内置9000+字汉字字库,40000+词中文词库。压缩包内包括详细使用说明。
上传时间: 2013-12-18
上传用户:xhz1993
条屏控制器的设计的主程序,本例是控制4字,改动几个边界值即可控制任意长个汉字,保证可以实际应用
上传时间: 2015-05-12
上传用户:jichenxi0730
自编的一个遥控码/P0口做4*4键盘扫描,识别.ASM 遥控码和键盘码在串口接8只8字管显示
上传时间: 2013-12-17
上传用户:dancnc
这是一个用51单片机制作的8字显示条屏,里面有源代码和原理图,希望能对大家对LED的学习有所帮助
上传时间: 2013-12-24
上传用户:royzhangsz
创博ARM300例程 S3C44B0X+uCOS 井字棋
上传时间: 2013-12-26
上传用户:qazxsw
简介和源程序ad9850得初始化和控制字的写入,有不当之处望大家谅解。
上传时间: 2015-05-20
上传用户:xyipie
输入:一段任意的程序(字符串)。 输出:相应的属性字序列。 要求:⒈不处理说明部分,但属性字的符号类除了编码外,应包含更多的信息(如运算符的优先级等); ⒉小子集中包含的符号类应有典型性,且尽可能丰富; ⒊为了使用方便和便于阅读,应有帮助信息,说明可以有哪些符号,属性字的结构如何等; 说明;⒈为了直观起见,属性字中的符号值可以是符号本身,而不是助忆符; ⒉符号的种类以及符号的编码是事先规定的,可考虑扩充的可能性。
上传时间: 2014-01-17
上传用户:fhzm5658
玩法: 一開始先下數字 下完25個數字後 再開始圈選數字 先達到5條連線者獲勝 在下數字跟選數字時 按滑鼠右鍵都能無限反悔 當然 電腦部分仍然是兩光兩光的... 還有畫面也是粉差啦...
上传时间: 2014-01-09
上传用户:cazjing