官方说明:“刨丁解羊中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。DLL及OCX调用请联系QQ(601069289)。”
很小的绿色中文分词软件,我也是从网上找到的,还是足够日常中一些小场景使用,对不懂程序的同学而言,可能用这样的小软件比去想办法自学程序再去研究一套分词工具出来要干脆。当然更复杂的需求,这个可能也解决不了。