|
本帖最后由 镇坛道德标杆 于 2018-6-7 09:26 编辑
这个支持库我也用不上,就是写支持库制作教程的时候拿来当例子的,有更多需要的请自行完善。(例如实际上支持 UTF-8 , 我偷懒直接传的文本型所以...)
Friso 来源: https://github.com/lionsoul2014/friso
Friso 是使用 c 语言开发的一款开源的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,源码无需修改就能在各种平台下编译使用,加载完 20 万的词条,内存占用稳定为 14.5M.
同时支持对 UTF-8/GBK 编码的切分...
三种切分模式:
简易模式:FMM 算法,适合速度要求场合。
复杂模式- MMSEG 四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。
(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.6.1版本开始)
本地的,效果还行, 主要是词典可以自定义, 比如“精易”自定义进去就可以识别到了:
Friso.zip
(1.42 MB, 下载次数: 517)
|
评分
-
查看全部评分
本帖被以下淘专辑推荐:
- · 奇技淫巧|主题: 207, 订阅: 47
- · 希望能用到|主题: 982, 订阅: 10
- · 好友轨迹|主题: 327, 订阅: 7
|