展会信息港展会大全

Lucene中文分词组件JE
来源:互联网   发布日期:2011-09-16 09:36:07   浏览:19536次  

导读:Mysoo 网络时代,人人都可以拥有的站内搜索引擎!...

  Lucene中文分词组件JE-Analysis1.4.0 分词效率: 第一次分词需要1-2秒(读取词典),之后速度基本与Lucene自带分词持平。 该组件免费安装使用传播,无限制商业应用,但暂不开源,也不提供任何保证。

  运行环境: Lucene 1.9+

  内存消耗: 30M+

  1.4.0 —— 2006-08-21

  增加词典的动态扩展能力

  1.3.3 —— 2006-07-23

  修正无法多次增加词典的问题

  1.3.2 —— 2006-07-03

  修正细粒度分词错误的问题

  1.3.1 —— 2006-06-23

  修正在某些情况下分词遗漏的问题

  1.3 —— 2006-06-22

  实现了词尾消歧算法中第一层的过滤

  增加日期时间的匹配

  1.2.2 —— 2006-06-13

  完善了中英文噪声词典

  1.2.1 —— 2006-06-10

  修正中文数字成语无法识别的问题

  1.2 —— 2006-06-08

  增加中文数字的匹配(如:二零零六)

  数量词采用“n”作为数字通配符

  优

赞助本站

人工智能实验室
AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港