首页 > 实用文文章详情

elasticsearch进行分词测试

elasticsearch进行分词测试

elasticsearch进⾏分词测试1，打开kibana:

GET /scddb/_analyze

{

"text": "蓝瘦⾹菇",

"analyzer": "ik_max_word" //ik_smart

}

测试分词效果如下，不是很理想:

{

"tokens" : [

{

"token" : "蓝",

"start_offset" : 0,

"end_offset" : 1,

"type" : "CN_CHAR",

"position" : 0

},

{蓝瘦香菇是什么意思

"token" : "瘦",

"start_offset" : 1,

"end_offset" : 2,

"type" : "CN_CHAR",

"position" : 1

},

{

"token" : "⾹菇",

"start_offset" : 2,

"end_offset" : 4,

"type" : "CN_WORD",

"position" : 2

}

]

}

添加⾃定义词库：

参考这⾥添加⾃定义IK词库：

重启：service elasticsearch restart

再测试：

{

"tokens" : [

{

"token" : "蓝瘦⾹菇",

"start_offset" : 0,

"end_offset" : 4,

"type" : "CN_WORD",

"position" : 0

}

]

}

本文发布于:2025-01-12 08:53:35，感谢您对本站的认可！

本文链接:https://www.wujiajia.com/read/503740.html

版权声明:本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。

添加测试分词词库定义香菇意思

上一篇：今日emo文案
下一篇： reintegration跨文化四阶段

发布评论取消回复

评论列表（有 0 条评论）

实时天气 2025-01-10 14:37:22发布

北京

温度：-8℃~3℃
北风

明天

阴转多云
2 西南风
后天

阴转多云
4 西南风
大后天

阴
5 西风

热门文章