亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

Elasticsearch ik 分詞器安裝&分詞過程

Elasticsearch ik 分词器安装&分词过程

安装 Elasticsearch ik 分词器

插件安装

解压安装

将IK分词器压缩文件解压到elasticsearch安装目录的plugins目录下命名ik目录

#解压analysis-ik文件
[root@elk-node1 plugins]# pwd
/usr/share/elasticsearch/plugins
unzip elasticsearch-analysis-ik-6.8.4.zip -d ik
#删除源压缩文件
rm -rf elasticsearch-analysis-ik-6.8.4.zip

分词过程

analyze: 分析 = 分词过程:字符过滤 - 字符串过滤 - 分词过滤转换
english analyze: 分词过滤器(过滤特殊符号外加量词,the 等等)- 字符处理 - 分词过滤(分词转换,词干转化)
ik analyze: 字符过滤(过滤特殊符号外加量词,的 等【停用词】)- 字符处理 -

安装分词器之后

需要重启Elasticsearch,才能重新加载分词器

GET _analyze?pretty
{
  "analyzer":"ik_smart",
  "text":"中华人民共和国国歌义勇军进行曲"
}
# 中华人民共和国 国歌 义勇军进行曲 (宁缺毋滥)

GET _analyze?pretty
{
  "analyzer":"ik_max_word",
  "text":"中华人民共和国国歌义勇军进行曲"
}
#  贪心
# analyzer 构建时分词
# search_analyzer 搜索时分词,无指定是使用 构建时分词器
# ik_smart 查准率,查询使用;ik_max_word 查全率,数据构建时使用;
# 如果 ik_smart 查询不奏效,使用 ik_max_word, 还不行;就另存一个字段 用 standard 字段

GET _analyze?pretty
{
  "analyzer":"standard",
  "text":"中华人民共和国国歌"
}

大部分情况下,搜索搜不出在于词库不够新

这是去 编辑 Elasticsearch/config/analyze_ik

stopword – 过滤词
main – 需要分出来的词

點擊查看更多內容
TA 點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
全棧工程師
手記
粉絲
154
獲贊與收藏
1427

關注作者,訂閱最新文章

閱讀免費教程

  • 推薦
  • 評論
  • 收藏
  • 共同學習,寫下你的評論
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消