elasticsearch分词插件

5、处理Elasticsearch集群状态为yellow历程

Background:公司的es集群有两个Es节点，其中一个机器磁盘不是太大，往往导致Es处于只读状态(当磁盘空间小于等于5%时，Es会自动进入只读状态)。最近公司正好有个闲置的服务器，我准备把Es服务器换成小磁盘空间的(有人可能会问，为什么不多加几个磁盘呢？小公司，我也很无奈)。费了九牛二虎之力，终于更换了经常出问题的服务器。

6、Elasticsearch倒排索引

之前我们已经了解到，Elasticsearch是一个基于Lucene的分布式全文检索引擎，但是Elasticsearch的倒排索引其实就是Lucene的倒排索引。数据检索是ES的一个核心功能，其底层实现也离不开倒排索引。通过倒排索引技术可以提高数据检索的效率，理解倒排索引的原理非常重要。那么什么是倒排索引，我们如何理解它呢？

这样我们就可以按照创建索引库、添加文档、数据检索的顺序来了解倒排索引。首先是创建一个索引库。我们之前已经安装了IK 分词这里，我们创建一个测试索引，它只有一个内容字段。添加文档时，字段的分词 mode为ik_max_word，关键字的分词 mode为ik_smart。不了解分词 device的，请参考Elasticsearch中文版分词device插件。

7、Elasticsearch随笔

匹配具有单个字段的所有文档，具有匹配字段名和值的文档匹配单个字段，这将导致精确匹配。No 分词多个字段匹配某个值，多个条目查询模糊查询。匹配单个字符，*匹配多个字符以查询正则表达式。一个标准的分词 parser提供了一个基于语法的分词 parser，这是一个很好的分词 parser，适用于大多数欧洲语言文档。分词实现Unicode文本分段算法，该算法在UnicodeStandardAnnex#29中指定。

例如:中华人民共和国(PRC)的min _ gram2和max _ gram3。结果:中国，中国人，中国人，中国人，人民，人民共和国，人民共和国，共和国，共和国，共和国。Token_chars接受以下形式:keyword 分词设备的输出与其接收的字符串相同。即no 分词字母类型分词正文为非字母分词。也就是说，它将与其相邻的长度最大的字符定义为单词。

8、 elasticsearch

First Preparation Environment elastic search:是一个实时分布式搜索和分析引擎，主要用于全文搜索、结构化搜索、分析以及三者的混合使用。Lucene是全文检索引擎的架构。ElasticSearchvsSolr总结(1)es基本是开箱即用，很简单。Solr安装有点复杂，可以关注一下(solr6.6教程基础环境构建(一))(2)Solr使用Zookeeper进行分布式管理，而Elasticsearch本身具有分布式协调管理功能。

(4)Solr提供更多官方功能，而Elasticsearch本身更注重核心功能。高级功能由第三方提供插件，例如，图形界面需要kibana友好的支持。(5)Solr查询快，但更新索引慢(即插入和删除慢)，所以用于电子商务等查询多的应用，ES索引快(即查询慢)，即实时查询快，用于facebook、新浪等搜索。

elasticsearch分词插件

最近更新

相关文章

经验最新文章

运维排行榜推荐

经验排行榜精选

经验文章排行榜

热门标签