Background:公司的es集群有两个Es节点,其中一个机器磁盘不是太大,往往导致Es处于只读状态(当磁盘空间小于等于5%时,Es会自动进入只读状态)。最近公司正好有个闲置的服务器,我准备把Es服务器换成小磁盘空间的(有人可能会问,为什么不多加几个磁盘呢?小公司,我也很无奈)。费了九牛二虎之力,终于更换了经常出问题的服务器。
6、Elasticsearch倒排索引之前我们已经了解到,Elasticsearch是一个基于Lucene的分布式全文检索引擎,但是Elasticsearch的倒排索引其实就是Lucene的倒排索引。数据检索是ES的一个核心功能,其底层实现也离不开倒排索引。通过倒排索引技术可以提高数据检索的效率,理解倒排索引的原理非常重要。那么什么是倒排索引,我们如何理解它呢?
这样我们就可以按照创建索引库、添加文档、数据检索的顺序来了解倒排索引。首先是创建一个索引库。我们之前已经安装了IK 分词这里,我们创建一个测试索引,它只有一个内容字段。添加文档时,字段的分词 mode为ik_max_word,关键字的分词 mode为ik_smart。不了解分词 device的,请参考Elasticsearch中文版分词device插件。
7、Elasticsearch随笔匹配具有单个字段的所有文档,具有匹配字段名和值的文档匹配单个字段,这将导致精确匹配。No 分词多个字段匹配某个值,多个条目查询模糊查询。匹配单个字符,*匹配多个字符以查询正则表达式。一个标准的分词 parser提供了一个基于语法的分词 parser,这是一个很好的分词 parser,适用于大多数欧洲语言文档。分词实现Unicode文本分段算法,该算法在UnicodeStandardAnnex#29中指定。
例如:中华人民共和国(PRC)的min _ gram2和max _ gram3。结果:中国,中国人,中国人,中国人,人民,人民共和国,人民共和国,共和国,共和国,共和国。Token_chars接受以下形式:keyword 分词设备的输出与其接收的字符串相同。即no 分词字母类型分词正文为非字母分词。也就是说,它将与其相邻的长度最大的字符定义为单词。
8、 elasticsearchFirst Preparation Environment elastic search:是一个实时分布式搜索和分析引擎,主要用于全文搜索、结构化搜索、分析以及三者的混合使用。Lucene是全文检索引擎的架构。ElasticSearchvsSolr总结(1)es基本是开箱即用,很简单。Solr安装有点复杂,可以关注一下(solr6.6教程基础环境构建(一))(2)Solr使用Zookeeper进行分布式管理,而Elasticsearch本身具有分布式协调管理功能。
(4)Solr提供更多官方功能,而Elasticsearch本身更注重核心功能。高级功能由第三方提供插件,例如,图形界面需要kibana友好的支持。(5)Solr查询快,但更新索引慢(即插入和删除慢),所以用于电子商务等查询多的应用,ES索引快(即查询慢),即实时查询快,用于facebook、新浪等搜索。