用漫画看懂ElasticSearch分布式存储原理(四)
- 2019 年 10 月 6 日
- 笔记
ElasticSearch自带存储,相当于是自己的数据仓库。在实践中,一般mysql等数据库与Elastic自己的库是不同的库,在mysql存入数据后,将数据自动与Elastic数据库进行同步。Elastic的库采用JSON格式进行存储,类似于MongoDB数据库的存储格式。
ElasticSearch的库一般只用于搜索、查找使用,单独存放使用。


Elasticsearch 也是会对数据进行切分,同时每一个分片会保存多个副本,其原因和 HDFS 是一样的,都是为了保证分布式环境下的高可用。








分析日志的用处可大了,你想,假如一个分布式系统有 1000 台机器,系统出现故障时,我要看下日志,还得一台一台登录上去查看,是不是非常麻烦?

- 反向索引又叫倒排索引,是根据文章内容中的关键字建立索引。
- 搜索引擎原理就是建立反向索引。
- Elasticsearch 在 Lucene 的基础上进行封装,实现了分布式搜索引擎。
- Elasticsearch 中的索引、类型和文档的概念比较重要,类似于 MySQL 中的数据库、表和行。
- Elasticsearch 也是 Master-slave 架构,也实现了数据的分片和备份。
- Elasticsearch 一个典型应用就是 ELK 日志分析系统。