用漫畫看懂ElasticSearch分散式存儲原理(四)

  • 2019 年 10 月 6 日
  • 筆記

ElasticSearch自帶存儲,相當於是自己的數據倉庫。在實踐中,一般mysql等資料庫與Elastic自己的庫是不同的庫,在mysql存入數據後,將數據自動與Elastic資料庫進行同步。Elastic的庫採用JSON格式進行存儲,類似於MongoDB資料庫的存儲格式。

ElasticSearch的庫一般只用於搜索、查找使用,單獨存放使用。

Elasticsearch 也是會對數據進行切分,同時每一個分片會保存多個副本,其原因和 HDFS 是一樣的,都是為了保證分散式環境下的高可用。

分析日誌的用處可大了,你想,假如一個分散式系統有 1000 台機器,系統出現故障時,我要看下日誌,還得一台一台登錄上去查看,是不是非常麻煩?

  • 反向索引又叫倒排索引,是根據文章內容中的關鍵字建立索引。
  • 搜索引擎原理就是建立反向索引。
  • Elasticsearch 在 Lucene 的基礎上進行封裝,實現了分散式搜索引擎。
  • Elasticsearch 中的索引、類型和文檔的概念比較重要,類似於 MySQL 中的資料庫、表和行。
  • Elasticsearch 也是 Master-slave 架構,也實現了數據的分片和備份。
  • Elasticsearch 一個典型應用就是 ELK 日誌分析系統。