3分鐘速讀原著-《elasticsearch實戰-6.2.2》(一)

  • 2019 年 10 月 28 日
  • 筆記

版權聲明:本文為部落客原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接和本聲明。

本文鏈接:https://blog.csdn.net/weixin_42528266/article/details/102744140

基本概念

一.ELK

ELK 是ElasticSearch、Logstash 和 Kibana三個產品的首字母縮寫,是Elastic公司提供的一套完整的日誌收集以及展示的解決方案。

ElasticSearch簡稱ES,它是一個實時的分散式搜索和分析引擎,它可以用於全文搜索,結構化搜索以及分析。它是一個建立在全文搜索引擎 Apache Lucene 基礎上的搜索引擎,使用 Java 語言編寫

Logstash是一個具有實時傳輸能力的數據收集引擎,用來進行數據收集(如:讀取文本文件)、解析,並將數據發送給ES

Kibana為 Elasticsearch 提供了分析和可視化的 Web 平台。它可以在 Elasticsearch 的索引中查找,交互數據,並生成各種維度表格、圖形

二.使用場景
  • 搜索領域: 百度、Google,全文檢索,高亮,搜索推薦等
  • 內容網站: 用戶行為日誌(點擊、瀏覽、收藏、評論) + 社交網路數據,數據分析(將公眾對文章的回饋提交至文章作者),包括網站內容搜索等
  • Stack Overflow(IT技術論壇): 全文檢索,搜索相關問題和答案
  • GitHub(開源程式碼管理), 搜索管理其託管的上千億行程式碼
  • 日誌數據分析: ELK技術棧(Elasticsearch + Logstash + Kibana)對日誌數據進行採集和分析
  • BI系統(Business Intelligence, 商業智慧): 分析某區域最近 3 年的用戶消費額的趨勢、用戶群體的組成結構等
  • 其他應用: 電商、招聘、門戶等網站的內部搜索服務,IT系統(OA、CRM、ERP等)的內部搜索服務、數據分析等
三.ES的核心概念
    1. 集群(Cluster):由一個或多個節點組成, 並通過集群名稱與其他集群進行區分。集群由唯一名稱標識,默認情況下為「 elasticsearch」
    1. 節點(Node):單個 ElasticSearch 實例. 通常一個節點運行在一個隔離的容器或虛擬機中。默認情況下,啟動單個節點將形成一個名為的新單節點集群elasticsearch
    1. 索引(Index):一組文檔的集合
    1. 類型(Type):曾經是索引的邏輯類別/分區,它使您可以在同一索引中存儲不同類型的文檔。在7.X版本中已棄用
    1. 文檔(Document):建立索引的基本資訊單位,JSON格式的數據
四.ES的數據類型
  • 1.核心數據類型
    • 1.1 字元串類型-string(6.X已不再支援)
      • 1.1.1 文本類型-text
      • 1.1.2 關鍵字類型-keyword (備註:這兩種取代了String類型)
    • 1.2 數字類型(8種)
    • 1.3 日期類型-date
    • 1.4 布爾類型-boolean
    • 1.5 二進位類型-binary
    • 1.6 範圍類型-range
  • 2.複雜數據類型
    • 2.1 數組類型-array
    • 2.2 對象類型-object
    • 2.3 嵌套類型-nested
  • 3.地理數據類型
    • 3.1 地理點類型-geo point
    • 3.2 地理形狀類型-geo shape
  • 4.專門數據類型
    • 4.1 IP類型
    • 4.2 電腦數據類型
倒排索引
CRUD
  • GET:查詢
  • POST:新增/更新
  • PUT:新增/更新
  • DELETE:刪除
SpringBoot 整合ES

推薦鏈接:https://www.jianshu.com/p/30aa7e75640c