教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

TiDB中有哪些組件?【TiDB架構圖解】

更新時間:2022年10月11日17時17分 來源:傳智教育 瀏覽次數:

  TiDB 集群主要包括三個核心組件:TiDB Server,PD Server 和 TiKV Server。此外,還有用于解決用戶復雜 OLAP 需求的 TiSpark 組件和簡化云上部署管理的 TiDB Operator 組件。

TiDB架構

TiDB架構圖解

Spark SQL

  1. TiDB Server

  TiDB Server 負責接收 SQL 請求,處理 SQL 相關的邏輯,并通過 PD 找到存儲計算所需數據的 TiKV 地址,與 TiKV 交互獲取數據,最終返回結果。TiDB Server 是無狀態(tài)的,其本身并不存儲數據,只負責計算,可以無限水平擴展,可以通過負載均衡組件(如LVS、HAProxy 或 F5)對外提供統(tǒng)一的接入地址。

  2. PD Server

  Placement Driver (簡稱 PD) 是整個集群的管理模塊,其主要工作有三個:一是存儲集群的元信息(某個 Key 存儲在哪個 TiKV 節(jié)點);二是對 TiKV 集群進行調度和負載均衡(如數據的遷移、Raft group leader 的遷移等);三是分配全局唯一且遞增的事務 ID。

  PD 通過 Raft 協(xié)議保證數據的安全性。Raft 的 leader server 負責處理所有操作,其余的 PD server 僅用于保證高可用。建議部署奇數個 PD 節(jié)點。

  3. TiKV Server

  TiKV Server 負責存儲數據,從外部看 TiKV 是一個分布式的提供事務的 Key-Value 存儲引擎。存儲數據的基本單位是 Region,每個 Region 負責存儲一個 Key Range(從 StartKey 到 EndKey 的左閉右開區(qū)間)的數據,每個 TiKV 節(jié)點會負責多個 Region。TiKV 使用 Raft 協(xié)議做復制,保持數據的一致性和容災。副本以 Region 為單位進行管理,不同節(jié)點上的多個 Region 構成一個 Raft Group,互為副本。數據在多個 TiKV 之間的負載均衡由 PD 調度,這里也是以 Region 為單位進行調度。

  4. TiSpark

  TiSpark 作為 TiDB 中解決用戶復雜 OLAP 需求的主要組件,將 Spark SQL 直接運行在 TiDB 存儲層上,同時融合 TiKV 分布式集群的優(yōu)勢,并融入大數據社區(qū)生態(tài)。至此,TiDB 可以通過一套系統(tǒng),同時支持 OLTP 與 OLAP,免除用戶數據同步的煩惱。

  5. TiDB Operator

  TiDB Operator 提供在主流云基礎設施(Kubernetes)上部署管理 TiDB 集群的能力。它結合云原生社區(qū)的容器編排最佳實踐與 TiDB 的專業(yè)運維知識,集成一鍵部署、多集群混部、自動運維、故障自愈等能力,極大地降低了用戶使用和管理 TiDB 的門檻與成本。

0 分享到:
和我們在線交談!