平台工程師的雲原生手冊

瞭解Nutanix如何協助平台團隊簡化基礎架構管理、加速應用程式交付,以及信心十足地擴充Kubernetes環境

準備瞭解更多?

探索 Cloud Native 技術資源中心,以取得技術部落格、操作影片及驗證設計。

第 1 章:
從 DIY 到 IDP 方法

Kubernetes®容器管理只是建立企業級雲端原生平台的其中一環。隨著平台工程的演進,團隊正在重新思考如何提供可擴充、安全且開發人員友善的環境,以及 DIY 是否仍是正確的路徑。

平台工程師為何要超越 DIY Kubernetes?

Kubernetes 是現代基礎架構的基石,但它本身並不足夠。生產就緒的平台也需要網路、儲存、可觀測性和安全性等能力。它還需要處理安全性、基於角色的存取控制 (RBAC),以及其他功能,例如 GitOps、政策管理和服務網狀系統。許多團隊從 DIY 平台開始,針對這些需求拼接開放原始碼工具。一開始是可行的,但隨著群集的增加,整合的挑戰也隨之增加。

平台工程師很快就會發現他們不只需要管理基礎架構,還需要管理開發人員體驗:佈建群集、執行政策、疑難排解管道,以及撲滅漂移。這種負擔會降低速度並增加風險。

許多團隊不想建立平台 - 而是想使用平台。這就是轉向內部開發人員平台 (IDP) 的原因:將複雜性抽象化,為開發人員提供通往生產的黃金之路。透過選擇平台方式,團隊可以將工作重心轉移到高影響力的貢獻上,例如促成對 AI 模型的存取、改善資料管道,以及加速創新。這反映出平台工程的演進,從提供基礎架構到提升開發人員的速度,以及驅動業務影響力。

常見挑戰

  • 平衡速度與穩定性:開發人員需要快速存取環境,而作業團隊必須保護正常運作時間和管理。
  • 分散式系統的故障排除:故障和日誌的數量在節點和群集之間成倍增加,統一的可視性有限。
  • 一致的安全性與合規性:政策執行必須跨環境擴充,而不是臨時應用。
  • CNCF 生態系統的複雜性:隨著數百個專案的快速發展,保持整合的最新性會導致無序擴張和團隊疲勞。
  • 跨供應商擴充:混合與多雲端部署需要一致性,單靠 vanilla Kubernetes 無法達成。

DIY 提供彈性,但在規模上卻會導致堆疊零散和認知負荷增加。

Nutanix 價值:生產就緒的 IDP

Nutanix Kubernetes Platform (NKP)解決方案以完整、開放的企業級平台取代DIY的無序擴張,為雲端原生應用帶來彈性、安全性和第2天運作。無論您的群集在何處運行,都能對群集群組進行標準化管理。

關鍵能力:

  • 開放且完整:全堆疊平台提供在生產中部署和運行容器化應用程式所需的所有元件,還可存取經過驗證的 CNCF 專案的完整目錄,讓您能夠整合符合需求的工具。
  • 自動化部署:在任何環境中自動化 Kubernetes 部署、擴充與升級
  • 統一的可觀察性:利用整合式記錄、監控和警示功能快速排除故障
  • 可行的洞察力:透過 NKP Insights 和 AI Navigator 獲得最佳化建議、疑難排解提示和最佳實作指導。透過提供即時指導、具根源分析功能的異常偵測,以及對話式疑難排解介面,為管理員帶來專家級支援,縮小技術差距。
  • 無縫擴充:使用 Kubernetes Cluster API 進行宣告式擴充與生命週期管理。
  • 純上游 Kubernetes:沒有可能導致鎖定的專屬 API。
  • 跨環境的可攜性:維持一致的作業,隨時隨地執行工作負載。

省略建立和維護客製化工具的複雜性。Nutanix 平台使用純上游 Kubernetes,沒有任何包裝,也沒有任何鎖定。插入最新的雲端原生創新技術,並快速提供價值,讓您的團隊可以專注於創新,而非整合。

NKP 的圖形


瞭解更多資訊:

第 2 章:
規模化車隊管理

隨著組織在團隊、站台和雲端間擴充 Kubernetes,叢集會成倍增加 - 每個叢集都有自己的生命週期、工作負載和政策。這種分散性會導致組態偏移、安全性不一致以及作業開銷增加,因此一致的生命週期管理、工作負載配置、政策執行,以及可觀察性是非常重要的。

常見挑戰

  • 群集間的漂移:由於變更的套用方式不一致,組態會出現偏差。
  • 自動化缺口:腳本和管道在規模擴大時失敗,導致群集不同步。
  • 頻寬和連線問題:遠端和邊緣網站會中斷升級和政策鋪陳。
  • 營運開銷:手動升級、監控和修補功能會在不同環境中倍增。
  • 混合基礎架構:不同的供應商在 API、網路和安全控制方面各有不同。

Nutanix 的價值:全機隊一致性

Nutanix為Kubernetes機群提供單一管理平面,實現集群、供應商和環境的一致性。

關鍵能力:

  • 一鍵式應用程式與組態部署:無需手動步驟,即可將驗證的變更推出至每個群集。
  • 持續調節的 GitOps:NKP 以 Flux CD 為基礎,即使在低連線性或邊緣環境中,也能確保配置的一致性。
  • 不可變更的基礎架構: NKP 中的 Cluster API 不會變更即時基礎架構,而是會取代資源以強制執行所需狀態,從而消除漂移並提高可靠性。在資料中心、邊緣和雲端的每個群集上推出經過驗證的變更,無需手動進行。
  • 完全整合的 CNCF 工具: 包含生產就緒的可觀察性、政策與安全專案。
  • 內建 Air-Gapped 支援:車隊可在受限制或斷開連線的環境中安全執行,並提供完整的生命週期管理。

Nutanix可為Kubernetes機群提供單一管理平面,讓您輕鬆推出已驗證的變更、強制執行政策,並維持跨供應商的可視性。結果是一個彈性的平台,在資料中心、邊緣和雲端都有一致的作業和無縫的體驗。

詳情請見:

第 3 章:
在邊緣執行 Kubernetes

傳統的 IoT 模型是針對遙測和集中式分析而建立,但在現今的邊緣環境中卻有不足。在製造業、零售業及遠端作業等產業中,企業需要管理數百或數千個分散式站台,而這些站台的連線通常並不可靠。這些地點需要輕量、自主且能在資料產生的地方處理資料的基礎架構。

常見挑戰

  • 傳統的 IoT 堆疊:專為資料收集而建立,而非即時處理或人工智慧工作負載。
  • 不可靠的連線:偏遠地點通常在網際網路存取有限或無網際網路存取的情況下運作。
  • 營運開銷:管理多個地點的基礎結構會增加複雜性。
  • 資源限制:邊緣站點的運算、儲存和電力有限。
  • 安全性與法規遵循:分散式環境擴大了攻擊面。

Nutanix 的價值:全堆疊平台

Nutanix為邊緣環境提供完整的解決方案,將基礎架構、Kubernetes協調和應用程式生命週期管理整合在單一平台中。

關鍵能力:

  • 彈性邊緣基礎架構:精巧、為邊緣環境最佳化的叢集,可部署於裸機或虛擬化環境中運行。
  • 斷線作業:NKP 專為間歇性或無網路連線的情境而設計,並在隔離環境中提供完整的生命週期管理支援。
  • 集中式機群管理:使用工作區和專案等內建 NKP 功能,從單一控制平面管理所有邊緣群集。
  • 基於 GitOps 的應用程式交付:使用專案直接從 Git 套件庫部署應用程式,確保不同網站的一致性。
  • 彈性的叢集配置:自訂控制平面和工作站節點大小,以符合網站限制 (1、3 或 5 節點控制平面)。
  • 精簡應用程式堆疊:內建可觀察性、政策及生命週期工具,針對邊緣使用個案進行最佳化。

Nutanix可為Kubernetes機群提供單一視窗,讓您輕鬆推出已驗證的變更、強制執行政策,並維持跨供應商的可視性。帶來一個彈性的平台,在資料中心、邊緣和雲端都有一致的作業和無縫的體驗。

第 4 章:
安全性與合規性

隨著 Kubernetes 環境在群集與團隊之間擴展,強制執行一致的安全性與合規性變得非常重要。企業必須管理多租用權、隔離工作負載,並確保影像傳輸的安全性,尤其是在受管制的產業和分散式環境中。

常見挑戰

  • 不一致的安全政策:叢集間不同的組態會導致執行缺口。
  • 手動憑證管理:靜態機密和憑證增加了作業開銷和風險。
  • 多租用的複雜性:很難在不同環境中安全地隔離工作負載和使用者。
  • 安全的影像傳送:確保可信來源和弱點掃描通常需要手動進行。
  • 合規要求:在不同環境中符合 FIPS 140-2 等標準需要整合工具。

Nutanix 的價值:全堆疊平台

Nutanix包含全面的安全功能,可在集群、用戶和工作負載之間強制執行一致性,同時簡化合規性和存取管理。

關鍵能力:

  • 端對端安全性:基於角色的存取控制 (RBAC)、加密、FIPS 140-2 支援,以及整合式法規遵循工具,為 Kubernetes 工作負載提供安全的環境。
  • 集中式驗證:開箱即用的整合式 SSO,針對所有 NKP 管理和連接的群集提供聯合驗證。
  • 靈活的身分整合:將現有的企業識別供應商與 NKP 無縫連接。
  • 無憑證存取:直接在瀏覽器中顯示 kubectl 登入資訊 - 省去手動憑證處理。
  • 雲端原生網路:由 CNCF 專案 Cilium 和 Calico 所提供的高度可擴充與安全的網路。
  • Pod 層級防火牆:使用 Kubernetes 網路政策來控制哪些 Pod 和服務可以彼此存取。

Nutanix可在Kubernetes集群中實現一致的安全性和合規性--簡化從邊緣到核心再到雲端的存取控制、工作負載隔離和監管協調。

詳情請見:

第 5 章:
資料保護與管理

隨著 Kubernetes 的應用範圍擴大到有狀態的工作負載,資料成為平台策略的核心。有狀態的工作負載帶來新的複雜性,例如:需要持久性儲存、合規性和災難復原。雖然 Container Storage Interface (CSI) 驅動程式可標準化儲存的配置方式,但卻無法解決企業級資料保護、行動性或治理的問題。平台工程師現在面臨的挑戰是如何在混合與多雲環境中管理資料,並將其視為首要考量。

常見挑戰

  • 有限的 CSI 範圍:CSI 可處理儲存配置,但缺乏內建的資料保護和 DR 功能。
  • 零散的工具:將備份、DR 和遷移的多個解決方案拼接在一起會增加複雜性。
  • 合規壓力:法規要求資料零遺失,並嚴格控制資料儲存的地點與方式。
  • 多叢集環境:跨叢集和雲端管理資料需要一致的政策和工具。
  • 開發人員的摩擦:複雜的資料工作流程會減慢自助服務和平台工程的速度。

Nutanix 價值:適用於 Kubernetes 的企業級資料服務

Nutanix利用企業級資料保護和管理功能擴展CSI,在集群和雲端提供以應用程式為中心、政策驅動的服務。就像 Kubernetes 一樣,所有的資料服務都被設計為分散式且能毫不費力地擴充。

關鍵能力:

  • 適用於Kubernetes的企業級儲存Nutanix Unified Storage為有狀態應用程式提供整合式持久性儲存,包括支援區塊、檔案和物件儲存。其擴充架構與 Kubernetes 應用程式的建立與執行方式一致,可確保在群集間進行簡化的擴充。
  • 分層資料服務:使用Nutanix Data Services (NDK),支援同步及非同步複製、備份及還原,並提供彈性的RPO/RTO選項。
  • 以應用程式為中心的管理:使用政策式複製和快照工具,保護整個應用程式命名空間及其相關資料和 Kubernetes 物件。
  • 自助服務工具:宣告式 CRD 驅動介面可讓開發人員管理資料工作流程,而不會造成認知負荷。
  • 合規政策:跨邊緣、雲端和內部環境強制執行儲存和保護政策。
  • 多角色支援:IT 管理員和平台工程師使用 Prism Central 和 kubectl 等熟悉的工具來管理基礎架構和資料。
  • 工作負載移動性:跨叢集和提供商遷移有狀態的應用程式,以處理升級、重新平衡或雲端轉換。
  • 同級產品中最佳的整合:使用 Velero 等 CNCF 專案進行備份與還原,並支援物件儲存與混合雲端目標。
  • 適用於Kubernetes的資料庫管理Nutanix Database Services (NDB)可為 Kubernetes 環境中執行的資料庫自動進行佈建、修補和保護。

Nutanix可為Kubernetes提供可靠、可擴展的資料保護與管理,以統一、以應用程式為中心的方式,縮短CSI與企業需求之間的距離。

詳情請見:

第 6 章:
隔離部署

Kubernetes 是專為雲原生環境所設計,但許多企業和政府組織都是在斷線、受限或高度安全的網路中運作。這些空中封鎖的環境常見於國防、製造和遠端作業,因此需要能夠獨立於網際網路運作,同時維持安全性、一致性和作業效率的平台。

常見挑戰

  • 有限的網路:頻寬限制、高延遲和封包遺失會破壞作業。
  • 隔離網路:無法存取網際網路,需要堡壘主機或 DMZ 進行更新。
  • 受限制的網路:嚴格的安全政策、目的地過濾和代理要求。
  • 雲端原生預設:大多數容器工具假設永遠連線至公共登錄。
  • 營運開銷:手動設定和分散的工具造成風險和複雜性。

Nutanix 的價值:Air-Gapped First 架構

Nutanix Kubernetes平台可在斷開的環境中安全自主地運行,提供完整的Kubernetes堆疊,並集成了安全、登錄和生命週期工具。

關鍵能力:

  • Air-Gapped First 設計:從安裝到生命週期管理,都可以離線完成。
  • Uber Bundle:單一離線捆綁,包含容器影像和圖表,以佈建叢集。
  • 內建註冊表支援:從應用程式目錄部署 Harbor 註冊表,以便在本機託管和管理容器影像。
  • 代理和離線支援:使用現有的代理伺服器,或使用離線套件直接從本機註冊處安裝。
  • 軍事級的 DevSecOps
    • 預先掃描的版本和安裝套件,可進行安全、有效的部署
    • SSO 和集中式 RBAC 可提供統一的存取控制
    • 多租用支援可安全隔離工作負載
    • VPC 整合與網路政策可提供精細的流量控制
    • 加密通訊以保護傳輸中的資料
    • 政策強制執行與異常偵測,可主動提供安全性與合規性

NKP 的結構化捆包、內建登錄器及嚴格的隔離測試,可讓您在最嚴峻的環境中快速成功部署。透過自動化和明確的指示,即使是複雜的設定也能可靠地部署,讓 Kubernetes 能夠在任何需要的地方,安全且大規模地執行。

第 7 章:
混合雲 Kubernetes

隨著企業在多種環境中採用 Kubernetes,許多企業發現他們在 AWS (EKS)、Azure (AKS) 和 Google Cloud (GKE) 等不同的公有雲中管理叢集。雖然這些管理服務功能強大,但它們的設計是在各自的生態系統中運作,因此難以維持跨平台運作的一致性、可見性和治理。

常見挑戰

  • 零散的工具:每個雲端供應商都有自己的主控台、API 和運作模式。
  • 不一致的安全性與政策:不同環境的管理方式各異,增加風險。
  • 營運開銷:管理多個堆疊會增加複雜性和成本。
  • 能見度有限:難以追蹤雲端的使用量、效能與成本。
  • 孤立的團隊:不同的環境通常會導致工作重複和工作流程不一致。

Nutanix 的價值:跨雲端統一 Kubernetes

Nutanix Kubernetes Platform在雲原生服務與企業需求之間架起了一座橋樑,為內部部署、公共雲和邊緣環境提供一致的Kubernetes體驗。

關鍵能力:

  • 集中化管理:從單一主控台跨雲端部署、升級及監控叢集。
  • 雲端原生相容性:與 AWS、Azure 及 GCP 的服務整合,讓團隊可以在已使用的服務上進行建置。
  • 統一工具:一套工具和工作流程橫跨所有環境,減少學習曲線和重複。
  • 成本與資源可見性:深入瞭解應用程式層級的成本,並全面掌握基礎結構的使用情況。
  • 政策一致性:在不同環境中統一執行管理與自動化。
  • 營運效率:簡化生命週期管理並降低人工成本。
  • 適用於 On-Prem 部署的全架構基礎架構:管理 Kubernetes、虛擬機器、儲存、網路、安全與協調的單一平台,可簡化設定並降低第 2 天的作業複雜度

Nutanix 可在各種環境中實現一致、政策驅動的 Kubernetes 體驗。透過集中化控制、整合式工具以及成本與效能的可視性,無論您的工作負載在何處執行,團隊都能簡化作業、降低風險並加速交付。

詳情請見:

第 8 章:
加快開發人員的速度

開發人員的生產力是企業成功的關鍵驅動力,但在許多組織中,開發人員花在基礎架構上的時間可能多於編寫程式碼的時間。從佈建環境到管理相依性,開發與作業之間的摩擦會降低交付速度。平台工程旨在為開發人員提供簡化的自助式服務體驗,讓程式碼能夠快速、有信心地從開發轉移到 QA 再到生產,從而消除這些障礙。

常見挑戰

  • 交接緩慢:開發、品保與生產環境之間的手動流程會延遲發行。
  • 工具過多:開發人員必須跨環境學習和維護多種工具。
  • 缺乏自動化:基礎結構的佈建與更新通常需要票據或自訂腳本。
  • 不一致的環境:階段之間的差異會導致錯誤和重工。
  • 合規開銷:安全與政策執行通常是被動及手動的。

Nutanix 價值:高速平台工程

Nutanix提供全堆疊的Kubernetes平台,可簡化基礎設施、整合現有的CI/CD管道,並賦予開發人員自助服務功能。

關鍵能力:

  • CI/CD 整合:NKP 可與現有管道搭配使用,因此團隊無需圍繞專屬 API 重建工作流程。
  • 開發人員自助服務:工作區和專案可讓開發人員獨立部署和管理應用程式。
  • 全套平台:包含企業應用程式所需的一切,包括基礎架構、資料服務、網路及業務連續性。
  • 內建保護機制:OPA Gatekeeper 政策可確保合規性,而不會減慢工作流程。
  • 可觀察性與自動化:整合式記錄、監控和警示功能可簡化故障排除和發行驗證。

Nutanix透過提供安全的自助式Kubernetes體驗,協助平台團隊加快開發速度。有了自動化、一致性和全堆疊整合,開發人員就能專注於建立應用程式,而不是管理基礎架構,同時操作人員也能維持跨環境的控制和可靠性。

準備瞭解更多?

探索 Cloud Native 技術資源中心,以取得技術部落格、操作影片及驗證設計。

©2025 Nutanix, Inc.保留所有權利。Nutanix、Nutanix 標誌和本文件所提及的所有 Nutanix 產品及服務名稱,均屬於 Nutanix 公司在美國和其他國家的註冊商標或商標。Kubernetes ® 是 Linux Foundation 在美國和其他國家的註冊商標。本文提及的所有其他品牌名稱均僅供識別參考,並且可能為其各自擁有者所屬商標。