Categories
程式開發

大規模業務 Kubernetes 集群託管實踐丨QCon


隨著容器技術的流行,越來越多的公司選擇 Kubernetes 作為他們應用的執行平台,聯想也不例外。在聯想,我們各個業務團隊在 Kubernetes 上運行著不同類型的應用,包括 AI 應用、大數據應用、區塊鏈應用以及在線服務等等。如何為業務團隊提供安全穩定、高效易用的執行環境,以及如何降低業務團隊對 Kubernetes 使用成本成為平台部門面對的一大挑戰。

LKS 是聯想研究院 ECR 實驗室設計的一個 Kubernetes 託管服務。 LKS 使用一個 Kubernetes 集群 Operator 為各個業務團隊提供眾多 Kubernetes 集群,並將業務 Kubernetes 集群的控制面集中託管到一個中心 Kubernetes 集群進行管理。我們對業務 Kubernetes 的控制面容器做了相應的高可用改造,保證業務 Kubernetes 集群的安全穩定。除此之外,LKS 也為 Kubernetes 集群提供智能監控管理、負載均衡、配置管理等進階功能,大幅降低了業務團隊對 Kubernetes 的使用難度。隨著 LKS 支撐 Kubernetes 規模的擴大,LKS 自身架構也不可避免地遇到了一些問題並做了相應的設計改變。在本次分享中,我們將介紹 LKS 的設計架構,以及在 LKS 在運營過程中的一些經驗及思考。

內容大綱

1、業務 Kubernetes 集群會遇到哪些問題;

2、Kubernetes 託管帶來哪些好處;

3、LKS KubeInKube 託管平台架構;

4、Kubernetes Cluster Operator 設計探討;

5、全局 Ingress 如何設計;

6、Prometheus 服務如何讓性能管理更簡單;

7、一些實踐經驗、坑及思考。

聽眾收益

1、Kubernetes Cluster Operator 的設計以及提供高效 Kubernetes 計算引擎的一些注意事項;

2、Kubernetes 服務如何更好地與底層 IaaS 服務交互;

3、業務 Kubernetes 集群更關注哪些問題。