企業云計算平臺高可用包括以下方面:
平臺高可用:平臺高可用是指計算平臺本身的高可用,能夠不間斷地為用戶提供計算產品的自助操作,如門戶網站訪問、云主機購買、開機、關機、云硬盤掛載等。
虛擬機高可用:虛擬機高可用是指當虛擬機操作系統異常宕機、虛擬化QEMU-KVM進程被物理機操作系統異常終止時,計算平臺會自動發現該現象并在當前物理機或另外可用的物理機上重新啟動該虛擬機。虛擬機上的應用通常會配置為隨系統開機自啟動,來適應這種虛擬機異常會被計算平臺重新調度的機制。由于虛擬機高可用機制的存在,應用間接具備了快速恢復的能力。虛擬機高可用主要由計算平臺結合監控來實現。監控對象包括虛擬機的網絡、虛擬機的虛擬化進程、虛擬機的磁盤使用活動等。
避免單點故障:可部署跨可用區跨地域的多節點結合負載均衡技術實現同城災備、異地災備,做到自動故障切換。
物理機高可用:物理機高可用是指當物理機由于一些突發的、不可預知的原因發生異常宕機時,計算平臺會自動發現該現象并將該物理機上面的所有虛擬機在另外可用的物理機上面重新啟動。這些原因包括硬件故障、驅動故障、系統故障等。物理機高可用相比虛擬機高可用,本質區別在于控制粒度。物理機高可用機制觸發時,直接重新調度其上的所有虛擬機,不需要每個虛擬機單獨去發現調度,提高了調度效率。
應用的高可用性:從平臺角度,提供服務治理(服務降級、限流),容錯自愈的能力,提高服務可用性;提供系統監控(CPU、內存、磁盤),鏈路監控,日志監控等能力,便于故障追蹤、自動預警;提供數據分片、讀寫分離等手段有效應對大規模數據量,實現數據庫的無縫擴容。
分布式架構下的可伸縮設計:既支持基于服務器硬件能力升配/降配的垂直伸縮,也支持服務器數量增減的水平伸縮。