
在2022中國算力大會主論壇上,中國工程院院士、中國互聯網協會咨詢委員會主任鄔賀銓詳細闡述了對數據中心“數學”與“算術”的思考。他解釋道,“數學”指的是研究數據的科學,“算術”是研究算力的技術。
在以算為主還是以存為主方面,鄔賀銓表示,人工智能驅動算力需求快速增長,基于GPU等構建的人工智能智算中心適于訓練數據導出模型,訓練出數學模型后,深度神經網絡并不需要調度非常多的參數,降低了對算力的需求,基于CPU的通用算力的IDC適用于在已知數學模型下的計算任務。因此他表示,人工智能智算中心主要任務是算,IDC互聯網數據中心主要任務是存。
在三類算力比例方面,鄔賀銓表示,在基礎算力、智能算力和超算三個算力里,美國分別占全球35%、15%、30%,而中國分別占27%、26%和20%,美國是基礎算力為主,中國智能算力的能力遠超美國。中國的超算和智能算力基本以政府為主建設,基礎算力以運營商和互聯網企業為主。
在冷數據與熱數據方面,鄔賀銓表示,數據從大的方面分為冷數據和熱數據,熱數據主要指需要實時計算的數據,相比之下冷數據的計算需求非常態化。東西部分別適合處理熱和冷數據,東數西算實際是東數西存。
在存算分離與存內計算方面,鄔賀銓表示,存算分離可采用開放存儲體系和磁帶存儲介質,存儲器可同時服務多個服務器,池化存儲支持多云,提高利用率,降低成本能耗,可用于對冷數據處理;存內計算適于對熱數據處理,例如自動駕駛可以在車內同時完成存與算。
在封閉系統與開放系統存儲方面,鄔賀銓表示,開放系統存儲實現存算分離,存儲容量為多服務器共享,以池化方式支持多云應用。不同存儲架構適應不同任務,可按照任務來軟件定義存儲。
在PUE與IT能效方面,鄔賀銓表示,在IDC的IT系統能耗中,服務器約占到50%,存儲系統占35%,網絡通信設備占15%,大部分電能是用于維持服務器的狀態,只有6%~12%用于計算。因此他建議,要減低能耗,對冷數據處理建議用磁帶代替磁盤,100PB存儲成本10年可下降73%;對熱數據用閃存代替磁盤,但目前成本比較高。另外,還有通過數據預處理改進能效,去掉一些無效值、空格和缺失的及果實的數據。
在數據可信性與災備保護方面,鄔賀銓表示,災備是數據中心剛性需求,美國數據保護占存儲投資1/3,全球平均是27.4%,而中國僅7.8%,尤其異地備份的比例更低,所以災備的能力是不足的,所以這點上我們還是要改進,同時,究竟是備份數據還是備份算力,這是值得研究的問題。
此外,在談到東數西算時,鄔賀銓表示,東數西算使算力設施的布局超越了數據中心樞紐的范疇,東部與西部互為冷熱數據的配對方面,要有合適的比例。同時,同一數據中心樞紐或集群內部也有很多比例需要優化。
“關于數據中心的‘數學’和‘算術’,還有很多需要深入研究的內容,我們要善于從實踐中學習創新。”鄔賀銓最后表示。
中國信息安全
一顆小胡椒
信息安全與通信保密雜志社
安全牛
看雪學苑
黑客技術和網絡安全
看雪學苑
黑白之道
紅數位
安全圈
關鍵基礎設施安全應急響應中心
中國信息安全