鄭緯民指出,人工智能計算在海量數(shù)據(jù)、實時響應、極端條件等場景下相較通用計算優(yōu)勢愈發(fā)明顯。預計到2025年,我國人工智能算力總量將超過1800EFlops,AI算力占整個算力的比重超過85%。
“以后的計算機中AI計算機和處理人工智能的計算機將占很大比例,特別是隨著ChatGPT的發(fā)展,算力需求大幅提升,迎來了高速擴張時代。”鄭緯民表示。
在談及AI計算與HPC(高性能計算)的區(qū)別時,鄭緯民指出,HPC通常應用在天氣預報、核聚變模擬、飛行器設計等領域,而AI計算是做分類、回歸、自然語言處理等,二者應用場合不同,運算精度也不一樣。
鄭緯民認為AI算力基礎設施的設計需要遵循計算平衡、網(wǎng)絡平衡、IO子系統(tǒng)平衡的原則。
“傳統(tǒng)的高性能計算機的測試結(jié)果與人工智能需要的性能不完全一致。高性能計算算力測試程序主要使用雙精度浮點數(shù)運算,即64位浮點運算,人工智能訓練以單精度浮點數(shù),即32位浮點數(shù)為主。”在鄭緯民看來,現(xiàn)在要做符合語言模型的訓練,就要考慮半精度平衡性,即設計中主要考慮半精度運營性能,又要注意雙精度運算能力不能過低,所以雙精度與半精度運算性能之比為1:100較好。
“現(xiàn)在很多廠家都已經(jīng)在考慮這三個平衡設計,國內(nèi)也有差不多30個城市在建或者建好了AI超算中心。”據(jù)其預測,HPC+AI+大數(shù)據(jù)中心在未來不超過5年的時間內(nèi)將會融合到一臺計算機中,“既可以做HPC,又可以做AI,也能處理大數(shù)據(jù)”。