建設“雙一流”高校 從基礎平臺全面革新開始
山東大學無論在科研實力還是在教育成果方面,都處于我國高等學府第一階梯,也是此次世界一流大學建設的重點院校,其中數學和化學被評為“雙一流”建設學科。山東大學入選我國“雙一流”建設戰(zhàn)略可謂實至名歸,而其強大的科研實力與堅實的基礎科研平臺建設密不可分。其中高性能計算集群對于山東大學多個學科建設和科研工作推進功不可沒。
傳統(tǒng)高性能計算在氣象、化學、物理等科學研究中應用頗多,但需要用戶具有較高的計算機專業(yè)技能。以氣象專業(yè)的研究生為例,通常學生需要在WRF這樣專業(yè)的氣象應用上進行學術研究,然而WRF是運行于Linux操作系統(tǒng)下,而且均以源代碼方式發(fā)布。
因此,氣象專業(yè)的學生不僅要掌握Linux系統(tǒng)的各種命令并熟練使用,還要學習安裝編譯WRF所需要的各種依賴關系、編譯器、數學庫、并行環(huán)境。具體到每個學生的實踐中,一個這樣的研究工作可能要持續(xù)一年甚至更長時間,并且學生大部分時間并沒有集中在自己的研究工作上。要建設“雙一流”高校,學術科研及學校綜合實力都要上升到新的層次,高性能計算平臺也必須更加易用和高效。
為突破傳統(tǒng)高性能計算平臺的瓶頸,山東大學軟件學院龔斌教授基于十幾年的高性能計算集群的管理、維護經驗,攜手華為以及華為認證ISV聯科集團,基于雙方在高性能計算領域的豐富經驗,同時利用前沿的云計算技術,容器技術、前端展示技術以及移動計算技術,建立創(chuàng)新、高效的公共計算云服務平臺。

高性能遇上云,原本高度復雜的計算科學可以如此簡單
華為公司基于全球的高性能計算的建設經驗,為山東大學公共計算云服務平臺打造模塊化數據中心一體化解決方案,實現機房的快速部署、節(jié)省占地面積、分期投入、降低能耗等優(yōu)勢。
底層的基礎架構平臺采用最新的Intel Xeon SkyLake處理器,將計算節(jié)點、大數據節(jié)點、胖節(jié)點以及人工智能節(jié)點融合起來,計算能力可達每秒384萬億次。存儲系統(tǒng)采用分層存儲架構,根據應用模型對I/O帶寬的需求選擇不同區(qū)域的存儲資源;計算網絡采用Intel Omni-Path架構,最終方案不僅可以提供100Gb網絡帶寬以及微秒級的MPI通訊延遲性能, 并且具有極佳的可擴展性和成本優(yōu)勢等特性。
將高性能計算與云結合起來是山東大學公共計算云服務平臺的最大亮點。新的高性能計算平臺將應用程序和操作系統(tǒng)以及硬件之間的強耦合關系進行解耦,并結合自身研發(fā)的虛擬化技術,提高資源的利用率,快速的將傳統(tǒng)的計算中心改造成智能化的動態(tài)的計算中心。

山東大學公共計算云服務平臺架構
在高效計算平臺之上是云化的服務平臺,山東大學公共計算云服務平臺建成后,學生或老師通過平臺申請高性能計算資源,或者傳統(tǒng)的信息化應用資源,資源申請后根據應用的種類最高效的分配資源,后臺進行計費與應用使用數據的統(tǒng)計。豐富的功能以及高度智能化的設計使得該平臺得到廣泛而深入的應用。
在山東大學公共計算云服務平臺中,人人都是生態(tài)的需求者,同時也是貢獻者。平臺為學校師生預構建好的計算環(huán)境,提供預先應用鏡像和處理的科學領域數據,包括硬件和軟件堆棧,并通過Web方式的交互界面最大限度降低接入門檻。這意味著上文中氣象的研究生可以方便的申請到配置好的系統(tǒng)環(huán)境,甚至已經搭建好的應用環(huán)境。原本需要長期學習準備的時間被壓縮到極致。
此外,高易用性方便用戶參與到平臺的建設過程中,用戶可以向平臺貢獻應用鏡像、應用數據、應用服務,與平臺的建設運營單位一同打造高效計算應用生態(tài)圈。山東大學公共計算云服務平臺未來將成為數據共享、學術交流、教學實踐與校園信息化統(tǒng)一的資源調度平臺。
傳統(tǒng)高性能計算受限于應用的高門檻,使用范圍僅限于氣象、材料、生物科學等理工學科研究,但是如今云上的高性能計算可以被當做一種按需分配的易用資源。未來,高性能計算應用成熟的領域科研工作將更加高效,而歷史、金融等,這些未曾涉足科學計算的領域也將隨著這項新技術的應用,激發(fā)出科學研究的無限可能。
在“雙一流”建設道路上,山東大學承載的是我國高校進入世界前列的使命,在下一個十年乃至更長的時間里,山東大學將為全球經濟、科技等領域貢獻最為前衛(wèi)的理念和技術。而這一切都將隨著其公共計算云服務平臺的不斷發(fā)展和迭代走上一個快速發(fā)展的道路。