在云計算大發展的時代,大規模計算應用如何應對高密度運算所帶來的能耗問題?
日前,正在致力于建設“北京工業云”的北京市計算中心與英偉達(NVIDIA)公司召開新聞發布會,宣布將共建“Tesla GPU計算應用測試中心”,來為用戶Tesla GPU應用的測試環境和支持服務。其中,北京市計算中心將提供相關的軟硬件測試環境和測試技術支持,而英偉達將提供相關CUDA開發咨詢與技術支持。值得一提的是,該測試中心不僅面向北京市計算中心,其他用戶也可以通過預約進行測試。
GPU計算是近幾年逐漸流行開來的一種新的計算模式。這種計算模式讓GPU的工作不再僅僅限于圖像處理,而是與CPU聯合共同完成通用計算以提高整體性能。其中,應用程序的串行部分在CPU上運行,而計算任務繁重的部分(特別是浮點運算和向量運算)則讓GPU來完成。與傳統的計算架構相比,GPU+CPU的模式可以大幅提高計算機性能,降低能源消耗,還能節省空間,同時還能降低計算機的復雜性。
Tesla系列GPU 是英偉達專門為高性能計算而設計的GPU產品,在應用程序上最高可實現10倍性能提升,非常適合用于地震處理、生物化學模擬、天氣與氣候建模、信號處理、計算金融、CAE、CFD以及數據分析。在曾奪得世界超級計算機第一名的天河一號A上就采用了基于大規模并行GPU于多核CPU相結合的計算架構,其中使用了7168顆Tesla GPU。
在北京市計算中心看來,GPU的諸多特性非常適合正在建設中的“北京工業云”。據北京市科學技術研究院副院長、北京市計算中心主任謝威介紹,“北京工業云”是一個以云計算技術、高性能計算為基礎,面向工業企業提供工程計算、生物計算、科學計算等方面的云計算平臺,引入GPU提升現有設備的計算能力,并能降低電能消耗是北京市計算中心非常希望的。為此,早在去年就與英偉達聯合實驗室共同研究GPU的應用和發展。
據悉,目前北京市計算中心已經建成了基于GPU和CPU混合架構的百萬一次高性能計算機集群,其中GPU集群理論峰值高達50萬億次,采用了近80片英偉達Tesla C2050并行處理器。