黑洞照片、天氣預報、工業製造……它們背後都有同一個科技力量
下面這張照片,你很可能已經見過:
作為「人類第一張黑洞照片」,它在 2019 年發佈時引起了巨大轟動。但要問起這張照片是怎麼拍出來的,很多人也許就不那麼清楚了。
照片中央的黑洞位於 M87 星系,考慮到它遠在 5500 萬光年之外,想為其「畫像」的難度無異於在地球上給月球表面的一個可樂瓶蓋拍照。為了達到所需的分辨率,我們甚至需要一面像地球那麼大的望遠鏡。
好消息是,人類還真建出了這樣的望遠鏡。
這裏的關鍵是甚長基線干涉測量技術(VLBI)。通過調動散佈在全球的射電望遠鏡,讓它們同一時間觀測同一個目標,再將得到的觀測信號進行聯合處理,就相當於用一台口徑達到各望遠鏡之間距離的超大射電望遠鏡進行觀測。理論上説,這台「虛擬望遠鏡」的口徑甚至能夠超越地球直徑。
負責這次黑洞觀測計劃的是事件視界望遠鏡(EHT)。藉助橫跨多個大洲的望遠鏡陣列,天文學家如願以償地得到了他們想要的數據。
▲ 支持事件視界望遠鏡計劃的小型 HPC
但怎麼處理望遠鏡得到的數據是另一個問題。僅僅是一場為期五天的觀測,事件視界望遠鏡就會產生約 7PB 的數據,能夠裝滿近 2000 個大容量硬盤。如此大的數據量難以通過互聯網傳輸,因此各地天文台會將硬盤集中郵寄到美國麻省理工學院海斯塔克天文台——在那裏等候多時的高性能計算機(HPC)將會把數千個硬盤中雜亂無章的數據轉換成我們後來看見的黑洞「出道照」。
無處不在的高性能計算
▲阿塔卡馬沙漠中的射電望遠鏡陣列 ©BABAK TAFRESHI
在事件視界望遠鏡計劃中,硬件設備至關重要。但與阿塔卡馬沙漠夜空中莊嚴的望遠鏡陣列相比,高性能計算機看起來只是一片低調地隱藏在室內的機箱櫃,負責的也是枯燥蕪雜的數據處理工作,這讓高性能計算於我們而言往往是一個遙遠的概念。
但聽起來更陌生縹緲的高性能計算,與日常生活的關係可能遠更緊密於那些沉默地佇立的射電望遠鏡。只要將高性能計算與其實際服務的項目聯繫起來,就很容易理解,為什麼它在當下堪稱是不可或缺的「基礎設施」。
談到「日常生活」,最好的例子莫過於天氣預報。天氣是那麼重要,以至於兩個許久未見的人在開啓話題時都往往會選擇從天氣着手:「今天怎麼突然下雨了?」
但另一方面,天氣也是「蝴蝶效應」的最佳詮釋者——千里之外的微小誘因常常能以數學模型都無法預測的方式改變天氣,正如發生在太平洋東部的拉尼娜現象會讓粵閩一帶今年遭遇旱情。
儘管人類可能永遠都無法完全理解天氣,但科技進步至少讓人們更加趨近這個目標:多普勒雷達和氣象衞星讓我們對雲系有了更深入的瞭解;而高性能計算加持下的大數據統計讓預測的精度不斷提高。
有了數據科學,如今我們預測未來一週的降水情況比半個世紀前預測一天之內的降水情況更加準確,甚至可以清楚地告訴你,現在盤旋在菲律賓東部的 2 號颱風「舒力基」極有可能加強為超強颱風,然後取道太平洋東去。數據科學背後,自然少不了擁有強大算力的高性能計算參與。
高性能計算應用的另一個例子是電影和動畫的渲染。我去看了最近重映的《阿凡達》,出色的美術設計和纖毫畢現的特效創造了恢弘華美的潘多拉星球,哪怕在 11 年後看來依然無比驚豔。
但這麼漂亮的特效也意味着驚人的渲染工作量——當年詹姆斯·卡梅隆的團隊找來了擁有 6000 個處理器的高性能計算機協助渲染,渲染工作大概花了一年時間。如果換用普通 PC,這部分工作就需要馬不停蹄地渲染一萬年。
高性能計算還支持了許多重要的學術研究。例如,去年日本學者通過目前算力最強的「富嶽」高性能計算機模擬計算了口罩的防飛沫效果;西班牙的一個研究團隊也藉助高性能計算機模擬水熊蟲體內損壞抑制蛋白與 DNA 的相互作用,發現了水熊蟲得以成為「最頑強生命體」的機制。
時至今日,在眾多行業的根基處,都能發現高性能計算的身影。目前高性能計算應用範圍包括了航空航天、石油勘探、氣象研究、生物工程、工業設計、動畫渲染、智能化社會等諸多領域。可以説,任何需要計算機和算力的行業,都會用得上高性能計算。
中國高性能計算成長史
提起「高性能計算」,你腦海中會浮現出哪些名字?是先後登頂算力 TOP500 排行榜的「天河 1 號 A」?還是「神威·太湖之光」?
或許有些意外,在中國高性能計算系統中份額最大的供應商其實是聯想。對,就是那個你以為只做筆記本電腦的聯想。
在中國超級算力大會 ChinaSC 2020 發佈的高性能計算機 TOP100 榜單中,聯想以 35 套領跑,其中 6 套位列前 10。即使放到世界上,聯想也是高性能計算領域的重要參與者:去年 11 月發佈的 TOP500 高性能計算名單中,聯想入圍 182 台,獨佔 36.4% 的份額。
事實上,聯想早在 1999 年就正式成立高性能計算(HPC)部門入局相關研發領域。要明白為什麼聯想要製造高性能計算機,就要理解當初的時代背景。
▲世界首台通用計算機 ENIAC
從世界第一台通用計算機「ENIAC」開始,高性能計算便長期服務於尖端領域的研究,但因為起點不同,高性能計算機技術長期由歐美國家所把持。
一個著名的故事是,上世紀 80 年代中國石油工業部物探局曾花重金購買了一台 IBM 大型機,但 IBM 方面給出的交易條件非常苛刻:為免「竊取技術」,美方將機器放在一間玻璃房裏實施 24 小時監控,且進出鑰匙和開機啓動密碼都由美方掌握,中方還必須定期提交使用日誌。
在這樣的環境下,自主掌握高性能計算技術就顯得尤為重要。在高性能計算研製上,一邊是以「銀河」「曙光」與「神威」系列為代表的「國家隊」,另一邊則是聯想的「深騰」系列高性能計算機;前者更多負責國家級關鍵任務,而後者將高性能計算更廣泛地推向商用。
2002 年,聯想推出了國內首套萬億次運算能力的服務器深騰 1800,它創造性地放棄了先前向量機的發展方向,轉向了集羣計算的技術路線,奠定了今天高性能計算體系的結構基礎。在深騰 1800 的引領下,高性能計算集羣體系結構迅速成為了主流。
短短一年後,深騰 6800 在 2003 年研製成功,它的運算速度達到了每秒 4 萬億次,在當年 TOP500 排行榜上名列第 14,這還是首次有中國高性能計算機躋身前 20 名。
自此,聯想數據中心業務一路穩步擴張,在最新發布的 2020—2021 財年第三季度財報中,數據中心業務營收達到了 108.2 億元,如上文所説,聯想也迅速成長為了高性能計算領域的領頭品牌。
在此期間,聯想高性能計算部門還完成了一系列重要任務。比如説,聯想與中國載人航天工程辦公室共建了中國載人航天工程總體仿真實驗室,承接了軌道計算、模擬仿真和航天器設計等任務,助力了神舟九號與天宮一號載人交會對接、神州十一號與天宮二號載人交會對接等航天任務的成功實踐。
高性能計算的未來在哪裏?
中科院計算所研究員張雲泉博士在接受採訪時曾表示:「農業社會靠體力,工業社會靠機器,信息社會靠互聯網,而智能化社會要靠算力,誰能佔領力的制高點,誰就有了引領社會發展的基礎。」
IDC 報告預測,2018—2025 年,中國的數據總量將以每年 30% 的高速增長引領全球,預計到 2025 年,中國的數據總量將會攀升至世界第一。為了應對爆炸式增長的數據,建立更多的數據中心勢在必行。
但是在「綠色經濟」的大環境下,政府和企業都更關心綠色節能指標,新建的數據中心不能僅僅滿足於高性能,還必須擁有高能效比。作為「反面教材」,當前 TOP500 第一名的日本「富嶽」高性能計算雖然總性能領先,卻因為高造價、高能耗而飽受詬病。
▲更好的散熱系統提升了單機櫃功率上限
立足於商業領域的聯想會更注重能效比。為此,聯想開發了專有的「海神」液冷系統,使用 18~50℃ 的去離子水作為冷媒,通過冷板液冷(服務器產生的熱量傳導至冷板,再由液體帶走)的方式對服務器進行冷卻,經熱循環後的温水接近 60 ℃,還可以回收熱量用於室內供暖。一系列舉措相結合,「海神」液冷系統能夠提供數倍於傳統風冷的散熱效率,從而提升單機櫃的功率上限。
以聯想為北京大學打造的「未名一號」高性能計算平台為例,「海神」液冷系統為其節省了 50% 的製冷散熱成本,將 PUE 值(數據中心所有設備能耗之和 / IT 設備能耗,越接近 1 效能越好)控制在 1.1,每年能為北京大學節省 60 萬度電。
▲聯想為 SURF 打造的新高性能計算機將建在阿姆斯特丹數據塔中
而聯想為荷蘭學術機構 SURF 打造的新一代高性能計算機,更是通過聯合加速、分佈式存儲、微通道散熱技術和「海神」液冷系統實現了比傳統散熱方式節能 90% 以上的高效能源利用模式。
當然,高性能計算性能再高、能效再好,也必須要應用於實際項目才能發揮價值。沒有軟件的輔助,空有算力也無法轉化為現實價值。曾經就有報道説,「天河 1 號」因為缺少軟件配合而長期閒置。
為了更好地實施軟硬件協同,聯想並未停留在硬件提供者的角色上,而是發展為了完整的解決方案提供者:聯想會深度參與到系統構建的過程中,根據用户實際需要設計合適的數據中心規模,並提供高性能計算管理系統以及可擴展計算平台,賦予了高性能計算系統更廣泛的應用潛力。
當高性能計算運算速度朝着每秒百億億次邁進,數據中心在地球表面的每個角落鋪開,我們有理由相信,未來的人們能夠將目光投向更深邃的太空,享受到更精準的天氣預報、更高水平的醫藥服務以及更活靈活現的動畫電影。
資料來源:愛範兒(ifanr)