0
9 月 24 日至 26 日,第20屆CCF全國高性能計算學術年會(CCF HPC China 2024)在武漢市中國光谷科技會展中心正式開幕。
本次大會上,聯想以“異構智算 穩定高效”為主題,攜“一橫五縱”算力基礎設施戰略、聯想萬全異構智算平臺、聯想AI解決方案、聯想科學計算整體解決方案參展。
面對人工智能的浪潮,作為全球領先的科學計算解決方案提供商,聯想以“一橫五縱”戰略框架,構建布局完整、穩定高效的AI基礎設施,為企業智能化轉型打造堅實可靠的智算底座。
在 24 日下午的大會論壇上,聯想中國基礎設施業務群戰略管理總監黃山發表了主題為“筑基新質算力 縱橫數字未來”的精彩演講。
聯想中國基礎設施業務群戰略管理總監 黃山
演講過程中,黃山主要圍繞當前國產算力的瓶頸和破局之道展開分享。在他看來,“超智融合”已然成為 HPC 新的發展趨勢,而聯想在萬全異構智算平臺上的布局正是基于團隊內部對于這一趨勢的深刻洞察。
洞察算力新趨勢,聯想布局異構智算
當前,國內的算力集群已經有了不少千卡、萬卡級別的實踐,但要實現十萬卡,甚至超萬卡的突破仍舊有一定難度。
國產算力究竟有著怎樣待解的難題?在黃山看來,主要有四個關鍵“卡脖子”的問題:
首先,多元異構處理器以及服務器、存儲、網絡等基礎設施的硬件兼容性、互操作性設計是一項復雜的大工程;其次,AI訓練集群故障頻發是常態。一個千卡集群一個月至少有15次因故障停訓,故障診斷與恢復是AI訓練算力達成SLA的關鍵難題。
再次,可用算力的效率還不夠高,算力的投入產出不足以持續支持算力經濟長期健康發展。最后,由于技術限制難以突破的散熱瓶頸。智算算力發展需要液冷技術與方案設計的持續升級。
在今年的 CCF HPC 中,“超智融合”這一關鍵詞被一眾大咖反復提及,已然成為解決國內計算瓶頸的重要路徑之一。這一趨勢的出現,也標志著 HPC 由傳統通用計算主導的科學計算,逐步過渡到了異構加速的 AI 計算新時代。
今年 4 月,聯想正式發布的萬全異構智算平臺便是基于前述洞察做出的應對方案,是實現“算力好用”的破局關鍵。同時,也是聯想“一橫五縱”戰略中的重要“一橫”,此外,“五縱”則主要指服務器、存儲、軟件及超融合、數據網絡以及邊緣基礎設施產品和方案。
據聯想方面介紹,萬全異構智算平臺集成了算力匹配魔方、GPU內核態虛擬化、聯想集合通信算法庫、AI高效斷點續訓技術、AI與HPC異構集群超級調度器五大創新技術,能高度自動化地完成AI全流程開發,提供高可用算力,并持續突破計算效率瓶頸。
會后,在接受 AI 科技評論專訪時,黃山進一步介紹道,“我們的平臺是一個異構智算調度軟件,不同于普通或者說標準化的操作系統軟件,或者虛擬化軟件。這樣的新賽道是由智算的發展催生的,目前賽道內還沒有成熟標準,聯想也沒有一個有章可循的開發計劃,主要是以客戶的需求作為根本,最開始的開發就是有大項目在提出需求?!?/p>
在整個開發過程中,他體會最深的一點則在于,“在這個過程中,需求的變化非常之快,模型客戶的應用變化也很快,軟件棧的復雜度也非常高,又沒有標準群,有可能上個月很好的開發和設計方式,下個月根據實際的場景又需要再進行優化?!?/p>
國產 GPU 算力將迎階躍式提升
聯想在破解算力難題,打造異構智算平臺的過程中也遇到過許多難題,在此之中,生態的力量則成為了破局過程中不可或缺的存在,聯想借此也將迎來新的進展。
今年 4 月,聯想在信通院的領導下成立了萬全異構智算平臺生態產業聯盟,據悉,異構智算產業生態聯盟首批共計16家成員單位。其中包括了與聯想有實際方案合作的 7 家國產 GPU 廠商。除此之外,還有包括Colossal-AI、智譜 AI 等在內的合作伙伴。
談及與后者的合作,黃山進一步解釋稱,“我們向上看到 AI 的工具鏈并行算法,包括 AI 的開發社區都需要完善,整個的算法利用率是需要從芯片到模型層來解決的?!?/p>
聯想在整個生態中主要扮演著怎樣的角色呢?據黃山此前介紹,“聯想主要貢獻硬件能力和異構智算平臺的集群管理調度能力。然后是對算力生態的包容,即硬件會兼容xPU生態硬件,異構智算平臺會集成xPU底層軟件。再就是以extended UI的方式對接集成AI工具鏈生態?!?/p>
值得一提的是,在黃山的預判中,國內 GPU 算力即將迎來一波階躍式升級。
在和生態伙伴合作的過程中,他觀察發現,“國內卡的生態已經非常豐富,在禁運后的一年多里,我們的合作伙伴中有至少 5 家到 7 家國產卡已經或是即將在半年內推出,這些卡組成萬卡集群也是能支撐國內大模型持續發展的?!?/p>
他進一步向 AI 科技評論介紹道,“目前,7家芯片廠商在市場上各自有應用的對象,而且他們是互補的,很多都不沖突,要用好國產算力,其實 7 家都需要,甚至還有可能將來會涌現出更多,那么就需要先去把這些芯片做好管理和兼容,這一點是聯想已經做到的?!?span style="color: #FFFFFF;">雷峰網雷峰網(公眾號:雷峰網)
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。