【環球網科技綜合報道】8月13日-16日,第21屆CCF全國高性能計算學術大會(CCF HPC China 2025)在鄂爾多斯舉辦,大會以“綠動算力 超智融合”為主題,共同探討開創高性能計算高質量發展新局面的實現路徑。
當前,高性能計算學術研究和產業拓展正經歷前所未有的橫向突破。本屆大會主席、中國工程物理研究院莫則堯研究員在致辭中表示:“當前,高性能計算正在邁入智算融合‘深水區’。我們既面臨效能等硬核挑戰,也遭遇了軟件薄弱、區域發展失衡等系統性問題,亟需數字化、智能化學科交叉的攻堅克難。破局之道在于全國一盤棋,將算力孤島、學科孤島、應用孤島等凝聚為創新大陸,實現算力、數據、模型、軟件、應用等資源的協同共享和融合普惠。我們越來越清楚地認識到,開創高性能計算高質量發展新局面,務必以協同共享為基礎,以融合普惠為目標。”
智算近年來發展迅猛。算力的獲取不僅要靠智算中心的芯片快速迭代,更重要的是靠技術規模的不斷擴展。構建高性能的網絡互聯不僅關系到數據中心的建設,更是AI未來發展的關鍵技術之一。在此背景下,阿里云、中科院聯合成立了高通量以太網聯盟,致力于針對智算場景的高通量協議,推動標準化,打造開源開放的智算場景下的國內開放生態。在本次大會上,聯盟發布了多項重要成果:國產芯片落地,包括400G網卡芯片和25.6G交換芯片,以構建智算中心網絡;發布國產追光芯片;針對ERACK場景發布互聯以太網網絡;發布UPN超性能網絡,旨在基于單層的以太網和光技術構建新型超全解耦超性能的網絡。
在超智融合加速發展的背景下,《超智融合集群能力要求》行業標準也在大會上正式發布。該標準首次系統地構建了覆蓋架構設計、功能性能、安全可信及評估方法的能力體系,重點解決跨廠商兼容性差、集群協同效率低等行業共性問題,為智能制造、智慧城市等場景提供統一的技術規范。

中國科學院計算技術研究所研究員、中國計算機學會(CCF)理事長孫凝暉指出,科學智能(AI4S)作為高性能計算與人工智能深度融合的前沿交叉領域,正深刻改變著科學研究的范式。其發展所面臨的模型復雜性、算力需求和數據挑戰顯著區別于傳統人工智能應用。AI4S的最大作用是突破人類認知的極限。AI不是萬能工具,它離不開高性能計算這一重要手段。當前,信息技術賦能科學的手段如同從“增強肌肉(算力)”到“提供營養”(數據),再到“賦予大腦”(人工智能)的進化。而信息學科的主要任務是提供工具,包括提高生產率的科研信息化工具和應用開發中間件。
超級計算是推動科學研究、技術突破、產業發展的創新引擎。隨著大數據、人工智能技術的快速發展,超算技術面臨著新挑戰,比如能耗與復雜性的增加,但同時也迎來了新的機遇。
中山大學計算機學院教授、國家超級計算廣州中心主任、國家超級計算深圳中心主任盧宇彤呼吁,打造國產新一代超算系統,關注極致性能、能效與自主可控等因素,設計實現新型體系架構和融合軟件棧,打破多級異構壁壘,構建應用生態,實現多域場景的深度滲透。同時,還應基于標準與開源的協同體系,構建產學研用的可持續發展生態,有效支撐科學發現、產業革新和智能躍遷,讓超算成為國家科技創新和行業數智化升級的超級引擎。
會上,中國科學院理論物理研究所研究員、中國科學院大學學術副校長吳岳良首先簡要回顧和介紹從極小量子粒子到極大宇宙膨脹的重大理論突破與前沿研究。隨后重點闡述量子宇宙物理面臨的兩大關鍵挑戰:其一,現有物理理論在定量預言與數值求解方面存在著理論計算瓶頸。無論是由廣義相對論所描述的引力相互作用,還是由量子色動力學刻畫的強相互作用,均涉及高度復雜的非線性和非微擾特性,由此發展的數值相對論與格點規范理論對高性能計算和超算體系提出了前所未有的需求;其二,現有理論框架本身存在著根本性概念沖突,尤以廣義相對論與量子力學/量子場論的自洽結合最為突出。隨著引力波的發現與量子物理研究的深入,近年來引力量子場論與超統一場論等新理論框架的發展,對時空、能量、物質和宇宙等觀念提出了全新認識。從超統一場論的視角,粒子物理標準模型中的所有輕子和夸克作為物質基本組元被統一為局域糾纏量子比特旋量場, 所有基本相互作用由非齊次超自旋規范對稱性相應的規范相互作用支配。
吳岳良表示,把宇宙視作為由量子信息動力學自發演化的超級量子計算機,為自然界基本構造塊和基本相互作用提供量子信息動力學的認識和理解,探討信息、物質、能量和時空相統一的動力學描述,無論對基礎物理研究還是量子計算機發展都將有著深刻的啟示。
科學計算對系統的需求仍然在持續增長。同時智能計算對系統的需求也在快速增加。現在科學智能計算走入AI for Science,將在更多的領域實現賦能,大幅提升計算性能。
國防科技大學教授、博士生導師盧錫城表示,為進一步提升計算性能,應針對應用特點,并結合客觀條件對體系結構進行優化設計,綜合技術、工藝、成本等因素創新體系結構,實現軟硬件協同,目標就是要均衡配置,更好地實現異構加速。瞄準高性能與易使用兩大用戶的基礎性要求,產業界應不斷提升自主創新能力,充分吸收以往的成功經驗,精誠合作,實現軟件與硬件協同創新。
為了提升計算效率,首先要有一個好的算法,然后還要有好的機器,只有實現算法與機器協同,才能實現性能的優化。北京應用物理與計算數學研究所研究員徐小文指出,稀疏線性代數解法器是科學工程計算與工業仿真領域很多應用軟件的基礎共性組件,也是主要的性能瓶頸。解法器的效率與健壯性是實際應用中最值得關注的兩個問題。徐小文表示,復雜場景的多樣性和動態演化特征將給這兩個方面帶來嚴峻挑戰。而要解決問題,關鍵是如何實現算法空間與特征空間的映射。報告提出了一類特征修正算法框架,并以實際應用中的典型算法為例,深入探討了具有自動適配能力的智能解法器。從發展趨勢看,智能解法器在給定應用場景和機器的情況下,能夠自動實現“特征-算法-優化”三個空間的最優映射。
人工智能引領新一輪工業革命,大模型技術成為驅動本輪浪潮的關鍵支撐。對于用戶而言,高效、便捷且可靠的算力服務是實現大模型訓練和推理的核心需求。然而,用戶在使用算力服務時面臨著多種挑戰,包括高昂的成本、復雜的操作流程、資源分配的不均衡,以及對大模型訓練特征的不熟悉等。正如北京并行科技股份有限公司董事長陳健所說,從用戶視角來看,算力服務和算網服務的質量、效率和易用性才是關鍵。因此,算力服務提供商需要從用戶需求出發,圍繞業務的應用運行特征,提供多樣化的算力選型方案和解決方案。