工控網(wǎng)首頁
>

新聞中心

>

業(yè)界動態(tài)

>

助推國產(chǎn)算力高質(zhì)量發(fā)展,北電數(shù)智為建設(shè)數(shù)字中國添磚加瓦

助推國產(chǎn)算力高質(zhì)量發(fā)展,北電數(shù)智為建設(shè)數(shù)字中國添磚加瓦

2025/1/7 15:44:52

目前,我國的智算中心建設(shè)正呈現(xiàn)出蓬勃發(fā)展的態(tài)勢。智算中心的建設(shè)不再局限于北京、上海、深圳等一線城市,已經(jīng)擴展至縣級地區(qū),全國范圍內(nèi)的算力基礎(chǔ)設(shè)施建設(shè)正在積極推進。

根據(jù)相關(guān)資料顯示,盡管國內(nèi)算力的覆蓋范圍廣泛,但其利用率卻相對較低,整體算力中心的利用率僅為50%。這一現(xiàn)象背后的原因不乏算力中心性能不足、無法滿足大模型時代對算力的高需求、數(shù)據(jù)中心與當?shù)禺a(chǎn)業(yè)需求不匹配等。顯然,以算力規(guī)模和集群規(guī)模作為評價標準的時代已經(jīng)過去,算力需求已經(jīng)進入了從數(shù)量到質(zhì)量轉(zhuǎn)變的新時代。這種轉(zhuǎn)變也意味著,計算領(lǐng)域關(guān)注點將集中在算力的效率、靈活性以及智能化水平。

QQ20250107-154549.png

北京電子數(shù)智科技有限責任公司(以下簡稱“北電數(shù)智”)作為?家專注于原創(chuàng)性、顛覆性、引領(lǐng)性科技創(chuàng)新的人工智能科技企業(yè),在算力、算法和數(shù)據(jù)等方面實現(xiàn)了全棧產(chǎn)品和解決方案布局。

加速單芯片算力

目前我國已量產(chǎn)上市的GPU產(chǎn)品主要針對上一代算法進行設(shè)計,對于大模型相關(guān)算子的需求滿足度尚需進一步完善。因此,必須通過擴展算子庫、優(yōu)化編譯器等軟件層面的手段,實現(xiàn)對單芯片算力利用率的提升。

北電數(shù)智的前進·AI異構(gòu)計算平臺具備多重優(yōu)化特性,可通過模型量化加速、模型超參數(shù)調(diào)優(yōu)、稀疏化推理等模型優(yōu)化能力,算子融合加速、計算圖優(yōu)化、硬件訪存優(yōu)化等編譯優(yōu)化手段,提升單芯片的計算性能,增強國產(chǎn)算力芯片的自適應(yīng)性。

加強混元異構(gòu)集群性能

當前的智能計算中心大多依賴單一芯片制造商提供主要的計算能力,而多芯片混合異構(gòu)架構(gòu)將成為未來國產(chǎn)智能計算中心的發(fā)展趨勢。

北電數(shù)智的前進·AI異構(gòu)計算平臺可以通過算子級模型拆分方法優(yōu)化模型性能;通過基于自動機器學習算法的硬件擬定并執(zhí)行自動調(diào)優(yōu)策略,自動調(diào)整模型的配置和參數(shù),找到在特定芯片下的最佳性能和效果;其框架可以支持大模型分布到多GPU上進行計算,提高模型的訓練和推理效率,最終實現(xiàn)讓合適的芯片做合適的事。

加大通信能力

在萬卡集群時代,通信的重要性與單芯片算力不相上下。通信能力直接決定了大模型訓練過程中數(shù)據(jù)傳輸?shù)男?。高效、穩(wěn)定、低延遲的網(wǎng)絡(luò)對于智算中心的建設(shè)和運行至關(guān)重要。

北電數(shù)智通過打通各廠家的集合通信庫來解決不同GPU芯片之間的通信問題,對通信庫進行深度適配和優(yōu)化,通過標準化的分布式通信接口,確保異構(gòu)集群內(nèi)的信息交換,且可以通過時間重疊等策略,將計算過程和通信過程互相重疊,減少了通信延遲對整體訓練性能的影響。

智能化調(diào)度與運維保障智算集群穩(wěn)定運行

智算集群的穩(wěn)定性也很重要,實現(xiàn)算力最優(yōu)解,需要一個高效可靠的智能云管平臺,通過實時智能監(jiān)控來實現(xiàn)分鐘級的軟硬件故障定位,并實現(xiàn)故障的自動檢測和修復(fù)。

北電數(shù)智前進·AI異構(gòu)計算平臺支持多款國產(chǎn)芯片的廣泛納管,幫助用戶實現(xiàn)對不同品牌、類型AI加速卡的統(tǒng)一管理,以確保各類AI芯片的無縫集成和優(yōu)化利用。廣泛的納管能力也讓用戶能夠根據(jù)具體需求,靈活地調(diào)整資源配置,優(yōu)化算力供給滿足各類訓練推理任務(wù)。

前進·AI異構(gòu)計算平臺具有卓越的算力調(diào)度能力,可為不同場景提供多樣化的調(diào)度策略,以精準匹配各類計算任務(wù)的不同需求?!俺毕{(diào)度”是該平臺的一大特色亮點,其可根據(jù)計算任務(wù)的特性和資源需求的變化動態(tài)地分配和回收計算資源,尤其適用于渲染應(yīng)用等場景,以最大化資源的利用率并減少執(zhí)行時間;此外,“前進·AI異構(gòu)計算平臺”提供的“推訓混布”策略可幫助大模型使用方實現(xiàn)同一算力集群既支持在線推理服務(wù)部署任務(wù),又支持離線訓練任務(wù),從而顯著提高算力資源的利用率,減少資源浪費,大幅降低運營成本。

11月21日,北電數(shù)智成功推出了國內(nèi)首個算力概念驗證(PoC)平臺,并在北京數(shù)字經(jīng)濟算力中心正式啟用。該平臺依托北電數(shù)智的先進計算迭代驗證平臺——前進·AI異構(gòu)計算平臺,為國產(chǎn)算力集群提供專門的場景評測、適配和驗證服務(wù),同時也為場景持有方特定場景應(yīng)用的開發(fā),提供了多樣化的算力適配試驗空間,從而實現(xiàn)從基礎(chǔ)算力到業(yè)務(wù)場景驅(qū)動的雙向鏈路的無縫對接。目前,北電數(shù)智前進·AI異構(gòu)計算平臺已經(jīng)成功對近??家芯?企業(yè)的產(chǎn)品 ?余種芯?進行了測試與適配,協(xié)助國產(chǎn)算力的性能不斷優(yōu)化提升。

QQ20250107-154636.png

在國產(chǎn)算力發(fā)展從數(shù)量增長轉(zhuǎn)向質(zhì)量提升的背景下,北電數(shù)智通過前進·AI異構(gòu)計算平臺的多重優(yōu)勢,為重塑國產(chǎn)芯片的競爭力、推動數(shù)字中國建設(shè)添磚加瓦。


審核編輯(
黃莉
)
投訴建議

提交

查看更多評論
其他資訊

查看更多

2025 CAIMRS | 用戶投票倒計時,共同見證“新質(zhì)之星”的誕生!

電裝與富士電機聯(lián)手強化半導體供應(yīng)鏈 助推碳化硅技術(shù)發(fā)展

合康新能首創(chuàng)給水泵變頻改造方案

全球首個!卡奧斯助力海爾入選工業(yè)4.0獎“AI創(chuàng)新領(lǐng)航”獎

IOTE物聯(lián)網(wǎng)展,2025年度主題: 生態(tài)智能,物聯(lián)全球!