新泰市家佳樂職業(yè)介紹有限公司
首頁 >探索> 正文

“華為”開源AI容器軟件Flex:ai將大幅提升算力資源利用率

2025

12-29

來源

新泰市家佳樂職業(yè)介紹有限公司

分享

  中新社上海11月21日電 (謝夢圓)華為21日在位于上海的練秋湖研發(fā)基地舉辦2025 AI容器應(yīng)用落地與發(fā)展論壇,在現(xiàn)場宣布AI容器軟件Flex:ai正式開源。該AI(人工智能)領(lǐng)域的創(chuàng)新成果將顯著提升GPU(圖形處理器)和NPU(神經(jīng)網(wǎng)絡(luò)處理器)等算力資源的利用率,為AI訓(xùn)練推理提供更高效的資源支撐。

  華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰接受媒體采訪時,多次強調(diào)“要讓AI在千行百業(yè)落地”。然而,在賦能行業(yè)生產(chǎn)過程中,AI硬件資源有限,需精細(xì)化利用,否則易造成浪費。

“華為”開源AI容器軟件Flex:ai將大幅提升算力資源利用率

  此次,華為聯(lián)合國內(nèi)三大高校共同打造了AI容器軟件Flex:ai,提供智能資源管理調(diào)度新方案,并通過開源開放,降低軟件開發(fā)難度。

“華為”開源AI容器軟件Flex:ai將大幅提升算力資源利用率

  具體而言,該容器軟件可將單張算力卡切分為多份虛擬算力單元,切分粒度精準(zhǔn)至10%。此技術(shù)實現(xiàn)了單卡同時承載多個AI工作負(fù)載,在無法充分利用整卡算力的AI工作負(fù)載場景下,算力資源平均利用率可提升30%。

  此外,因為不同AI模型性能、適配場景存在差異,或出現(xiàn)計算集群負(fù)載不均衡、資源利用不充分等情況。針對此痛點,該容器實現(xiàn)了多級智能調(diào)度,將AI工作負(fù)載與算力資源進行“精準(zhǔn)匹配”;并能在負(fù)載頻繁波動的場景下,保障AI工作負(fù)載平穩(wěn)運行,讓每一份算力都“物盡其用”。

  據(jù)悉,F(xiàn)lex:ai發(fā)布后會在魔擎社區(qū)同步開源,與華為此前開源的Nexent智能體開發(fā)框架、AppEngine應(yīng)用編排、DataMate數(shù)據(jù)工程、UCM推理記憶數(shù)據(jù)管理器等AI工具共同組成完整的ModelEngine開源生態(tài)。

  “AI容器軟件一定要和更多模型生態(tài)和多樣性算力生態(tài)進行適配、對接以及調(diào)優(yōu)。我們希望通過開源共建讓AI真正走向平民化?!敝苘S峰說,目前,該容器軟件已在教育、醫(yī)療和金融等行業(yè)試點應(yīng)用。(完)

1998-2022 新泰市家佳樂職業(yè)介紹有限公司 版權(quán)所有 未經(jīng)授權(quán)禁止復(fù)制或鏡像               |   關(guān)于我們  |   聯(lián)系方式  |   版權(quán)聲明  |   加入收藏