科技云報(bào)到原創(chuàng)。
當(dāng)英偉達(dá)以4萬(wàn)億美元市值成為AI時(shí)代“芯”皇、寒武紀(jì)超越茅臺(tái)登頂A股股王,全球正在迎接AI的高光時(shí)刻。
然而,在科技盛世之下,AI行業(yè)正陷入一場(chǎng)“看不見(jiàn)的焦慮”。GPT-4訓(xùn)練數(shù)據(jù)量突破萬(wàn)億級(jí)、自動(dòng)駕駛汽車單日采集數(shù)據(jù)達(dá)TB級(jí)、機(jī)器人每一次動(dòng)作都生成海量多模態(tài)數(shù)據(jù)。多數(shù)人將目光聚焦在算力芯片的性能競(jìng)賽上,然而卻忽略了一個(gè)更核心的問(wèn)題:沒(méi)有足夠強(qiáng)大的“存力”,再頂尖的算力也只是“無(wú)米之炊”。
傳統(tǒng)存儲(chǔ)的傳輸速度跟不上GPU的計(jì)算節(jié)奏,導(dǎo)致算力常年處于“等米下鍋”的閑置狀態(tài)?!按娌幌?、傳不快、不安全”,已成為AI產(chǎn)業(yè)突破瓶頸的三大攔路虎。
就在行業(yè)陷入存力困境之時(shí),2023年,曙光存儲(chǔ)在業(yè)內(nèi)首次提出“先進(jìn)存力”概念,打破傳統(tǒng)存儲(chǔ)“被動(dòng)存數(shù)據(jù)”的局限;2024年,又聯(lián)合IDC發(fā)布《構(gòu)建面向智能化時(shí)代的先進(jìn)存力中心》白皮書(shū),為AI時(shí)代的存力建設(shè)劃定標(biāo)準(zhǔn)。
2025年8月29日,曙光存儲(chǔ)副總裁郭照斌在第二屆CCF中國(guó)存儲(chǔ)大會(huì)上宣布,曙光“超級(jí)隧道”技術(shù)可以更好地應(yīng)對(duì)PCIe6.0時(shí)代,為下一代國(guó)產(chǎn)芯片效能釋放提供加速引擎。
從“先進(jìn)存力”概念提出,到“超級(jí)隧道”技術(shù)破解傳輸瓶頸,再到布局PCIe 6.0未來(lái),曙光存儲(chǔ)正基于自主技術(shù)塑造起以先進(jìn)存力為的下一個(gè)AI增長(zhǎng)引擎。
曙光存儲(chǔ)副總裁 郭照斌
“先進(jìn)存力”不止是存數(shù)據(jù)更是AI第二引擎
提到存儲(chǔ),很多人的第一反應(yīng)是硬盤(pán)、服務(wù)器這類硬件載體。但在AI時(shí)代,這種認(rèn)知早已過(guò)時(shí)。曙光存儲(chǔ)提出的“先進(jìn)存力”,早已超越“存放數(shù)據(jù)”的基礎(chǔ)功能,成為能主動(dòng)釋放數(shù)據(jù)價(jià)值、驅(qū)動(dòng)AI運(yùn)轉(zhuǎn)的“第二引擎”。
2023年,曙光存儲(chǔ)首次提出“先進(jìn)存力”概念時(shí),就明確了其核心圍繞“海量、高效、融合、綠色、安全”五大維度展開(kāi),這與傳統(tǒng)存儲(chǔ)的定位形成了本質(zhì)區(qū)別。
傳統(tǒng)存儲(chǔ)更像“數(shù)據(jù)倉(cāng)庫(kù)”,只負(fù)責(zé)接收和保管數(shù)據(jù),至于數(shù)據(jù)如何被高效調(diào)取、如何與不同場(chǎng)景適配、如何降低存儲(chǔ)過(guò)程中的能耗,都不在其考慮范圍內(nèi)。
而曙光提出的先進(jìn)存力是AI時(shí)代的又一關(guān)鍵基礎(chǔ)設(shè)施。先進(jìn)存力不僅可以支持EB級(jí)存儲(chǔ),輕松裝下AI大模型的萬(wàn)億級(jí)訓(xùn)練數(shù)據(jù),還能通過(guò)AI加速技術(shù),能夠讓數(shù)據(jù)調(diào)取速度匹配算力需求,避免算力閑置。同時(shí),兼容文件、塊、對(duì)象等多種協(xié)議,無(wú)論是自動(dòng)駕駛的視頻數(shù)據(jù),還是機(jī)器人的傳感器數(shù)據(jù),都能無(wú)縫接入。另外,先進(jìn)存力采用液冷技術(shù)降低能耗,大幅降低存儲(chǔ)系統(tǒng)PUE(能源使用效率),更通過(guò)全棧自主技術(shù),從芯片到系統(tǒng)層層設(shè)防,保障核心數(shù)據(jù)不泄露。
在白皮書(shū)里,先進(jìn)存力被明確為“數(shù)據(jù)要素價(jià)值釋放的核心載體”,它不再是孤立的存儲(chǔ)設(shè)備,而是與算力、運(yùn)力(數(shù)據(jù)傳輸能力)深度協(xié)同的基礎(chǔ)設(shè)施。
比如在重慶先進(jìn)數(shù)據(jù)中心,曙光存儲(chǔ)構(gòu)建的先進(jìn)存力,一邊連接著當(dāng)?shù)刂撬阒行牡臄?shù)千顆GPU,一邊對(duì)接企業(yè)的生產(chǎn)數(shù)據(jù),通過(guò)智能調(diào)度讓數(shù)據(jù)“按需流動(dòng)”。當(dāng)AI訓(xùn)練需要熱數(shù)據(jù)時(shí),數(shù)據(jù)能夠毫秒級(jí)直達(dá)GPU;訓(xùn)練完成后的冷數(shù)據(jù),將自動(dòng)歸檔至低成本存儲(chǔ)節(jié)點(diǎn),既保證效率又控制成本。
這種協(xié)同能力,讓先進(jìn)存力具備了五大核心特征:高效融合,可以兼容多協(xié)議,打破數(shù)據(jù)孤島;提質(zhì)增效,AI加速技術(shù)提升數(shù)據(jù)處理效率;全域流動(dòng),智能調(diào)度讓數(shù)據(jù)在不同節(jié)點(diǎn)間無(wú)縫流轉(zhuǎn);安全可靠,全棧自主技術(shù)抵御風(fēng)險(xiǎn);綠色節(jié)能,液冷技術(shù)降低能耗。
國(guó)家氣象局的實(shí)踐就是最好證明,曙光為其構(gòu)建的橫跨三地的存力平臺(tái),能夠?qū)崟r(shí)同步全國(guó)的氣象數(shù)據(jù),既滿足天氣預(yù)報(bào)AI模型的實(shí)時(shí)計(jì)算需求,又能安全歸檔歷史氣象數(shù)據(jù),同時(shí)能耗較傳統(tǒng)方案降大幅下降。
對(duì)于AI產(chǎn)業(yè)而言,先進(jìn)存力的意義在于,它解決了數(shù)據(jù)在哪存、怎么傳、如何用的根本問(wèn)題,讓算力不再空轉(zhuǎn),讓數(shù)據(jù)真正成為能驅(qū)動(dòng)AI進(jìn)化的“燃料”。
“超級(jí)隧道”讓數(shù)據(jù)傳輸“快到飛起”
如果將先進(jìn)存力視為AI的“第二引擎”,那么曙光存儲(chǔ)的“超級(jí)隧道”技術(shù),就是讓這臺(tái)引擎飛速運(yùn)轉(zhuǎn)的“傳動(dòng)軸”,其通過(guò)自主可控技術(shù),破解了長(zhǎng)期以來(lái)數(shù)據(jù)傳輸?shù)摹翱ú弊印彪y題,讓數(shù)據(jù)從“擁堵慢走”變成“一鍵直達(dá)”。
在AI產(chǎn)業(yè)中,長(zhǎng)期存在一個(gè)認(rèn)知誤區(qū),認(rèn)為只有靠國(guó)外高端GPU才能提升計(jì)算效率。但曙光存儲(chǔ)發(fā)現(xiàn),傳統(tǒng)存儲(chǔ)架構(gòu)中,CPU的性能其實(shí)被嚴(yán)重浪費(fèi)。由于存儲(chǔ)與CPU、GPU之間的傳輸路徑存在加鎖機(jī)制,多個(gè)進(jìn)程會(huì)爭(zhēng)搶資源,導(dǎo)致CPU算力無(wú)法充分釋放,最終不得不依賴更多GPU來(lái)彌補(bǔ)效率差。
“超級(jí)隧道”核心解決的問(wèn)題就是打破這種依賴,通過(guò)激活CPU潛力,降低對(duì)國(guó)外GPU的依賴,同時(shí)減少關(guān)鍵硬件的對(duì)外依存度,構(gòu)建出了一條自主可控的技術(shù)路徑,這意味著企業(yè)無(wú)需高價(jià)采購(gòu)國(guó)外GPU,也能實(shí)現(xiàn)AI性能的提升。
傳統(tǒng)存儲(chǔ)的傳輸路徑,就像一條單車道加紅綠燈的公路,多個(gè)CPU核共享同一批資源,就像多輛車搶一條車道,還得等紅綠燈(加鎖機(jī)制),擁堵是常態(tài)。
而“超級(jí)隧道”則重構(gòu)了這條公路。它為每個(gè)CPU核配備專屬車道,構(gòu)建起從網(wǎng)卡到CPU再到硬盤(pán)“一桿子插到底”的無(wú)沖突傳輸路徑,徹底去除加鎖機(jī)制。
具體來(lái)說(shuō),這個(gè)過(guò)程分為三步:
首先,為每個(gè)CPU核分配獨(dú)占的網(wǎng)卡、內(nèi)存、硬盤(pán)資源,避免資源爭(zhēng)搶。
其次,用AI預(yù)測(cè)調(diào)度技術(shù),提前判斷數(shù)據(jù)的傳輸需求,讓數(shù)據(jù)“走哪條路”提前規(guī)劃好。
最后,通過(guò)軟硬件協(xié)同,讓數(shù)據(jù)在傳輸過(guò)程中不跨域、不等待,實(shí)現(xiàn)就近訪問(wèn)。
就像快遞配送,傳統(tǒng)方式是所有快遞先到一個(gè)分揀中心(共享資源),再進(jìn)行分發(fā),而“超級(jí)隧道”則是每個(gè)快遞員都有專屬配送路線(獨(dú)占資源),直接從倉(cāng)庫(kù)送到客戶手中,效率自然天差地別。
從技術(shù)手段上看,“超級(jí)隧道”的高效不是靠單一技術(shù)實(shí)現(xiàn)的,而是多維度技術(shù)的協(xié)同突破,每一項(xiàng)技術(shù)都直擊行業(yè)痛點(diǎn)。
比如,多NUMA/CPU與微控模型,解決了多核效率低難題。傳統(tǒng)服務(wù)器多采用單CPU,性能強(qiáng)但成本高,曙光則用多NUMA(非一致內(nèi)存訪問(wèn))或多CPU提升性能,但多CPU 之間的訪問(wèn)延遲會(huì)成為新瓶頸。為此,曙光研發(fā)“微控模型”,精準(zhǔn)適配硬件特性,讓多CPU之間的訪問(wèn)代價(jià)降低60%,既提升性能又控制成本。
在軟硬件協(xié)同方面,曙光存儲(chǔ)實(shí)現(xiàn)了每個(gè)部件各司其職互不干擾。CPU、內(nèi)存、硬盤(pán)采用“分組作業(yè)”,每個(gè)NUMA域都有自己的“專屬網(wǎng)卡”,避免跨域訪問(wèn)的延遲。數(shù)據(jù)被切分到不同邏輯空間,每個(gè)空間對(duì)應(yīng)專屬硬件資源,就像多條“垂直隧道”,數(shù)據(jù)從進(jìn)入到落地,全程在同一隧道內(nèi)完成,不與其他數(shù)據(jù)“搶道”。
曙光存儲(chǔ)獨(dú)有的XIO技術(shù)(XNIO/XDIO)融合了無(wú)鎖輪詢與RTC處理,實(shí)現(xiàn)數(shù)據(jù)傳輸“一鍵直達(dá)”。在任務(wù)處理方面,XIO技術(shù)可以實(shí)現(xiàn)200納秒?yún)f(xié)程切換,能夠輕松應(yīng)對(duì)百萬(wàn)級(jí)高并發(fā)需求。在數(shù)據(jù)傳輸上,XIO技術(shù)省去很多中間步驟,與傳統(tǒng)傳輸方式相比,傳輸效率提升10倍。
“超級(jí)隧道”技術(shù)基于無(wú)鎖架構(gòu)、極簡(jiǎn)交互及軟硬件協(xié)同等核心設(shè)計(jì),是當(dāng)前業(yè)內(nèi)唯一能夠充分釋放PCIe 5.0性能的存儲(chǔ)技術(shù)。
PCIe是一種高速串行計(jì)算機(jī)擴(kuò)展總線標(biāo)準(zhǔn),是由英特爾在2001年提出的。PCIe作為連接x86服務(wù)器、PC和筆記本電腦核心處理器與外設(shè)的重要方式取得了巨大成功。隨著CPU和GPU性能不斷提升,PCIe總線速度也在同步增長(zhǎng),每一代都實(shí)現(xiàn)帶寬翻倍。
PCIe 5.0的帶寬較4.0提升100%,能徹底消除傳統(tǒng)架構(gòu)的帶寬瓶頸,而PCIe 6.0采用PAM4編碼技術(shù),單通道速率達(dá)64GT/s,未來(lái)可支持800GE網(wǎng)絡(luò)傳輸。
目前,超級(jí)隧道支持的集中式全閃存儲(chǔ)產(chǎn)品已經(jīng)實(shí)現(xiàn)億級(jí)IOPS性能、202微妙級(jí)時(shí)延,面向AI加速場(chǎng)景,可成功將推理時(shí)延降低80%。曙光分布式存儲(chǔ)通過(guò)五級(jí)加速+三級(jí)協(xié)同技術(shù),可將GPU利用率從30-40%提高至70%-80%,訓(xùn)練速度提升4倍,萬(wàn)億參數(shù)模型訓(xùn)練周期壓縮60%以上。
在曙光存儲(chǔ)的兩大產(chǎn)品線——分布式全閃存儲(chǔ)ParaStor、集中式全閃存儲(chǔ)FlashNexus中,“超級(jí)隧道”都已有不同維度的應(yīng)用。
從CPU、PCIe交換芯片到NVMe SSD,曙光存儲(chǔ)構(gòu)建了業(yè)界唯一全鏈路PCIe5.0通道,徹底消除傳統(tǒng)架構(gòu)中的帶寬瓶頸。
為深化先進(jìn)存力理念,曙光存儲(chǔ)“超級(jí)隧道”技術(shù)再次加磅,將更好應(yīng)對(duì)最新PCle6.0標(biāo)準(zhǔn),為下一代國(guó)產(chǎn)芯片應(yīng)運(yùn)而生,為加速突破AI能力邊界、應(yīng)用落地塑造更強(qiáng)引擎。
AI行業(yè)應(yīng)用釋放存力價(jià)值
技術(shù)的價(jià)值,最終要靠實(shí)踐驗(yàn)證。從西湖大學(xué)的AI科研,到造車新勢(shì)力的智能駕駛,再到機(jī)器人具身智能,曙光存儲(chǔ)的先進(jìn)存力方案已在多個(gè)關(guān)鍵場(chǎng)景落地,成為推動(dòng)行業(yè)進(jìn)步的“隱形動(dòng)力”。
西湖大學(xué)作為聚焦前沿科學(xué)的研究機(jī)構(gòu),在AI與生命科學(xué)、材料科學(xué)的交叉領(lǐng)域投入重兵。比如用AI預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)、用機(jī)器學(xué)習(xí)篩選新型材料,這些研究都需要處理海量實(shí)驗(yàn)數(shù)據(jù),對(duì)存儲(chǔ)性能的要求遠(yuǎn)超普通場(chǎng)景。
西湖大學(xué)在內(nèi)部測(cè)試中發(fā)現(xiàn),通過(guò)調(diào)整部分存儲(chǔ)性能,可以將AI科研的計(jì)算過(guò)程加快30%,因此選擇主打“AI加速”的曙光全閃存儲(chǔ)。
技術(shù)方面,曙光存儲(chǔ)實(shí)現(xiàn)了單節(jié)點(diǎn)帶寬超越國(guó)際廠商4倍以上,為西湖大學(xué)的AI業(yè)務(wù)按下“加速鍵”。其次,曙光存儲(chǔ)20多年來(lái),已為多個(gè)世界級(jí)產(chǎn)學(xué)研項(xiàng)目提供保障,從前期設(shè)計(jì)、供應(yīng)鏈保障,再到部署后的彈性調(diào)整,全方位匹配多學(xué)科平臺(tái)需求,能夠滿足西湖大學(xué)對(duì)存儲(chǔ)設(shè)備的穩(wěn)定性和服務(wù)響應(yīng)速度。
更為重要的是,西湖大學(xué)的科研數(shù)據(jù)多為核心機(jī)密,曙光存儲(chǔ)采用100%自研的軟硬件架構(gòu),從芯片到系統(tǒng)層層加密,同時(shí)配備多重冗余設(shè)計(jì),即使某個(gè)硬件部件故障,系統(tǒng)也能自動(dòng)切換至備用節(jié)點(diǎn),數(shù)據(jù)不中斷、不丟失。目前,這套存儲(chǔ)系統(tǒng)已支撐西湖大學(xué)在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域取得多項(xiàng)突破。
人形機(jī)器人的研發(fā),對(duì)存力的要求更為苛刻。機(jī)器人的每一次行走、抓取、交互,都會(huì)生成視覺(jué)、觸覺(jué)、聽(tīng)覺(jué)等多模態(tài)數(shù)據(jù),這些數(shù)據(jù)需要實(shí)時(shí)傳輸至AI模型進(jìn)行分析,再快速反饋指令,任何延遲都可能導(dǎo)致動(dòng)作失誤。
智元機(jī)器人作為具身智能領(lǐng)域的領(lǐng)先企業(yè),之所以能在半年內(nèi)推出多款商用人形機(jī)器人,背后離不開(kāi)曙光存儲(chǔ)的全力支持。
智元機(jī)器人的關(guān)注點(diǎn)在于“快速迭代”,其多模態(tài)大模型需要持續(xù)接收海量數(shù)據(jù)進(jìn)行訓(xùn)練,同時(shí)要快速沉淀數(shù)據(jù)資產(chǎn),以支撐新品研發(fā)。
針對(duì)這一需求,曙光存儲(chǔ)為智元定制了“分布式全閃+對(duì)象存儲(chǔ)”的分級(jí)架構(gòu),前端采用ParaStor分布式全閃存儲(chǔ),提供500GB/s的聚合讀帶寬,能實(shí)時(shí)傳輸機(jī)器人的多模態(tài)數(shù)據(jù),支撐AI模型的快速訓(xùn)練,后端搭配分布式對(duì)象存儲(chǔ),單桶支持5萬(wàn)IOPS,能安全歸檔歷史訓(xùn)練數(shù)據(jù),同時(shí)成本可控。
兩套方案協(xié)同配合,形成“分級(jí)存儲(chǔ)”,不同需求的數(shù)據(jù)都能找到合適的存放地,不僅實(shí)現(xiàn)了高效的AI模型訓(xùn)練,數(shù)據(jù)也能及時(shí)沉淀復(fù)用,在機(jī)器人模型訓(xùn)練和商業(yè)化落地方面實(shí)現(xiàn)效率倍增。
AI時(shí)代的存力革命,才剛剛開(kāi)始。隨著大模型向萬(wàn)億參數(shù)、機(jī)器人向通用智能、自動(dòng)駕駛向全場(chǎng)景演進(jìn),存力的重要性將愈發(fā)凸顯。從首次提出“先進(jìn)存力”定義行業(yè)標(biāo)準(zhǔn),到用“超級(jí)隧道”技術(shù)突破傳輸瓶頸,再到更好地應(yīng)對(duì)PCIe 6.0標(biāo)準(zhǔn),曙光存儲(chǔ)的每一步動(dòng)作,都緊扣AI產(chǎn)業(yè)的存力需求,解決的不僅是“存不下、傳不快、不安全”的表層問(wèn)題,更是通過(guò)自主可控的技術(shù),為AI產(chǎn)業(yè)構(gòu)建了可持續(xù)發(fā)展的存力底座。
這場(chǎng)存力革命,沒(méi)有旁觀者。而曙光存儲(chǔ),早已站在了潮頭。
【關(guān)于科技云報(bào)到】企業(yè)級(jí)IT領(lǐng)域Top10新媒體。聚焦云計(jì)算、人工智能、大模型、網(wǎng)絡(luò)安全、大數(shù)據(jù)、區(qū)塊鏈等企業(yè)級(jí)科技領(lǐng)域。原創(chuàng)文章和視頻獲工信部權(quán)威認(rèn)可,是世界人工智能大會(huì)、數(shù)博會(huì)、國(guó)家網(wǎng)絡(luò)安全宣傳周活動(dòng)、可信云大會(huì)與全球云計(jì)算等大型活動(dòng)的官方指定傳播媒體之一。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 從聯(lián)接到賦能,新華三用端網(wǎng)協(xié)同加速“人工智能+”
- 即時(shí)零售,打開(kāi)了電商的新想象
- 科技云報(bào)到:西湖大學(xué)、智元機(jī)器人都選它,存儲(chǔ)成為AI下一個(gè)風(fēng)口?
- 全球首創(chuàng),引領(lǐng)高端!追覓雙機(jī)械臂空調(diào)即將馭風(fēng)而來(lái)
- “價(jià)格屠夫”鄭堅(jiān)江:被董明珠炮轟十年,帶奧克斯殺進(jìn)港交所
- 馬斯克痛斥華人技術(shù)天才,一年帶走5000萬(wàn)還要竊取核心技術(shù)
- vivo Y500發(fā)布:vivo史上最強(qiáng)藍(lán)海電池,續(xù)航耐用雙滅霸
- “電算茅”山高控股:高增長(zhǎng)成慣性,既務(wù)實(shí)又務(wù)遠(yuǎn)
- 如果華為上市,值多少個(gè)寒武紀(jì)?
- “續(xù)航耐用雙滅霸”vivo Y500正式發(fā)布,售價(jià)1399元起
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。