(相關(guān)資料圖)
4月18日,字節(jié)跳動(dòng)旗下火山引擎在其舉辦的“原動(dòng)力大會(huì)”上發(fā)布自研DPU等系列云產(chǎn)品,并推出新版機(jī)器學(xué)習(xí)平臺(tái):支持萬卡級大模型訓(xùn)練、微秒級延遲網(wǎng)絡(luò),彈性計(jì)算可節(jié)省70%算力成本。基于自研DPU的GPU實(shí)例,相比上一代集群性能最高提升三倍以上。
會(huì)上,火山引擎宣布與字節(jié)跳動(dòng)國內(nèi)業(yè)務(wù)并池?;趦?nèi)外統(tǒng)一的云原生基礎(chǔ)架構(gòu),抖音等業(yè)務(wù)的空閑計(jì)算資源可極速調(diào)度給火山引擎客戶使用。簡單來說就是,讓用戶在更小的資源池內(nèi)調(diào)度資源,提高整體資源利用率的效果,從而達(dá)到降本增效。
字節(jié)跳動(dòng)副總裁楊震原認(rèn)為,業(yè)務(wù)創(chuàng)新需要試錯(cuò),試錯(cuò)要大膽、敏捷,但試錯(cuò)也一定要控制成本。通過潮汐、混部等方式,火山引擎實(shí)現(xiàn)資源的高利用率和極低成本。以抖音推薦系統(tǒng)為例,工程師用15個(gè)月的樣本訓(xùn)練某個(gè)模型,5小時(shí)就能完成訓(xùn)練,成本只有5000元?;鸨W(wǎng)的抖音“AI繪畫”特效,從啟動(dòng)到上線只用一周多時(shí)間,模型由一名算法工程師完成訓(xùn)練。
據(jù)MiniMax聯(lián)合創(chuàng)始人楊斌介紹,MiniMax與火山引擎合作建立了超大規(guī)模實(shí)驗(yàn)平臺(tái),實(shí)現(xiàn)千卡級常態(tài)化訓(xùn)練;超大規(guī)模推理平臺(tái)有萬卡級算力池,支撐單日過億次調(diào)用。在火山引擎的云上,MiniMax大模型業(yè)務(wù)實(shí)現(xiàn)快速突破。
火山引擎總裁譚待透露,“國內(nèi)大模型領(lǐng)域的數(shù)十家企業(yè),超過七成已經(jīng)在火山引擎云上”。
除了像MiniMax這類AI技術(shù)公司,火山引擎也在尋求與傳統(tǒng)企業(yè)合作的機(jī)會(huì)。譚待對《鳳凰周刊》記者表示,這是一個(gè)很有挑戰(zhàn)性的事,不僅要有技術(shù)的升級,也要考慮到組織、機(jī)制等方面。目前火山引擎的做法是,找到行業(yè)內(nèi)的標(biāo)桿客戶,加強(qiáng)彼此的了解,推出落地方案。比如和吉利在營銷、座艙、自動(dòng)駕駛等方面都在努力做深度共創(chuàng)。
圖:火山引擎總裁譚待
同時(shí),譚待也表示,火山引擎作為ToB服務(wù)和ToC服務(wù)很不一樣,它需要一個(gè)漫長的積累過程,但在積累過后會(huì)有很強(qiáng)的連續(xù)性。所以短期內(nèi),火山引擎的目標(biāo)是怎么面向客戶創(chuàng)造更多價(jià)值,長期目標(biāo)最終會(huì)回歸商業(yè)本質(zhì),成為一個(gè)盈利的業(yè)務(wù)。而以目前全球領(lǐng)先的云計(jì)算公司盈利性作為參考,他認(rèn)為這是一個(gè)很好的賽道。
關(guān)鍵詞: