
在大模型如火如荼地發(fā)展一年后,外界眼中火熱的AI行業(yè)究竟現(xiàn)狀如何?未來將走向何方?
“目前大模型還在快速迭代階段,我們還沒有看到上限。”12月4日,上海AI獨(dú)角獸企業(yè)稀宇科技(MiniMax)副總裁劉華在接受澎湃新聞?dòng)浾卟稍L時(shí)坦言,“我們沒感覺到Scaling Law(尺度定律)放緩,也不同意大模型在技術(shù)上正在面臨天花板?!?/p>
MiniMax成立于2021年12月,旗下具備文本、語音、音樂、圖像和視頻等多模態(tài)大模型。一個(gè)值得關(guān)注的亮點(diǎn)是,在AI出海方面,MiniMax走在了國內(nèi)最前列。最新數(shù)據(jù)顯示,MiniMax旗下海螺AI海外版登頂10月AI產(chǎn)品全球增速榜,月訪問量達(dá)1173萬,同比增長高達(dá)2772.92%。
“我們從去年就開始開拓海外市場,中國有自己的工程師紅利,也對(duì)產(chǎn)品有更好的理解。在堅(jiān)持技術(shù)驅(qū)動(dòng)的發(fā)展戰(zhàn)略下,和海外AI企業(yè)相比,我們的迭代速度更快?!闭劦匠龊3晒Φ男牡?,劉華坦言。
在他看來,美國在AI大模型技術(shù)方面整體處于領(lǐng)先地位,而在語音、文字等細(xì)分領(lǐng)域,中國大模型追趕速度很快,例如海螺AI和快手旗下的可靈大模型等都在美國有廣泛應(yīng)用,目前在這些領(lǐng)域,兩國技術(shù)水平已達(dá)到不相伯仲的階段。
今年大模型從一開始的熱潮涌動(dòng),又逐漸歸于冷靜,對(duì)于融資、變現(xiàn)、落地等話題的討論始終在持續(xù)。MiniMax如何看待今年AI行業(yè)的整體發(fā)展?
“我們并沒有觀察到AI行業(yè)存在泡沫?!眲⑷A表示,此前很多企業(yè)競相入局基礎(chǔ)大模型,開啟“百模大戰(zhàn)”,確實(shí)在一定程度造成了資源浪費(fèi)和“重復(fù)造輪子”,“行業(yè)的資源應(yīng)該得到有效分配,有實(shí)力做好基礎(chǔ)大模型的企業(yè)并不多。更多企業(yè)適合開發(fā)的是AI應(yīng)用,術(shù)業(yè)有專攻。”
據(jù)他披露, MiniMax的長期目標(biāo),首先是提升大模型實(shí)用性和滲透率,同時(shí)也要降低錯(cuò)誤率。上一代ChatGPT系列模型普遍存在“幻覺”,錯(cuò)誤率達(dá)到30%左右,導(dǎo)致在嚴(yán)肅生產(chǎn)場合無法使用,更多應(yīng)用在文創(chuàng)領(lǐng)域。如果要讓大模型進(jìn)入嚴(yán)肅的生產(chǎn)、研發(fā)、科研、設(shè)計(jì),就要進(jìn)一步降低錯(cuò)誤率,“我們的目標(biāo)是把錯(cuò)誤率從30%降低至2%-3%,為此一直在進(jìn)行各種模型迭代?!?/p>
此外,實(shí)現(xiàn)無限長的輸入和輸出。從文本進(jìn)化到語音和視頻,大模型技術(shù)的進(jìn)化需要更多的數(shù)據(jù)處理量。劉華告訴記者,目前MiniMax最新研發(fā)的,基于MoE + Linear Attention架構(gòu)的abab 7大模型,使得長文本處理效率不斷提高,比起傳統(tǒng)架構(gòu)有顯著優(yōu)化。
第三個(gè)目標(biāo)是堅(jiān)持多模態(tài)。未來大模型將從純文本走向多模態(tài),必然兼具文本、語音、視覺等多重功能。MiniMax將在海螺AI等應(yīng)用上提供更豐富的功能,為藝術(shù)創(chuàng)作持續(xù)賦能,包括后續(xù)會(huì)提升AI視頻生成的時(shí)長,這是重要的努力方向之一。
另一個(gè)業(yè)內(nèi)關(guān)注的話題是大模型卷“投流”帶來的高額廣告支出,部分大模型公司動(dòng)輒投入高達(dá)幾千萬甚至上億的廣告投放費(fèi)用,引起人們關(guān)注。對(duì)此,劉華表示,單純以擴(kuò)大用戶總規(guī)模為目的的投流價(jià)值不大,“對(duì)大模型的研發(fā)來說,最重要的是到底有多少用戶能夠留下,高頻使用大模型,這才是最大的價(jià)值?!?/p>
“如果一味依賴于投流,帶來的最大問題就是客戶黏性和留存度較差。”劉華坦言,這也意味著對(duì)于大模型行業(yè)而言,單純卷投放沒有意義,還是要依靠扎實(shí)的技術(shù)吸引更多的用戶。
算力是大模型發(fā)展不可或缺的要素,大模型需要處理海量的數(shù)據(jù),并且需要在短時(shí)間內(nèi)完成復(fù)雜的計(jì)算任務(wù),這就意味著需要更高的計(jì)算能力,也離不開云計(jì)算廠商的支持。
三年前,MiniMax 就與騰訊云建立合作關(guān)系?!霸缙贏I企業(yè)的需求可能只有幾百卡、幾千卡,現(xiàn)在普遍達(dá)到上萬卡,后續(xù)會(huì)有更大規(guī)模的需求。”騰訊云北區(qū)云原生總經(jīng)理田豐告訴澎湃新聞?dòng)浾?,“算力上的考?yàn)對(duì)于云服務(wù)商的組網(wǎng)能力和集群運(yùn)維能力都會(huì)成為非常巨大的挑戰(zhàn),騰訊云為MiniMax 提供了一系列集計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)為一體的高性能智算產(chǎn)品,讓 MiniMax釋放更多的精力聚焦在模型本身的訓(xùn)練和工程化上?!?/p>
例如,騰訊云高性能計(jì)算集群通過系統(tǒng)化的運(yùn)維機(jī)制,可做到網(wǎng)絡(luò)故障一分鐘內(nèi)發(fā)現(xiàn)問題,三分鐘內(nèi)定位問題,最快五分鐘恢復(fù)系統(tǒng)。其千卡集群的日故障數(shù)已刷新至 0.16,是行業(yè)平均水平的三分之一。騰訊云星脈網(wǎng)絡(luò),可實(shí)現(xiàn)大模型訓(xùn)練過程中,網(wǎng)絡(luò)通信占比(通信時(shí)間占總體時(shí)間比例)低至6%,整體訓(xùn)練效率提升了 20% 以上。
不過,田豐直言,并不是所有的大模型訓(xùn)練廠商都需要1萬卡或是幾萬卡這樣超大的算力集群,并且大集群不等于大算力,智能算力存在比較典型的木桶短板效應(yīng),需要不斷調(diào)整GPU資源利用率和集群通信效能,才能真正優(yōu)化算力的利用率。
“對(duì)于AI大模型的發(fā)展,無論是創(chuàng)業(yè)者還是投資人,都要有充分的耐心和信心,看似炫酷的技術(shù),最終都要落實(shí)到商業(yè)化本身,才能走向盈利。想要指望大模型短期帶來很高價(jià)值的經(jīng)濟(jì)效益可能性并不大,目前仍處于長跑的第一公里階段。”田豐表示。
【申明:本站部分內(nèi)容由第三方發(fā)布,內(nèi)容不代表本網(wǎng)站的觀點(diǎn)和立場。請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本網(wǎng)發(fā)布或轉(zhuǎn)載文章出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其描述。如因作品內(nèi)容、知識(shí)產(chǎn)權(quán)和其它問題需要與本網(wǎng)聯(lián)系的,請(qǐng)發(fā)郵件至josen#zhaomedia.com(#改為@);我們將會(huì)定期收集意見并促進(jìn)解決。】