近期,國(guó)內(nèi)AI大模型領(lǐng)域呈現(xiàn)出前所未有的活躍度,各大廠商似乎都在全力沖刺,好消息接踵而至。先是智譜,作為大模型領(lǐng)域的“六小虎”之一,成功完成了高達(dá)30億元人民幣的新一輪融資;緊接著,字節(jié)跳動(dòng)推出了豆包視覺(jué)理解模型,而快手也不甘落后,正式上線了可靈1.6版本。
如果說(shuō)2023年被視為大模型的元年,那么2024年則無(wú)疑是AI的應(yīng)用之年。這一年,深度推理逐漸成為主流,AI Agent成為新的風(fēng)口,多模態(tài)模型如雨后春筍般涌現(xiàn),AI產(chǎn)品的迭代速度之快,讓人目不暇接。然而,從AI爆發(fā)至今,國(guó)內(nèi)AI領(lǐng)域的發(fā)展其實(shí)還不到兩年的時(shí)間。這短短的一年,對(duì)于AI來(lái)說(shuō),仿佛是跨越了十年的歷程。
盡管算力被視為AI發(fā)展的關(guān)鍵因素,但今年開(kāi)始,國(guó)內(nèi)AI領(lǐng)域?qū)λ懔Φ囊蕾囁坪跽跍p弱。過(guò)去,各大廠商通過(guò)提升算力和參數(shù)規(guī)模來(lái)迅速占領(lǐng)市場(chǎng)份額,但如今,隨著行業(yè)的快速迭代,僅靠這些已經(jīng)難以真正超越同行。再加上大模型的訓(xùn)練和運(yùn)營(yíng)需要大量的算力和資金投入,這對(duì)目前還難以盈利的AI廠商來(lái)說(shuō),無(wú)疑是一大挑戰(zhàn)。
以字節(jié)跳動(dòng)為例,據(jù)報(bào)道,僅2024年,其在AI上的投入就高達(dá)800億元人民幣,幾乎達(dá)到了BAT三家資本開(kāi)支的總和。而最新消息顯示,其2025年的資本開(kāi)支將達(dá)到驚人的1600億元人民幣,其中約900億元人民幣將用于AI算力的采購(gòu)。即便是ChatGPT,也一直在為算力緊缺所困擾。微軟不惜耗費(fèi)巨資,使用上萬(wàn)張英偉達(dá)A100芯片打造超算平臺(tái),只為給ChatGPT和新版必應(yīng)提供更好的算力。
然而,從長(zhǎng)遠(yuǎn)來(lái)看,算力并不能構(gòu)成真正的護(hù)城河。它更多地體現(xiàn)為硬件層面的核心競(jìng)爭(zhēng)力,而真正決定AI模型表現(xiàn)的是算力和訓(xùn)練語(yǔ)料。這兩者都取決于經(jīng)濟(jì)實(shí)力。早在去年,谷歌內(nèi)部在討論如何應(yīng)對(duì)ChatGPT時(shí),就有工程師表示,谷歌并沒(méi)有護(hù)城河,OpenAI也沒(méi)有。開(kāi)源AI模型的發(fā)展之迅速,使其很難形成強(qiáng)技術(shù)壁壘。
目前國(guó)內(nèi)AI大模型的現(xiàn)狀也是如此,各公司的模型雖然強(qiáng)弱不一,但核心功能普遍同質(zhì)化,替代品眾多。模型之間的差異性并不具有決定性。某個(gè)廠商推出的新功能,其他廠商很快就能跟上。例如,Kimi雖然最初沒(méi)有內(nèi)部數(shù)據(jù),靠調(diào)用他人的搜索結(jié)果,但憑借其長(zhǎng)文本能力,也成功進(jìn)入了國(guó)內(nèi)AI大模型的第一梯隊(duì)。然而,如今長(zhǎng)文本已經(jīng)成為大多數(shù)AI搜索產(chǎn)品的基本能力。
隨著AI領(lǐng)域的競(jìng)爭(zhēng)日益激烈,下半年開(kāi)始,關(guān)鍵詞逐漸從“模型層”轉(zhuǎn)向“應(yīng)用層”。華爾街明星基金經(jīng)理Cathie Wood曾表示,在基礎(chǔ)設(shè)施建設(shè)的階段,硬件廠商往往表現(xiàn)出更大的增長(zhǎng)空間,但一旦這個(gè)階段完成,市場(chǎng)的關(guān)注點(diǎn)就會(huì)轉(zhuǎn)向軟件和應(yīng)用。
過(guò)去一年,國(guó)內(nèi)各家大模型廠商在通用場(chǎng)景的模型能力上缺乏辨識(shí)度。雖然細(xì)分技術(shù)方向眾多,如Kimi早期的長(zhǎng)文本、AI搜索產(chǎn)品主打的深度推理、近期開(kāi)始起風(fēng)的多模態(tài)以及最近熱門的視覺(jué)大模型等,但同質(zhì)化嚴(yán)重的問(wèn)題早已懸在AI產(chǎn)品們的頭頂。例如,12月18日,豆包視覺(jué)理解模型正式發(fā)布,主要聚焦在圖片內(nèi)容識(shí)別、理解和推理能力以及視覺(jué)描述與創(chuàng)作能力上。然而,就在兩天前,Kimi才剛剛發(fā)布了Kimi視覺(jué)思考版,針對(duì)的也是基礎(chǔ)科學(xué)領(lǐng)域的圖片理解和推理能力。
既然技術(shù)上沒(méi)有護(hù)城河,那么從應(yīng)用場(chǎng)景角度進(jìn)攻是否能找到破圈點(diǎn)呢?大模型始終是個(gè)底座,想要真正看到爆發(fā)點(diǎn),必須讓AI真正與普通人強(qiáng)相關(guān)。未來(lái)能否出現(xiàn)殺手級(jí)別的應(yīng)用,將是各家決出勝負(fù)的關(guān)鍵。李彥宏多次強(qiáng)調(diào),“沒(méi)有應(yīng)用,基礎(chǔ)模型一文不值。”然而,至少到2024年,我們還看不到這樣的火花。
盡管AIGC技術(shù)在某些領(lǐng)域取得了進(jìn)展,如快手聯(lián)手知名影視工作者與AIGC創(chuàng)作者合作生成電影短片,以及在獨(dú)立游戲領(lǐng)域的廣泛應(yīng)用等,但整體上AIGC仍處于發(fā)展階段。生成內(nèi)容的質(zhì)量、穩(wěn)定性和可控性等方面仍存在不足,再加上AIGC的應(yīng)用場(chǎng)景相對(duì)有限,且多為輔助性工具,未能形成獨(dú)立且廣泛的應(yīng)用場(chǎng)景,難以滿足大規(guī)模用戶的需求。
在硬件端,以手機(jī)大模型為例,也不免出現(xiàn)同質(zhì)化的情況。目前,AI手機(jī)在實(shí)際的AI體驗(yàn)上,主要變化還是在語(yǔ)音交互、圖像處理和通話增強(qiáng)上。幾乎所有頭部手機(jī)廠商都在對(duì)語(yǔ)音交互進(jìn)行升級(jí),號(hào)稱要將之前的語(yǔ)音助手打造成更智能的AI Agent。然而,正如創(chuàng)新工場(chǎng)聯(lián)合CEO汪華所言,現(xiàn)在整個(gè)AI才出來(lái)一年半的時(shí)間,大家就指望AI的產(chǎn)品形態(tài)被探索出來(lái),顯然是不現(xiàn)實(shí)的。真正做應(yīng)用,還需要更多的時(shí)間。