在科技領(lǐng)域的浪潮中,12月中旬成為了各大AI大模型廠商競相發(fā)布新成果的高光時刻。先是智譜,作為大模型領(lǐng)域的六小虎之一,宣布完成了高達(dá)30億元的新一輪融資;緊接著,字節(jié)跳動推出了豆包視覺理解模型,而快手也正式上線了可靈1.6版本。
如果說2023年標(biāo)志著大模型技術(shù)的元年,那么2024年則被視為AI應(yīng)用落地的重要一年。從深度推理技術(shù)的崛起,到AI Agent成為新的風(fēng)口,再到多模態(tài)模型的層出不窮,AI產(chǎn)品的迭代速度之快,讓人幾乎忘記了從爆發(fā)至今,國內(nèi)AI領(lǐng)域的發(fā)展還不足兩年時間。AI領(lǐng)域的一年進(jìn)步,相當(dāng)于人間的十年變遷。
然而,盡管被視為互聯(lián)網(wǎng)級別的變革產(chǎn)品,AI至今仍未迎來真正的爆發(fā)時刻。上半年,算力還是國內(nèi)討論大模型發(fā)展的核心要素。在百模大戰(zhàn)如火如荼的那段日子,通過增加參數(shù)來迅速搶占市場份額,是許多領(lǐng)先大模型的共同策略。但從今年開始,國內(nèi)外大模型的發(fā)展似乎遇到了瓶頸,特別是下半年,大廠推出新大模型的消息越來越少。這并不意味著百模大戰(zhàn)即將結(jié)束,而是各大廠商開始意識到,隨著行業(yè)的快速迭代,僅靠提升算力和參數(shù)規(guī)模已難以真正超越競爭對手。
大模型的訓(xùn)練和運營需要巨額的算力和資金投入,這種投入需要持續(xù)進(jìn)行,對于目前尚未找到成熟商業(yè)模式的廠商來說,無疑是一大挑戰(zhàn)。以字節(jié)跳動為例,據(jù)報道,僅在2024年,字節(jié)在AI領(lǐng)域的投入就達(dá)到了800億元,幾乎相當(dāng)于BAT三家公司資本開支的總和。而其2025年的資本開支更是驚人,預(yù)計將達(dá)到1600億元,其中約900億元將用于AI算力的采購。
即便是ChatGPT,也一直在為算力緊缺所困擾。據(jù)報道,微軟為了給ChatGPT和新版必應(yīng)提供更好的算力,耗資數(shù)億美元,使用了上萬張英偉達(dá)A100芯片打造超算平臺。微軟還在Azure的60多個數(shù)據(jù)中心部署了幾十萬張GPU,用于ChatGPT的推理。
然而,從長遠(yuǎn)來看,算力并不能構(gòu)成真正的護(hù)城河,它更多體現(xiàn)的是硬件層面的核心競爭力。誰的算力更強,訓(xùn)練語料更豐富,誰的模型表現(xiàn)就更好。但算力依賴于GPU性能和數(shù)據(jù)中心建設(shè),訓(xùn)練語料依賴于公開的數(shù)據(jù)集,兩者最終都取決于經(jīng)濟(jì)實力。谷歌內(nèi)部在討論如何應(yīng)對ChatGPT時,曾有工程師表示,谷歌和OpenAI都沒有真正的護(hù)城河。即使谷歌全力投入,也可能贏不了這場AI競賽。
目前國內(nèi)大模型的現(xiàn)狀也印證了這一點。各公司的模型雖然強弱不一,但核心功能普遍同質(zhì)化,替代品眾多。一個新功能推出后,很快就會被其他廠商追上。例如,Kimi最初雖然依靠長文本功能成功進(jìn)入了國內(nèi)AI大模型的第一梯隊,但如今長文本已成為大多數(shù)AI搜索產(chǎn)品的基本能力。
隨著AI領(lǐng)域的焦點從“模型層”轉(zhuǎn)向“應(yīng)用層”,各家廠商開始探索AI在不同場景下的應(yīng)用。然而,同質(zhì)化問題仍然是AI產(chǎn)品頭頂?shù)倪_(dá)摩克里斯之劍。例如,豆包視覺理解模型發(fā)布時,媒體聲勢浩大,但就在兩天前,Kimi才剛剛發(fā)布了針對基礎(chǔ)科學(xué)領(lǐng)域圖片理解和推理能力的Kimi視覺思考版。
在技術(shù)上難以形成護(hù)城河的情況下,從應(yīng)用場景角度進(jìn)攻能否找到破圈點呢?大模型始終是個底座,要想真正看到爆發(fā)點,必須讓AI與普通人產(chǎn)生強關(guān)聯(lián)。業(yè)內(nèi)人士指出,未來能否出現(xiàn)殺手級別的應(yīng)用,將是決定各家勝負(fù)的關(guān)鍵。李彥宏也曾多次強調(diào),“沒有應(yīng)用,基礎(chǔ)模型一文不值?!?/p>
然而,目前AI應(yīng)用的發(fā)展還遠(yuǎn)未達(dá)到能夠催生出下一個iPhone時代的程度。盡管AIGC技術(shù)在某些領(lǐng)域取得了進(jìn)展,如快手與知名影視工作者合作,用可靈生成電影短片,以及在獨立游戲領(lǐng)域的廣泛應(yīng)用,但整體上AIGC仍處于發(fā)展階段,生成內(nèi)容的質(zhì)量、穩(wěn)定性和可控性等方面仍存在不足。
在硬件端,以手機(jī)大模型為例,也出現(xiàn)了同質(zhì)化的情況。目前AI手機(jī)在AI體驗上的主要變化集中在語音交互、圖像處理和通話增強上。幾乎所有頭部手機(jī)廠商都在對語音交互進(jìn)行升級,號稱要將之前的語音助手打造成更智能的AI Agent。然而,正如創(chuàng)新工場聯(lián)合CEO汪華所言,現(xiàn)在AI才出來一年半的時間,就指望AI的產(chǎn)品形態(tài)被探索出來,顯然是不現(xiàn)實的。
AI應(yīng)用之所以受到如此重視,一個重要原因是市場亟需看到AI技術(shù)能轉(zhuǎn)化為可落地的商業(yè)模式。隨著大量資金涌入AI領(lǐng)域,投資者對AI項目的回報要求越來越高。他們希望AI企業(yè)能夠盡快實現(xiàn)技術(shù)的商業(yè)化應(yīng)用。然而,目前AI產(chǎn)品的盈利模式仍然有限,主要是付費訂閱和廣告。對于對話類AI產(chǎn)品來說,賺錢確實有一定壓力。
盡管豆包的用戶規(guī)模在過去幾個月有所增長,但和其他AI對話形態(tài)的產(chǎn)品一樣,其在使用時長、打開頻次及商業(yè)化潛力上仍不夠理想。字節(jié)管理層判斷AI對話類產(chǎn)品可能只是AI產(chǎn)品的“中間態(tài)”,長期更理想的產(chǎn)品形式可能需要更視覺化的用戶體驗、更低的用戶使用門檻。因此,字節(jié)已經(jīng)提升了即夢的產(chǎn)品優(yōu)先級,嘗試用新的路徑打造AI時代的“抖音”。
盡管如此,只要有活躍的用戶和可持續(xù)的使用價值,AI對話類產(chǎn)品的重要性就仍然存在。事實上,縱觀目前其他對話類產(chǎn)品,字節(jié)的友商們也并不急于將對話類AI當(dāng)作商業(yè)化的重要組成部分。百度副總裁在談及生成式AI的商業(yè)場景時就曾表示,要先滿足用戶需求,才能更好地滿足商業(yè)需求。