隨著歲末鐘聲的臨近,大模型行業(yè)迎來了一個前所未有的熱鬧時期。從11月中旬開始,科技巨頭們紛紛召開與大模型相關的發(fā)布會,推出了一系列創(chuàng)新成果,其中OpenAI的12天連續(xù)直播更是成為了行業(yè)的焦點。
回顧這一個月,OpenAI無疑是最大的亮點。其相繼發(fā)布的o1和o3模型,在推理AI領域掀起了一場競賽。o3模型在數(shù)學、編碼以及博士級科學問題上的卓越表現(xiàn),令業(yè)界為之驚嘆。例如,在EpochAI Frontier Math這一由60余位全球數(shù)學家共同推出的數(shù)學基準測試中,o3創(chuàng)下了25.2%的準確率新高,遠超其他模型。這一成就不僅驗證了OpenAI的技術實力,也為整個行業(yè)樹立了新的標桿。
然而,推理AI競賽的戰(zhàn)火并未就此平息。在OpenAI發(fā)布o3之前,國內(nèi)外科技公司就已經(jīng)在緊鑼密鼓地追趕o1。谷歌推出的Gemini 2.0 Flash Thinking、月之暗面的k0-math、DeepSeek的DeepSeek-R1-Lite以及阿里云的QwQ-32B-Preview等模型,都在數(shù)學和編碼評估中取得了不俗的成績。盡管目前尚不清楚o3是否能為普通用戶帶來顯著幫助,且推理模型的成本仍然高昂,但清華NLP實驗室劉知遠教授團隊提出的密度定律,預示著未來推理成本有望快速降低。
除了技術層面的競爭,大模型行業(yè)還掀起了一場價格戰(zhàn)。繼5月和9月之后,OpenAI和火山引擎再次掀起了第三輪價格戰(zhàn)。OpenAI針對GPT-4o音頻模型大幅降價,音頻價格降低了60%,文本價格也大幅下降。而火山引擎則把價格戰(zhàn)帶到了視頻模型上,其發(fā)布的豆包視覺理解模型輸入價格低至每千tokens 0.003元,比行業(yè)平均價格降低了85%。這一輪價格戰(zhàn)不僅降低了用戶的成本負擔,也加速了AI技術的普及和應用。
在應用層面,大模型也迎來了爆發(fā)期。隨著計算成本的下降和基礎模型選項的增加,大模型應用層進入了一個飛速發(fā)展的階段。初創(chuàng)公司們紛紛采用“通用大模型套垂直小模型”的雞尾酒打法,推出了各種創(chuàng)新應用。AI玩具、AI耳機、AI眼鏡等軟硬件產(chǎn)品層出不窮,為用戶帶來了全新的體驗。同時,AI Agent和AI搜索也成為了大模型應用層的兩大熱門方向。AI Agent以其交互性、自動化和主動性等特點,受到了廣泛關注;而AI搜索則因為離錢更近,成為了商業(yè)化競爭的焦點。
然而,在熱鬧的背后,大模型行業(yè)也面臨著諸多挑戰(zhàn)。一方面,如何平衡以價換量與利潤表現(xiàn),成為了模型廠商們需要回答的核心問題。另一方面,商業(yè)模式的不成熟也制約了大模型應用的進一步發(fā)展。在C端市場,智能體尚未形成新的商業(yè)模式;在B端市場,收集現(xiàn)實世界數(shù)據(jù)、編碼領域和應用特定的認知架構等挑戰(zhàn)也擺在了玩家們的面前。人才的整合和分化也是大模型行業(yè)需要面對的問題。隨著競爭的加劇,一些初創(chuàng)公司開始尋求退場或倒閉,而大型科技公司和頭部企業(yè)的整合速度也在加快。
盡管如此,大模型行業(yè)的發(fā)展勢頭依然強勁。資金大分裂的繼續(xù)使得富人和窮人之間的差距越來越大,但這也為行業(yè)帶來了更多的機遇和挑戰(zhàn)。在融資熱潮中,一些明星AI企業(yè)紛紛拿到了過冬錢,加碼技術研發(fā)和基礎設施建設。而尋求退場或倒閉的初創(chuàng)公司則成為了行業(yè)整合的犧牲品。大型科技公司和頭部企業(yè)則通過收購和整合來增強自身的競爭力。
在人才方面,大模型行業(yè)的整合和分化也在持續(xù)進行。一些人員選擇回流大廠或再創(chuàng)業(yè),而一些初創(chuàng)公司則面臨著人才流失的困境。然而,可以肯定的是,隨著技術的不斷進步和應用的不斷拓展,大模型行業(yè)將繼續(xù)保持蓬勃發(fā)展的態(tài)勢。在這個充滿機遇和挑戰(zhàn)的時代里,只有不斷創(chuàng)新和進取的企業(yè)才能脫穎而出。