滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

谷歌DeepMind新突破：AI模型推理性能大幅提升，計(jì)算效率不減

時(shí)間：2024-12-28 14:20:48 來源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評論無障礙通道

近日，谷歌旗下的DeepMind團(tuán)隊(duì)宣布了一項(xiàng)名為“可微緩存增強(qiáng)”的創(chuàng)新技術(shù)，這一技術(shù)旨在優(yōu)化大型語言模型（LLMs）的推理性能，同時(shí)避免大幅增加計(jì)算成本。

在自然語言處理、數(shù)學(xué)運(yùn)算及邏輯推理等領(lǐng)域，大型語言模型已成為解決復(fù)雜問題的關(guān)鍵工具。隨著技術(shù)的不斷進(jìn)步，研究人員致力于提升這些模型的數(shù)據(jù)處理能力，使其能夠生成更精確、更符合上下文的響應(yīng)。然而，隨著模型復(fù)雜度的增加，如何在有限的計(jì)算資源下保持高效運(yùn)行成為一大挑戰(zhàn)。

一個(gè)顯著的問題是，現(xiàn)有的大型語言模型往往難以在不同任務(wù)間進(jìn)行有效的推理，或執(zhí)行超出其預(yù)訓(xùn)練架構(gòu)的計(jì)算。為了提高模型性能，研究人員通常會(huì)嘗試在任務(wù)處理過程中生成中間步驟，但這通常會(huì)導(dǎo)致延遲增加和計(jì)算效率低下。這一限制嚴(yán)重影響了模型執(zhí)行復(fù)雜推理任務(wù)的能力，特別是那些需要長距離依賴關(guān)系或高精度預(yù)測的任務(wù)。

“可微緩存增強(qiáng)”技術(shù)通過引入一個(gè)經(jīng)過訓(xùn)練的協(xié)處理器，以潛在嵌入的方式增強(qiáng)LLMs的鍵值（kv）緩存，從而豐富了模型的內(nèi)部記憶。這一方法的關(guān)鍵在于，保持基礎(chǔ)LLMs不變，同時(shí)異步訓(xùn)練協(xié)處理器。通過這種方式，研究團(tuán)隊(duì)成功地在不犧牲計(jì)算效率的情況下，顯著提升了模型性能。

整個(gè)處理流程分為三個(gè)關(guān)鍵階段：首先，凍結(jié)的LLMs從輸入序列中生成kv緩存；接著，協(xié)處理器利用可訓(xùn)練軟令牌處理這些kv緩存，生成潛在嵌入；最后，增強(qiáng)的kv緩存被反饋回LLMs，以生成更豐富的輸出。這一創(chuàng)新方法不僅簡化了模型處理復(fù)雜任務(wù)的過程，還提高了其準(zhǔn)確性和效率。

在Gemma-2 2B模型上的測試結(jié)果顯示，“可微緩存增強(qiáng)”技術(shù)在多個(gè)基準(zhǔn)測試中均取得了顯著成果。例如，在GSM8K數(shù)據(jù)集上，準(zhǔn)確率提高了10.05%；在MMLU基準(zhǔn)測試中，性能提升了4.70%。該方法還顯著降低了模型在多個(gè)標(biāo)記位置的困惑度，進(jìn)一步證明了其有效性。

DeepMind的這一研究成果為大型語言模型的推理能力增強(qiáng)提供了新的視角和解決方案。通過引入外部協(xié)處理器來增強(qiáng)kv緩存，研究團(tuán)隊(duì)在保持計(jì)算效率的同時(shí)，實(shí)現(xiàn)了模型性能的顯著提升，為LLMs處理更復(fù)雜、更具挑戰(zhàn)性的任務(wù)奠定了堅(jiān)實(shí)基礎(chǔ)。

舉報(bào) 0 收藏 0 打賞 0評論 0

更多>同類資訊

谷歌Android XR SDK預(yù)覽版發(fā)布：雙空間模式+多模態(tài)輸入，沉浸式體驗(yàn)再升級！

12-28

亞馬遜與007女掌門決裂，邦德電影未來何去何從？

12-28

中國航發(fā)集團(tuán)自研600公斤推力渦扇發(fā)動(dòng)機(jī)，助力無人機(jī)能力大飛躍！

12-28

臺積電獨(dú)家接單？高通二代驍龍8至尊芯片或棄三星工藝

12-28

小米15系列新體驗(yàn)上線：澎湃OS 2內(nèi)測大升級，米粉準(zhǔn)備好了嗎？

12-28

微軟Microsoft 365應(yīng)用升級，Copilot成品牌核心打造AI新帝國？

12-28

星地激光通信新突破！我國成功傳輸100Gbps超高速高分辨率遙感影像

12-28

近距離接觸！嫦娥五號月球樣品展今日亮相北京天文館

12-28

白酒業(yè)呼吁減少內(nèi)卷，專家力推優(yōu)質(zhì)優(yōu)價(jià)模式，能否引領(lǐng)行業(yè)新風(fēng)尚？

12-28

紫光展銳W337：國產(chǎn)智能穿戴芯片性能躍升，功能全面升級

12-28

江蘇國補(bǔ)在線申，iPhone 15 Pro Max直降六折起，年貨節(jié)紅包等你拿！

12-28

臺積電獨(dú)攬高通驍龍8 Elite 2代工，3納米N3P工藝助力性能飛躍

12-28

財(cái)經(jīng)記者脫口秀2024：在周期變換中，看見未來，守候花開

12-28

勁方醫(yī)藥赴港上市：半年虧損4.5億，估值達(dá)31億，股東陣容強(qiáng)大

12-28

海螺材料上市在即：上半年?duì)I收破11億，股東結(jié)構(gòu)曝光

12-28

點(diǎn)擊查看更多 +

全站最新

《黑暗之眼：桑緹娜夫的羈絆》GOG平臺限時(shí)免費(fèi)領(lǐng)，冒險(xiǎn)迷不容錯(cuò)過！

英偉達(dá)RTX 5090顯卡曝光：29相供電與超大GPU核心引關(guān)注

Epic神秘游戲連送九天，《風(fēng)火輪：爆發(fā)》今日免費(fèi)領(lǐng)！

LG顯示器未來規(guī)劃曝光：多款OLED面板新品將陸續(xù)面世

國內(nèi)首臺磁懸浮離心式地源熱泵運(yùn)行，節(jié)電30%引領(lǐng)綠色供暖革命！

小米米家3D界面亮相：動(dòng)態(tài)可視化，智能設(shè)備管理更直觀！

熱門內(nèi)容

本欄最新

臺積電獨(dú)家接單？高通二代驍龍8至尊芯片或棄三星工藝

小米15系列新體驗(yàn)上線：澎湃OS 2內(nèi)測大升級，米粉準(zhǔn)備好了嗎？

微軟Microsoft 365應(yīng)用升級，Copilot成品牌核心打造AI新帝國？

近距離接觸！嫦娥五號月球樣品展今日亮相北京天文館

白酒業(yè)呼吁減少內(nèi)卷，專家力推優(yōu)質(zhì)優(yōu)價(jià)模式，能否引領(lǐng)行業(yè)新風(fēng)尚？

紫光展銳W337：國產(chǎn)智能穿戴芯片性能躍升，功能全面升級

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

亚洲天堂在线视频,香港三级日本三级少妇三级,伊人色综合久久天天小片,亚洲中文字幕αv天堂

谷歌DeepMind新突破：AI模型推理性能大幅提升，計(jì)算效率不減

谷歌DeepMind新突破：AI模型推理性能大幅提升，計(jì)算效率不減