近日,業(yè)界傳出消息稱,小米公司或?qū)⒂瓉硪晃辉谧匀徽Z言處理領(lǐng)域極具影響力的新成員——DeepSeek開源大模型DeepSeek-V2的核心開發(fā)者羅福莉。據(jù)可靠消息源透露,羅福莉有望加入小米AI實驗室,擔任領(lǐng)導小米大模型團隊的重任。
羅福莉的教育背景頗為亮眼,她在北京大學計算語言學研究所完成了碩士學業(yè),并在自然語言處理領(lǐng)域深耕多年,取得了諸多令人矚目的研究成果。在阿里巴巴達摩院機器智能實驗室工作期間,她主導開發(fā)了多語言預訓練模型VECO,該模型成功融入了阿里達摩院的深度語言模型體系AliceMind,為阿里巴巴在自然語言處理領(lǐng)域的發(fā)展貢獻了重要力量。
2022年,羅福莉選擇離開阿里巴巴,加入了DeepSeek團隊,并參與了MoE大模型DeepSeek-V2的研發(fā)工作。此次她或?qū)⑥D(zhuǎn)戰(zhàn)小米,無疑將為小米在大模型領(lǐng)域的發(fā)展注入新的活力。
據(jù)了解,小米AI實驗室自2016年成立以來,已匯聚了一支約250人的專業(yè)團隊,致力于多個AI技術(shù)方向的探索與研究。2023年4月,小米更是成立了專門的大模型團隊,由欒劍擔任團隊負責人,以加速小米在大模型領(lǐng)域的發(fā)展步伐。
然而,小米在大模型領(lǐng)域的發(fā)力相對較晚,這也引起了小米創(chuàng)始人雷軍的深刻反思。為了彌補這一短板,雷軍親自出馬,不惜重金招募能夠引領(lǐng)小米大模型發(fā)展的人才。據(jù)悉,此次為了吸引羅福莉的加入,小米開出了千萬元級別的薪酬,足見其對大模型領(lǐng)域的重視程度。
目前,小米的大模型技術(shù)已取得了顯著進展,主要聚焦于模型的輕量化和本地部署。公司成功研發(fā)出了MiLM系列模型,并已升級至第二代MiLM2。部分模型已在小米的產(chǎn)品中得到了實際應用,為用戶帶來了更加智能、便捷的體驗。
隨著羅福莉的加入,小米在大模型領(lǐng)域的發(fā)展或?qū)⒂瓉硇碌耐黄?。我們期待小米能夠在AI技術(shù)的浪潮中,不斷前行,為用戶帶來更多創(chuàng)新、實用的產(chǎn)品和服務。