【ITBEAR科技資訊】7月18日消息,蘋果公司近日通過知名科技媒體9to5Mac平臺發(fā)表正式聲明,就外界廣泛關(guān)注的OpenELM開源AI模型訓(xùn)練過程中使用爭議性YouTube資源一事進(jìn)行了澄清。蘋果公司明確指出,OpenELM模型并未被應(yīng)用于任何除研究以外的AI或機(jī)器學(xué)習(xí)項目,包括其內(nèi)部的Apple Intelligence項目。
據(jù)非營利性新聞工作室ProofNews近期發(fā)布的深度調(diào)查報告顯示,蘋果在開發(fā)OpenELM模型時,確實采用了名為YouTube Subtitles的龐大數(shù)據(jù)集,該數(shù)據(jù)集規(guī)模達(dá)到5.7GB,包含約4.89億個單詞,源自超過48000個頻道的173536個YouTube視頻的字幕內(nèi)容。尤為引人注目的是,這一數(shù)據(jù)集中還涵蓋了12000多個已被YouTube平臺刪除的視頻字幕。
蘋果公司在其最新聲明中重申了OpenELM模型的初衷與定位,即致力于為研究社區(qū)提供有力支持,并推動開源大型語言模型的持續(xù)發(fā)展。蘋果的研究人員曾高度評價OpenELM為“最先進(jìn)的開放式語言模型”,充分展現(xiàn)了其在該領(lǐng)域的創(chuàng)新實力與前瞻視野。
蘋果公司強(qiáng)調(diào)OpenELM模型僅用于科學(xué)研究目的,并未涉足任何商業(yè)化的Apple Intelligence功能。同時,該模型以開源形式發(fā)布,為全球開發(fā)者提供了自由獲取與探索的寶貴資源。
此外,蘋果還透露,目前并無構(gòu)建新版OpenELM模型的明確計劃。