在近期于中關(guān)村論壇系列活動(dòng)框架內(nèi)舉辦的第12屆數(shù)字金融與科技金融大會(huì)上,螞蟻數(shù)科憑借其在Deepfake檢測技術(shù)上的突破,成功吸引了業(yè)界的廣泛關(guān)注。其Deepfake檢測方案被大會(huì)評選為“金融科技技術(shù)創(chuàng)新與應(yīng)用案例”,標(biāo)志著螞蟻數(shù)科在這一領(lǐng)域的領(lǐng)先地位。
螞蟻數(shù)科通過旗下的天璣實(shí)驗(yàn)室,首次在金融行業(yè)內(nèi)構(gòu)建了一個(gè)大規(guī)模、高質(zhì)量且包含多種模態(tài)的Deepfake數(shù)據(jù)集。該數(shù)據(jù)集合成了超過百萬級的多媒體內(nèi)容,全面模擬了金融風(fēng)控環(huán)境中可能遭遇的Deepfake攻擊,為評估現(xiàn)有金融領(lǐng)域Deepfake檢測模型的性能提供了重要基準(zhǔn)。在實(shí)際金融業(yè)務(wù)場景中,螞蟻數(shù)科的Deepfake檢測方案在多個(gè)測試數(shù)據(jù)集上均達(dá)到了98%以上的準(zhǔn)確率,有效阻止了多起利用Deepfake技術(shù)進(jìn)行的欺詐行為,有力保障了用戶的財(cái)產(chǎn)安全。
這一數(shù)據(jù)集的推出,解決了金融領(lǐng)域Deepfake檢測模型長期以來面臨的大規(guī)模訓(xùn)練及真實(shí)環(huán)境測評難題。同時(shí),從多模態(tài)分析的角度出發(fā),該數(shù)據(jù)集也推動(dòng)了傳統(tǒng)檢測模型的進(jìn)一步發(fā)展。目前,該數(shù)據(jù)集已成為螞蟻數(shù)科反深偽產(chǎn)品ZOLOZ Deeper對外服務(wù)客戶的核心競爭力。
螞蟻數(shù)科在構(gòu)建這一數(shù)據(jù)集時(shí),采用了多達(dá)81種先進(jìn)的Deepfake技術(shù),生成了高質(zhì)量的合成圖像。這些圖像涵蓋了多種偽造技術(shù)類型、復(fù)雜光照條件、背景環(huán)境和面部表情,從而能夠模擬出復(fù)雜且逼真的真實(shí)世界攻擊環(huán)境。除了靜態(tài)圖像外,螞蟻數(shù)科還收集并生成了大量包含聲音的視頻數(shù)據(jù),涵蓋了100多種偽造技術(shù)類型,并考慮了不同語種、口音和背景噪音的多樣性,進(jìn)一步確保了數(shù)據(jù)集的全面性和復(fù)雜性。
在數(shù)據(jù)預(yù)處理和標(biāo)注階段,螞蟻數(shù)科對收集到的數(shù)據(jù)進(jìn)行了嚴(yán)格的清洗和預(yù)處理,確保了數(shù)據(jù)的高質(zhì)量。同時(shí),螞蟻數(shù)科還組建了專家團(tuán)隊(duì)對數(shù)據(jù)進(jìn)行標(biāo)注,明確了每張圖像或每個(gè)視頻是否為Deepfake生成的內(nèi)容,并盡可能減少了偽造痕跡,以達(dá)到高度逼真的效果。螞蟻數(shù)科此前發(fā)布的AI數(shù)據(jù)合成與生產(chǎn)平臺,在數(shù)據(jù)標(biāo)注層面實(shí)現(xiàn)了“AI主導(dǎo)”,顯著降低了人工標(biāo)注的工作量,標(biāo)注模型依賴人工標(biāo)注量降低了70%以上。
為了進(jìn)一步驗(yàn)證和評估Deepfake數(shù)據(jù)集的有效性,螞蟻數(shù)科在2024外灘大會(huì)上發(fā)起了一場Deepfake攻防挑戰(zhàn)賽。該比賽以Deepfake數(shù)據(jù)集為基礎(chǔ)訓(xùn)練和測試數(shù)據(jù),吸引了來自全球26個(gè)國家和地區(qū)的2200多名選手報(bào)名參賽。通過選手們貢獻(xiàn)的算法方案,Deepfake數(shù)據(jù)集的攻擊質(zhì)量和檢測難度得到了全面而有效的驗(yàn)證。
隨著人工智能技術(shù)的快速發(fā)展,Deepfake技術(shù)也在不斷進(jìn)步。該技術(shù)利用深度學(xué)習(xí)算法,能夠?qū)崿F(xiàn)對視頻中人臉的逼真替換。盡管Deepfake在娛樂和傳媒等領(lǐng)域有著廣泛的應(yīng)用前景,但在金融領(lǐng)域,特別是身份驗(yàn)證和交易驗(yàn)證環(huán)節(jié),Deepfake技術(shù)卻帶來了新的安全挑戰(zhàn)。金融機(jī)構(gòu)的身份驗(yàn)證系統(tǒng)通常依賴于生物識別技術(shù),如人臉識別。一旦這些系統(tǒng)被Deepfake技術(shù)所攻破,將可能引發(fā)嚴(yán)重的金融欺詐事件。因此,開發(fā)針對Deepfake攻擊的檢測系統(tǒng),對于金融領(lǐng)域來說具有至關(guān)重要的意義。
然而,構(gòu)建強(qiáng)大的Deepfake檢測防御模型,需要高質(zhì)量且符合真實(shí)世界環(huán)境的人臉Deepfake數(shù)據(jù)集。因此,如何構(gòu)建模擬真實(shí)世界的數(shù)據(jù)集,以及如何驗(yàn)證其有效性,成為了當(dāng)前亟待解決的問題。螞蟻數(shù)科在這一領(lǐng)域的突破,無疑為金融行業(yè)的Deepfake檢測技術(shù)發(fā)展提供了新的思路和方向。