要聞

AI換臉致虛假信息泛濫中國科學(xué)院自動(dòng)化所董晶：必須建立一套從生成到傳播全鏈路可追溯的可信體系

2026-03-08 23:14:59

一位同時(shí)研究AI生成與檢測(cè)的學(xué)者，如何看待自己所在領(lǐng)域的“貓鼠游戲”？

每經(jīng)記者｜可楊每經(jīng)編輯｜楊軍

人工智能帶來效率提升，倫理安全問題也相伴而生，成為一大隱患。近日，多位代表及委員談及AI（人工智能）給日常生活帶來的風(fēng)險(xiǎn)，例如全國政協(xié)委員靳東就提到“AI換臉”導(dǎo)致“虛假信息滿天飛”，建議出臺(tái)更嚴(yán)厲的細(xì)則進(jìn)行規(guī)范及治理。

一位同時(shí)研究AI生成與檢測(cè)的學(xué)者，如何看待自己所在領(lǐng)域的“貓鼠游戲”？

董晶來自中國科學(xué)院自動(dòng)化所，她同時(shí)也是IEEE（電氣電子工程師學(xué)會(huì)）亞太區(qū)執(zhí)委。IEEE是全球最大的專業(yè)技術(shù)組織，致力于推動(dòng)電氣、電子、計(jì)算機(jī)及通信等領(lǐng)域的技術(shù)創(chuàng)新。

在中國科學(xué)院自動(dòng)化所，董晶的課題組同時(shí)開展兩個(gè)方向的研究：一邊是AI生成技術(shù)，讓機(jī)器學(xué)會(huì)“造人”；一邊是AI檢測(cè)技術(shù)，幫系統(tǒng)精準(zhǔn)辨?zhèn)巍?/p>

“不妨讓二者battle（對(duì)抗）一下：一邊做出生成技術(shù)，另一邊拿去檢測(cè)是否存在安全風(fēng)險(xiǎn)，再據(jù)此迭代優(yōu)化。”董晶說，“這就相當(dāng)于自己跟自己對(duì)抗，一邊造、一邊查，在內(nèi)部形成攻防博弈?！?/p>

作為IEEE亞太區(qū)執(zhí)委、中國科學(xué)院自動(dòng)化所研究員，董晶是專注AI生成與內(nèi)容安全雙向研究的學(xué)者。恰逢婦女節(jié)，她接受了《每日經(jīng)濟(jì)新聞》記者（以下簡稱NBD）專訪，聊了聊AI人臉技術(shù)從平面到立體的躍遷，也聊了聊AI飛速發(fā)展的“矛與盾”，以及給想要進(jìn)入AI行業(yè)的年輕人提出了一些建議。

中國科學(xué)院自動(dòng)化所研究員董晶。圖片來源：受訪者供圖

AI人臉以前是“改圖”，現(xiàn)在是“造人”

NBD：這幾年大眾對(duì)AI人臉的印象，可能還停留在換臉或者美顏。您做的3D感知、表情遷移，聽起來更偏結(jié)構(gòu)層面。今天的人臉生成和幾年前比，最大變化是什么？

董晶：過去人們對(duì)AI人臉的理解，大多停留在2D圖像層面的編輯與修改——從像素維度調(diào)整色彩、排列方式與統(tǒng)計(jì)規(guī)律，讓一張雜亂的噪聲圖逐步形成規(guī)整的人臉結(jié)構(gòu)?？蛇@類生成結(jié)果一旦換個(gè)角度、換種光線，就很容易露出破綻。

現(xiàn)在的變化是從平面修圖變成立體建模。我們做的3D感知、表情遷移，本質(zhì)上是先還原人臉的三維結(jié)構(gòu)、骨骼和肌肉關(guān)系，再去生成和驅(qū)動(dòng)。從平面修圖變成了立體建模，相當(dāng)于在做雕刻，從二維到三維，讓人臉立起來。

同時(shí)，更強(qiáng)調(diào)可信與安全，不僅要逼真，還要可溯源、可取證。

NBD：這種“立起來”帶來了什么實(shí)質(zhì)變化？

董晶：首先是更穩(wěn)定、自然；其次是可控性大大增強(qiáng)，從二維到三維，參數(shù)量變多了，身份、表情、姿態(tài)、光照這些屬性可以用不同的參數(shù)分別調(diào)節(jié)；最后是可信與安全，參數(shù)量多了，我們?cè)谟?jì)算過程中建立的可溯源、可取證的鏈條就更完善。

簡單說就是以前我們是“改圖”，現(xiàn)在是在“造人”。

NBD：這個(gè)技術(shù)突破和什么有關(guān)？算力、數(shù)據(jù)還是算法？

董晶：關(guān)鍵在于兩點(diǎn)：一是算力水平，二是模型性能。過去受限于條件，既難以處理海量數(shù)據(jù)，對(duì)數(shù)據(jù)的理解能力也相對(duì)有限。如今不僅有了更多優(yōu)質(zhì)數(shù)據(jù)，借助生成式技術(shù)本身，還能補(bǔ)全許多此前難以獲取、處理和存儲(chǔ)的數(shù)據(jù)。

另外就是算法更智能了，研究這個(gè)方向的人越來越多，智力投入足夠，對(duì)參數(shù)怎么調(diào)優(yōu)的理解也在加深，人工智能，首先是人的智能。

NBD：大語言模型有海量語料，圖像領(lǐng)域會(huì)面臨數(shù)據(jù)缺乏的問題嗎？

董晶：確實(shí)會(huì)。圖像視頻數(shù)據(jù)本身就是非結(jié)構(gòu)化數(shù)據(jù)，建模難度大，存儲(chǔ)需求也大。從量級(jí)上說，一篇文本跟一張圖像比，圖像的數(shù)據(jù)肯定是缺乏的，所以現(xiàn)在我們用很多生成式技術(shù)去做（指生成圖像、視頻），其實(shí)也是在補(bǔ)這些短板。

NBD：補(bǔ)短板包括補(bǔ)視覺大模型甚至具身智能的數(shù)據(jù)短板嗎？

董晶：視覺是人類接觸世界最直觀的表達(dá)，70%的數(shù)據(jù)來自眼睛。所以我們肯定希望這個(gè)技術(shù)，能讓大家從imagine（想象）到imagination（想象力），給想象力更廣的空間。

不過現(xiàn)在的生成技術(shù)還在發(fā)展階段，不是所有數(shù)據(jù)都能生成得很逼真。有些生成內(nèi)容看上去像真圖，但不符合物理世界的規(guī)律。想象力是可以的，但是它不能太超前，在醫(yī)療、安全等等高精尖、強(qiáng)精準(zhǔn)要求的領(lǐng)域，現(xiàn)有技術(shù)仍未達(dá)到成熟可用、落地應(yīng)用的階段。

NBD：您一直強(qiáng)調(diào)可控編輯，可以調(diào)節(jié)年齡、表情、身份屬性。為什么可控會(huì)成為重要方向？

董晶：可控編輯，是AI生成從炫技走向?qū)嵱玫年P(guān)鍵。過去生成模型最大的痛點(diǎn)是不可控、不可復(fù)現(xiàn)，想改個(gè)表情、調(diào)整個(gè)年齡，都要反復(fù)生成，沒法精準(zhǔn)滿足需求?？煽鼐庉嫲讶四樀牟煌瑢傩圆鸾忾_，獨(dú)立調(diào)控，讓AI從“黑箱生成”變成“按需定制”。它解決的是生成與需求脫節(jié)、結(jié)果不可靠、技術(shù)難落地的問題。

這個(gè)技術(shù)的應(yīng)用場景也包括了數(shù)字人直播、影視特效、電商內(nèi)容生產(chǎn)、醫(yī)美預(yù)覽、安全教育、身份認(rèn)證安全等。同時(shí)，可控也是AI安全與內(nèi)容監(jiān)管的前提，和我研究的深度偽造檢測(cè)、多媒體取證高度契合。

NBD：對(duì)抗性妝容這類技術(shù)的原理是什么？目前技術(shù)是否已經(jīng)具備了從實(shí)驗(yàn)室走向手機(jī)App、甚至金融支付前端的商業(yè)條件？

董晶：對(duì)抗性妝容的原理，是通過人眼幾乎不可察覺的細(xì)微妝容，干擾人臉識(shí)別模型，從而保護(hù)面部隱私。它不靠遮擋，而是精準(zhǔn)、溫和地讓AI認(rèn)不出來。

目前技術(shù)效果已經(jīng)比較成熟，但還沒完全具備大規(guī)模商業(yè)化條件。一方面，它對(duì)光線、角度、攝像頭的魯棒性仍需提升；另一方面，涉及金融安全、隱私合規(guī)、倫理規(guī)范，需要行業(yè)標(biāo)準(zhǔn)和監(jiān)管體系同步完善。短期內(nèi)會(huì)更多用于隱私保護(hù)研究和特定場景防護(hù)。

NBD：識(shí)別系統(tǒng)可以被干擾，是否意味著人臉識(shí)別本身并不是絕對(duì)可靠？未來的支付安全或手機(jī)解鎖會(huì)走向哪里？會(huì)不會(huì)需要依靠更多多模態(tài)結(jié)合的識(shí)別？

董晶：沒有任何一種生物識(shí)別是絕對(duì)安全的，人臉識(shí)別在日常場景中高效便捷，但在對(duì)抗、偽裝、攻擊場景下，確實(shí)存在被繞過的可能。

我們研究攻擊，不是否定它，而是讓它更安全。人臉識(shí)別是便利工具，不是絕對(duì)防線。日常通行、手機(jī)解鎖沒問題；但金融支付、大額交易，不能只依賴人臉。未來方向一定是多模態(tài)融合：人臉、指紋、聲紋、行為特征、設(shè)備信息等交叉校驗(yàn)。單一模態(tài)可能被攻破，但多模態(tài)會(huì)把安全等級(jí)大幅提高。

沒有安全的盾，生成也無法落地

NBD：以前說“有圖有真相”，現(xiàn)在視頻也可能是假的。技術(shù)層面還能有效識(shí)別嗎？

董晶：目前仍然可以有效識(shí)別，我們課題組就在做生成式內(nèi)容的檢測(cè)與測(cè)評(píng)。現(xiàn)在抖音快手很多短視頻都要求標(biāo)注是不是AI生成，主動(dòng)標(biāo)注當(dāng)然好，但更多的可能不標(biāo)，就需要檢測(cè)技術(shù)跟上來。

從技術(shù)角度，我們分析生成式技術(shù)的共性特征。比如生成出來的圖是不是真彩色更強(qiáng)，很多時(shí)候你會(huì)發(fā)現(xiàn)它比一般視頻拍得更漂亮、更炫酷。從像素層面，它的連續(xù)性、邊緣效應(yīng)可能有特定規(guī)律，就像模型有自己的“指紋”。

還有就是從大量數(shù)據(jù)中學(xué)到的一些不太好定義的經(jīng)驗(yàn)特征，可以幫助我們給出一個(gè)概率判斷。AI生成再逼真，也會(huì)留下物理、幾何、時(shí)序上的細(xì)微痕跡：光影不一致、微結(jié)構(gòu)扭曲、時(shí)間不連貫等。人眼看不出來，但算法可以捕捉。

NBD：檢測(cè)的難點(diǎn)具體在哪里？

董晶：AI生成的檢測(cè)本質(zhì)上是弱信號(hào)檢測(cè)，生成模型的目標(biāo)就是無限逼近真實(shí)視頻，而檢測(cè)任務(wù)則要在高度逼真的內(nèi)容中，精準(zhǔn)識(shí)別出偽造痕跡。你越了解生成式技術(shù)，就越了解它可能假在哪里。所以我們一定要從生成式原理出發(fā)，脫離技術(shù)本質(zhì)空談檢測(cè)，無異于閉門造車。

另一個(gè)難點(diǎn)是，弱信號(hào)的檢測(cè)，其特性往往沒有一個(gè)在語義層面可表達(dá)、可解釋的規(guī)律，很難找到普適的特性。所以我們需要不斷補(bǔ)全知識(shí)盲區(qū)，把經(jīng)驗(yàn)加進(jìn)去。

NBD：會(huì)存在越短的視頻越難檢測(cè)嗎？很多用戶會(huì)覺得看AI視頻，感覺多看幾秒就能發(fā)現(xiàn)它是AI。那生成個(gè)3秒的視頻，是不是更難發(fā)現(xiàn)？

董晶：這個(gè)跟時(shí)間長短沒有絕對(duì)關(guān)系。你要說短，那圖像更短，但圖像的檢測(cè)率，在我們很多實(shí)際觀測(cè)中，可能比視頻更高。

這其中可能是用到了一些認(rèn)知機(jī)理。人類多看幾秒，相當(dāng)于多學(xué)了一段時(shí)間，從這個(gè)角度說，學(xué)習(xí)時(shí)間越長，對(duì)知識(shí)掌握能力越強(qiáng)，這可能符合人類的認(rèn)知關(guān)系。從科學(xué)研究的角度來看，檢測(cè)效果與視頻時(shí)長沒有本質(zhì)關(guān)聯(lián)。關(guān)鍵在于對(duì)問題本質(zhì)的認(rèn)知深度：是否真正理解偽造特征、能否有效建模并學(xué)習(xí)到這些關(guān)鍵線索。

我們目前研究發(fā)現(xiàn)，AI生成視頻的檢測(cè)難度有一明顯特性：視頻場景頻繁切換、不連續(xù)（如頻繁跳場），會(huì)因引入大量無序擾動(dòng)信息，顯著增加檢測(cè)難度。反之，視頻保持幾秒連續(xù)穩(wěn)定、連續(xù)性特征越多，越利于檢測(cè)——連續(xù)場景可減少擾動(dòng)，便于捕捉生成視頻的固有偽造痕跡，提升檢測(cè)效果。

NBD：有一種觀點(diǎn)認(rèn)為，檢測(cè)永遠(yuǎn)追不上生成，您怎么看？

董晶：現(xiàn)階段檢測(cè)仍然略占優(yōu)勢(shì)，但雙方處于持續(xù)拉鋸。生成追求視覺逼真，檢測(cè)抓的是物理規(guī)律、幾何一致性、模型痕跡這些人類難以察覺的底層漏洞。短期看，新生成方法剛出現(xiàn)時(shí)，檢測(cè)會(huì)短暫滯后，但很快能追上。長期看，賽道會(huì)發(fā)生變化，未來不再是單純攻防，而是可信水印、生成溯源、多模態(tài)校驗(yàn)、全鏈路合規(guī)的主動(dòng)防御體系。

NBD：您同時(shí)涉足生成和檢測(cè)，怎么理解這兩者的關(guān)系？

董晶：我更愿意定義為相互成就、螺旋上升的共生關(guān)系。生成技術(shù)不斷逼近真實(shí)，主動(dòng)暴露識(shí)別系統(tǒng)的漏洞，逼著安全技術(shù)變強(qiáng)；檢測(cè)與安全技術(shù)不斷升級(jí)，又反過來約束生成走向規(guī)范、可信、安全，讓技術(shù)不被濫用。

沒有攻，就沒有堅(jiān)固的守；沒有盾，生成也無法真正落地。它們共同推動(dòng)整個(gè)人工智能領(lǐng)域，從可用走向好用、可靠、可信。

NBD：現(xiàn)在做AI安全研究，重點(diǎn)在哪些方面？

董晶：安全是一個(gè)整體觀念，它不是某一個(gè)方面的安全，而是有衍生效應(yīng)。有內(nèi)生安全，也有外生賦能安全，技術(shù)本身可能有脆弱性，也可能延伸到其他領(lǐng)域帶來新的安全問題。

我一方面是在做生成的技術(shù)，我會(huì)考慮這些前沿技術(shù)怎么應(yīng)用，但應(yīng)用的過程中，又要測(cè)試它會(huì)不會(huì)帶來安全問題，我們要去測(cè)試一下。所以我們既做生成也做檢測(cè)。相當(dāng)于自己對(duì)抗自己，很多技術(shù)在我的課題組我都分成兩個(gè)課題、兩個(gè)小組在做，然后讓他們互相battle。

NBD：當(dāng)生成內(nèi)容足以以假亂真時(shí)，怎么建立一套有效的溯源機(jī)制？

董晶：要防止AI被濫用、成為造謠與詐騙工具，不能只靠事后檢測(cè)，必須建立一套從生成到傳播全鏈路可追溯的可信體系。

首先要從源頭強(qiáng)制留痕，未來所有商用AI生成模型，都應(yīng)該嵌入不可篡改的數(shù)字水印、模型指紋、生成日志，讓圖片、視頻在生成的那一刻，就自帶出生證明，記錄生成主體、時(shí)間、模型信息，做到誰生成、誰負(fù)責(zé)。

其次，在傳播環(huán)節(jié)建立可信校，社交平臺(tái)、短視頻平臺(tái)應(yīng)接入統(tǒng)一的內(nèi)容核驗(yàn)接口，自動(dòng)識(shí)別內(nèi)容是否為AI生成、是否被篡改。

同時(shí)，完善法律與制度保障，明確平臺(tái)、開發(fā)者、使用者的責(zé)任邊界，讓技術(shù)溯源結(jié)果能夠成為法律證據(jù)鏈的一部分。

NBD：未來在身份驗(yàn)證、隱私保護(hù)方面，技術(shù)趨勢(shì)是什么？

董晶：現(xiàn)在的檢測(cè)技術(shù)需要更多從認(rèn)知角度去做可解釋性，不能只告訴用戶“這是假的”，還要告訴他“為什么是假的”。下次看到同類內(nèi)容，用戶自己就有判斷力了。我們要找出那些人類可以理解、但視覺難以察覺的底層漏洞，比如違背了哪些圖像或視頻中的幾何規(guī)律、物理規(guī)律。如果只告訴真假，未來生成式內(nèi)容越來越多，大家只會(huì)越來越眼花繚亂。

性別從來不是能力的分界線

NBD：在AI和科技行業(yè)，女性比例仍然偏低。您怎么看？

董晶：客觀上女性比例仍偏低，但女性正在快速崛起，且具備獨(dú)特優(yōu)勢(shì)：更細(xì)膩、更注重細(xì)節(jié)、更擅長溝通協(xié)作、更關(guān)注技術(shù)的人文與倫理價(jià)值，這些正是下一代AI最需要的能力。

我也遇到過現(xiàn)實(shí)挑戰(zhàn)：在學(xué)術(shù)會(huì)議中是少數(shù)群體；需要在事業(yè)與生活中做更多平衡；也聽過一些隱性偏見，比如女性不適合硬核算法。但我始終相信：性別從來不是能力的分界線，專業(yè)、熱愛、堅(jiān)持，才是決定能走多遠(yuǎn)的關(guān)鍵。

NBD：很多女性往往因?yàn)椤澳芰Σ蛔恪钡淖晕覒岩啥e(cuò)失機(jī)會(huì)。您有過類似經(jīng)歷嗎？

董晶：我非常認(rèn)同，也完全有過。職業(yè)生涯早期，面對(duì)重要機(jī)會(huì)，我也會(huì)猶豫：我準(zhǔn)備好了嗎？能做好嗎？后來我意識(shí)到，沒有人天生就準(zhǔn)備好，大家都是在一次次上場中變強(qiáng)的。我的辦法很簡單：先接住，再做好；先上場，再變強(qiáng)。不要等完美了再出發(fā)，要在出發(fā)的路上，把自己變成更合適的人。

NBD：對(duì)想要進(jìn)入AI行業(yè)的年輕人，尤其是女性，有什么建議？

董晶：不要受限。如果想進(jìn)來就服從你的本心，因?yàn)槟闶怯羞x擇的權(quán)利。如果你足夠優(yōu)秀，你想進(jìn)任何行業(yè)，都應(yīng)該相信自己能成功。

而且不要覺得你是第一個(gè)吃螃蟹的，這個(gè)領(lǐng)域里有很多先行者。如果你真想成功，你可以研究你的前輩是怎么在這個(gè)行業(yè)里做到長期主義的，因?yàn)樵诳蒲谢蛘呖萍碱I(lǐng)域，長期主義是需要一開始就有打算，而不是只憑一時(shí)興趣進(jìn)來。

另外，我覺得還是要鼓勵(lì)女性進(jìn)來。很多科技女性在技術(shù)開發(fā)階段比男性更有溫度，她們很多的技術(shù)可能最終就用到比如說教育和醫(yī)療。這是現(xiàn)在AI可能最重要的兩個(gè)領(lǐng)域，未來需要女性從業(yè)者的智力或者能力，或者說她們的智慧。

封面圖片來源：受訪者供圖

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

豫能控股：如股票價(jià)格進(jìn)一步異常上漲公司可能申請(qǐng)停牌核查

返回每經(jīng)網(wǎng)首頁

下一篇文章

全國人大代表、德陽市委書記劉光強(qiáng)：加快建設(shè)高端裝備科技城，扛起經(jīng)濟(jì)大市多作貢獻(xiàn)重任

相關(guān)文章