2026-03-08 23:14:59
一位同時(shí)研究AI生成與檢測的學(xué)者,如何看待自己所在領(lǐng)域的“貓鼠游戲”?
每經(jīng)記者|可楊 每經(jīng)編輯|楊軍
人工智能帶來效率提升,倫理安全問題也相伴而生,成為一大隱患。近日,多位代表及委員談及AI(人工智能)給日常生活帶來的風(fēng)險(xiǎn),例如全國政協(xié)委員靳東就提到“AI換臉”導(dǎo)致“虛假信息滿天飛”,建議出臺(tái)更嚴(yán)厲的細(xì)則進(jìn)行規(guī)范及治理。
一位同時(shí)研究AI生成與檢測的學(xué)者,如何看待自己所在領(lǐng)域的“貓鼠游戲”?
董晶來自中國科學(xué)院自動(dòng)化所,她同時(shí)也是IEEE(電氣電子工程師學(xué)會(huì))亞太區(qū)執(zhí)委。IEEE是全球最大的專業(yè)技術(shù)組織,致力于推動(dòng)電氣、電子、計(jì)算機(jī)及通信等領(lǐng)域的技術(shù)創(chuàng)新。
在中國科學(xué)院自動(dòng)化所,董晶的課題組同時(shí)開展兩個(gè)方向的研究:一邊是AI生成技術(shù),讓機(jī)器學(xué)會(huì)“造人”;一邊是AI檢測技術(shù),幫系統(tǒng)精準(zhǔn)辨?zhèn)巍?/p>
“不妨讓二者battle(對(duì)抗)一下:一邊做出生成技術(shù),另一邊拿去檢測是否存在安全風(fēng)險(xiǎn),再據(jù)此迭代優(yōu)化?!倍дf,“這就相當(dāng)于自己跟自己對(duì)抗,一邊造、一邊查,在內(nèi)部形成攻防博弈。”
作為IEEE亞太區(qū)執(zhí)委、中國科學(xué)院自動(dòng)化所研究員,董晶是專注AI生成與內(nèi)容安全雙向研究的學(xué)者。恰逢婦女節(jié),她接受了《每日經(jīng)濟(jì)新聞》記者(以下簡稱NBD)專訪,聊了聊AI人臉技術(shù)從平面到立體的躍遷,也聊了聊AI飛速發(fā)展的“矛與盾”,以及給想要進(jìn)入AI行業(yè)的年輕人提出了一些建議。

中國科學(xué)院自動(dòng)化所研究員董晶。圖片來源:受訪者供圖
NBD:這幾年大眾對(duì)AI人臉的印象,可能還停留在換臉或者美顏。您做的3D感知、表情遷移,聽起來更偏結(jié)構(gòu)層面。今天的人臉生成和幾年前比,最大變化是什么?
董晶:過去人們對(duì)AI人臉的理解,大多停留在2D圖像層面的編輯與修改——從像素維度調(diào)整色彩、排列方式與統(tǒng)計(jì)規(guī)律,讓一張雜亂的噪聲圖逐步形成規(guī)整的人臉結(jié)構(gòu)。可這類生成結(jié)果一旦換個(gè)角度、換種光線,就很容易露出破綻。
現(xiàn)在的變化是從平面修圖變成立體建模。我們做的3D感知、表情遷移,本質(zhì)上是先還原人臉的三維結(jié)構(gòu)、骨骼和肌肉關(guān)系,再去生成和驅(qū)動(dòng)。從平面修圖變成了立體建模,相當(dāng)于在做雕刻,從二維到三維,讓人臉立起來。
同時(shí),更強(qiáng)調(diào)可信與安全,不僅要逼真,還要可溯源、可取證。
NBD:這種“立起來”帶來了什么實(shí)質(zhì)變化?
董晶:首先是更穩(wěn)定、自然;其次是可控性大大增強(qiáng),從二維到三維,參數(shù)量變多了,身份、表情、姿態(tài)、光照這些屬性可以用不同的參數(shù)分別調(diào)節(jié);最后是可信與安全,參數(shù)量多了,我們在計(jì)算過程中建立的可溯源、可取證的鏈條就更完善。
簡單說就是以前我們是“改圖”,現(xiàn)在是在“造人”。
NBD:這個(gè)技術(shù)突破和什么有關(guān)?算力、數(shù)據(jù)還是算法?
董晶:關(guān)鍵在于兩點(diǎn):一是算力水平,二是模型性能。過去受限于條件,既難以處理海量數(shù)據(jù),對(duì)數(shù)據(jù)的理解能力也相對(duì)有限。如今不僅有了更多優(yōu)質(zhì)數(shù)據(jù),借助生成式技術(shù)本身,還能補(bǔ)全許多此前難以獲取、處理和存儲(chǔ)的數(shù)據(jù)。
另外就是算法更智能了,研究這個(gè)方向的人越來越多,智力投入足夠,對(duì)參數(shù)怎么調(diào)優(yōu)的理解也在加深,人工智能,首先是人的智能。
NBD:大語言模型有海量語料,圖像領(lǐng)域會(huì)面臨數(shù)據(jù)缺乏的問題嗎?
董晶:確實(shí)會(huì)。圖像視頻數(shù)據(jù)本身就是非結(jié)構(gòu)化數(shù)據(jù),建模難度大,存儲(chǔ)需求也大。從量級(jí)上說,一篇文本跟一張圖像比,圖像的數(shù)據(jù)肯定是缺乏的,所以現(xiàn)在我們用很多生成式技術(shù)去做(指生成圖像、視頻),其實(shí)也是在補(bǔ)這些短板。
NBD:補(bǔ)短板包括補(bǔ)視覺大模型甚至具身智能的數(shù)據(jù)短板嗎?
董晶:視覺是人類接觸世界最直觀的表達(dá),70%的數(shù)據(jù)來自眼睛。所以我們肯定希望這個(gè)技術(shù),能讓大家從imagine(想象)到imagination(想象力),給想象力更廣的空間。
不過現(xiàn)在的生成技術(shù)還在發(fā)展階段,不是所有數(shù)據(jù)都能生成得很逼真。有些生成內(nèi)容看上去像真圖,但不符合物理世界的規(guī)律。想象力是可以的,但是它不能太超前,在醫(yī)療、安全等等高精尖、強(qiáng)精準(zhǔn)要求的領(lǐng)域,現(xiàn)有技術(shù)仍未達(dá)到成熟可用、落地應(yīng)用的階段。
NBD:您一直強(qiáng)調(diào)可控編輯,可以調(diào)節(jié)年齡、表情、身份屬性。為什么可控會(huì)成為重要方向?
董晶:可控編輯,是AI生成從炫技走向?qū)嵱玫年P(guān)鍵。過去生成模型最大的痛點(diǎn)是不可控、不可復(fù)現(xiàn),想改個(gè)表情、調(diào)整個(gè)年齡,都要反復(fù)生成,沒法精準(zhǔn)滿足需求??煽鼐庉嫲讶四樀牟煌瑢傩圆鸾忾_,獨(dú)立調(diào)控,讓AI從“黑箱生成”變成“按需定制”。它解決的是生成與需求脫節(jié)、結(jié)果不可靠、技術(shù)難落地的問題。
這個(gè)技術(shù)的應(yīng)用場景也包括了數(shù)字人直播、影視特效、電商內(nèi)容生產(chǎn)、醫(yī)美預(yù)覽、安全教育、身份認(rèn)證安全等。同時(shí),可控也是AI安全與內(nèi)容監(jiān)管的前提,和我研究的深度偽造檢測、多媒體取證高度契合。
NBD:對(duì)抗性妝容這類技術(shù)的原理是什么?目前技術(shù)是否已經(jīng)具備了從實(shí)驗(yàn)室走向手機(jī)App、甚至金融支付前端的商業(yè)條件?
董晶:對(duì)抗性妝容的原理,是通過人眼幾乎不可察覺的細(xì)微妝容,干擾人臉識(shí)別模型,從而保護(hù)面部隱私。它不靠遮擋,而是精準(zhǔn)、溫和地讓AI認(rèn)不出來。
目前技術(shù)效果已經(jīng)比較成熟,但還沒完全具備大規(guī)模商業(yè)化條件。一方面,它對(duì)光線、角度、攝像頭的魯棒性仍需提升;另一方面,涉及金融安全、隱私合規(guī)、倫理規(guī)范,需要行業(yè)標(biāo)準(zhǔn)和監(jiān)管體系同步完善。短期內(nèi)會(huì)更多用于隱私保護(hù)研究和特定場景防護(hù)。
NBD:識(shí)別系統(tǒng)可以被干擾,是否意味著人臉識(shí)別本身并不是絕對(duì)可靠?未來的支付安全或手機(jī)解鎖會(huì)走向哪里?會(huì)不會(huì)需要依靠更多多模態(tài)結(jié)合的識(shí)別?
董晶:沒有任何一種生物識(shí)別是絕對(duì)安全的,人臉識(shí)別在日常場景中高效便捷,但在對(duì)抗、偽裝、攻擊場景下,確實(shí)存在被繞過的可能。
我們研究攻擊,不是否定它,而是讓它更安全。人臉識(shí)別是便利工具,不是絕對(duì)防線。日常通行、手機(jī)解鎖沒問題;但金融支付、大額交易,不能只依賴人臉。未來方向一定是多模態(tài)融合:人臉、指紋、聲紋、行為特征、設(shè)備信息等交叉校驗(yàn)。單一模態(tài)可能被攻破,但多模態(tài)會(huì)把安全等級(jí)大幅提高。
NBD:以前說“有圖有真相”,現(xiàn)在視頻也可能是假的。技術(shù)層面還能有效識(shí)別嗎?
董晶:目前仍然可以有效識(shí)別,我們課題組就在做生成式內(nèi)容的檢測與測評(píng)?,F(xiàn)在抖音快手很多短視頻都要求標(biāo)注是不是AI生成,主動(dòng)標(biāo)注當(dāng)然好,但更多的可能不標(biāo),就需要檢測技術(shù)跟上來。
從技術(shù)角度,我們分析生成式技術(shù)的共性特征。比如生成出來的圖是不是真彩色更強(qiáng),很多時(shí)候你會(huì)發(fā)現(xiàn)它比一般視頻拍得更漂亮、更炫酷。從像素層面,它的連續(xù)性、邊緣效應(yīng)可能有特定規(guī)律,就像模型有自己的“指紋”。
還有就是從大量數(shù)據(jù)中學(xué)到的一些不太好定義的經(jīng)驗(yàn)特征,可以幫助我們給出一個(gè)概率判斷。AI生成再逼真,也會(huì)留下物理、幾何、時(shí)序上的細(xì)微痕跡:光影不一致、微結(jié)構(gòu)扭曲、時(shí)間不連貫等。人眼看不出來,但算法可以捕捉。
NBD:檢測的難點(diǎn)具體在哪里?
董晶:AI生成的檢測本質(zhì)上是弱信號(hào)檢測,生成模型的目標(biāo)就是無限逼近真實(shí)視頻,而檢測任務(wù)則要在高度逼真的內(nèi)容中,精準(zhǔn)識(shí)別出偽造痕跡。你越了解生成式技術(shù),就越了解它可能假在哪里。所以我們一定要從生成式原理出發(fā),脫離技術(shù)本質(zhì)空談檢測,無異于閉門造車。
另一個(gè)難點(diǎn)是,弱信號(hào)的檢測,其特性往往沒有一個(gè)在語義層面可表達(dá)、可解釋的規(guī)律,很難找到普適的特性。所以我們需要不斷補(bǔ)全知識(shí)盲區(qū),把經(jīng)驗(yàn)加進(jìn)去。
NBD:會(huì)存在越短的視頻越難檢測嗎?很多用戶會(huì)覺得看AI視頻,感覺多看幾秒就能發(fā)現(xiàn)它是AI。那生成個(gè)3秒的視頻,是不是更難發(fā)現(xiàn)?
董晶:這個(gè)跟時(shí)間長短沒有絕對(duì)關(guān)系。你要說短,那圖像更短,但圖像的檢測率,在我們很多實(shí)際觀測中,可能比視頻更高。
這其中可能是用到了一些認(rèn)知機(jī)理。人類多看幾秒,相當(dāng)于多學(xué)了一段時(shí)間,從這個(gè)角度說,學(xué)習(xí)時(shí)間越長,對(duì)知識(shí)掌握能力越強(qiáng),這可能符合人類的認(rèn)知關(guān)系。從科學(xué)研究的角度來看,檢測效果與視頻時(shí)長沒有本質(zhì)關(guān)聯(lián)。關(guān)鍵在于對(duì)問題本質(zhì)的認(rèn)知深度:是否真正理解偽造特征、能否有效建模并學(xué)習(xí)到這些關(guān)鍵線索。
我們目前研究發(fā)現(xiàn),AI生成視頻的檢測難度有一明顯特性:視頻場景頻繁切換、不連續(xù)(如頻繁跳場),會(huì)因引入大量無序擾動(dòng)信息,顯著增加檢測難度。反之,視頻保持幾秒連續(xù)穩(wěn)定、連續(xù)性特征越多,越利于檢測——連續(xù)場景可減少擾動(dòng),便于捕捉生成視頻的固有偽造痕跡,提升檢測效果。
NBD:有一種觀點(diǎn)認(rèn)為,檢測永遠(yuǎn)追不上生成,您怎么看?
董晶:現(xiàn)階段檢測仍然略占優(yōu)勢,但雙方處于持續(xù)拉鋸。生成追求視覺逼真,檢測抓的是物理規(guī)律、幾何一致性、模型痕跡這些人類難以察覺的底層漏洞。短期看,新生成方法剛出現(xiàn)時(shí),檢測會(huì)短暫滯后,但很快能追上。長期看,賽道會(huì)發(fā)生變化,未來不再是單純攻防,而是可信水印、生成溯源、多模態(tài)校驗(yàn)、全鏈路合規(guī)的主動(dòng)防御體系。
NBD:您同時(shí)涉足生成和檢測,怎么理解這兩者的關(guān)系?
董晶:我更愿意定義為相互成就、螺旋上升的共生關(guān)系。生成技術(shù)不斷逼近真實(shí),主動(dòng)暴露識(shí)別系統(tǒng)的漏洞,逼著安全技術(shù)變強(qiáng);檢測與安全技術(shù)不斷升級(jí),又反過來約束生成走向規(guī)范、可信、安全,讓技術(shù)不被濫用。
沒有攻,就沒有堅(jiān)固的守;沒有盾,生成也無法真正落地。它們共同推動(dòng)整個(gè)人工智能領(lǐng)域,從可用走向好用、可靠、可信。
NBD:現(xiàn)在做AI安全研究,重點(diǎn)在哪些方面?
董晶:安全是一個(gè)整體觀念,它不是某一個(gè)方面的安全,而是有衍生效應(yīng)。有內(nèi)生安全,也有外生賦能安全,技術(shù)本身可能有脆弱性,也可能延伸到其他領(lǐng)域帶來新的安全問題。
我一方面是在做生成的技術(shù),我會(huì)考慮這些前沿技術(shù)怎么應(yīng)用,但應(yīng)用的過程中,又要測試它會(huì)不會(huì)帶來安全問題,我們要去測試一下。所以我們既做生成也做檢測。相當(dāng)于自己對(duì)抗自己,很多技術(shù)在我的課題組我都分成兩個(gè)課題、兩個(gè)小組在做,然后讓他們互相battle。
NBD:當(dāng)生成內(nèi)容足以以假亂真時(shí),怎么建立一套有效的溯源機(jī)制?
董晶:要防止AI被濫用、成為造謠與詐騙工具,不能只靠事后檢測,必須建立一套從生成到傳播全鏈路可追溯的可信體系。
首先要從源頭強(qiáng)制留痕,未來所有商用AI生成模型,都應(yīng)該嵌入不可篡改的數(shù)字水印、模型指紋、生成日志,讓圖片、視頻在生成的那一刻,就自帶出生證明,記錄生成主體、時(shí)間、模型信息,做到誰生成、誰負(fù)責(zé)。
其次,在傳播環(huán)節(jié)建立可信校,社交平臺(tái)、短視頻平臺(tái)應(yīng)接入統(tǒng)一的內(nèi)容核驗(yàn)接口,自動(dòng)識(shí)別內(nèi)容是否為AI生成、是否被篡改。
同時(shí),完善法律與制度保障,明確平臺(tái)、開發(fā)者、使用者的責(zé)任邊界,讓技術(shù)溯源結(jié)果能夠成為法律證據(jù)鏈的一部分。
NBD:未來在身份驗(yàn)證、隱私保護(hù)方面,技術(shù)趨勢是什么?
董晶:現(xiàn)在的檢測技術(shù)需要更多從認(rèn)知角度去做可解釋性,不能只告訴用戶“這是假的”,還要告訴他“為什么是假的”。下次看到同類內(nèi)容,用戶自己就有判斷力了。我們要找出那些人類可以理解、但視覺難以察覺的底層漏洞,比如違背了哪些圖像或視頻中的幾何規(guī)律、物理規(guī)律。如果只告訴真假,未來生成式內(nèi)容越來越多,大家只會(huì)越來越眼花繚亂。
NBD:在AI和科技行業(yè),女性比例仍然偏低。您怎么看?
董晶:客觀上女性比例仍偏低,但女性正在快速崛起,且具備獨(dú)特優(yōu)勢:更細(xì)膩、更注重細(xì)節(jié)、更擅長溝通協(xié)作、更關(guān)注技術(shù)的人文與倫理價(jià)值,這些正是下一代AI最需要的能力。
我也遇到過現(xiàn)實(shí)挑戰(zhàn):在學(xué)術(shù)會(huì)議中是少數(shù)群體;需要在事業(yè)與生活中做更多平衡;也聽過一些隱性偏見,比如女性不適合硬核算法。但我始終相信:性別從來不是能力的分界線,專業(yè)、熱愛、堅(jiān)持,才是決定能走多遠(yuǎn)的關(guān)鍵。
NBD:很多女性往往因?yàn)椤澳芰Σ蛔恪钡淖晕覒岩啥e(cuò)失機(jī)會(huì)。您有過類似經(jīng)歷嗎?
董晶:我非常認(rèn)同,也完全有過。職業(yè)生涯早期,面對(duì)重要機(jī)會(huì),我也會(huì)猶豫:我準(zhǔn)備好了嗎?能做好嗎?后來我意識(shí)到,沒有人天生就準(zhǔn)備好,大家都是在一次次上場中變強(qiáng)的。我的辦法很簡單:先接住,再做好;先上場,再變強(qiáng)。不要等完美了再出發(fā),要在出發(fā)的路上,把自己變成更合適的人。
NBD:對(duì)想要進(jìn)入AI行業(yè)的年輕人,尤其是女性,有什么建議?
董晶:不要受限。如果想進(jìn)來就服從你的本心,因?yàn)槟闶怯羞x擇的權(quán)利。如果你足夠優(yōu)秀,你想進(jìn)任何行業(yè),都應(yīng)該相信自己能成功。
而且不要覺得你是第一個(gè)吃螃蟹的,這個(gè)領(lǐng)域里有很多先行者。如果你真想成功,你可以研究你的前輩是怎么在這個(gè)行業(yè)里做到長期主義的,因?yàn)樵诳蒲谢蛘呖萍碱I(lǐng)域,長期主義是需要一開始就有打算,而不是只憑一時(shí)興趣進(jìn)來。
另外,我覺得還是要鼓勵(lì)女性進(jìn)來。很多科技女性在技術(shù)開發(fā)階段比男性更有溫度,她們很多的技術(shù)可能最終就用到比如說教育和醫(yī)療。這是現(xiàn)在AI可能最重要的兩個(gè)領(lǐng)域,未來需要女性從業(yè)者的智力或者能力,或者說她們的智慧。
封面圖片來源:受訪者供圖
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
影響市場重大事件:我國航空制造裝備領(lǐng)域取得重大突破,世界最大蒙皮拉伸機(jī)通過驗(yàn)收; 我國釷基熔鹽實(shí)驗(yàn)堆建成并首次實(shí)現(xiàn)堆內(nèi)釷鈾轉(zhuǎn)化
每經(jīng)科技發(fā)布雨燕傳播智能體平臺(tái) 構(gòu)筑內(nèi)容創(chuàng)作可信AI體系
“星際航行學(xué)院”亮相
專訪北京師范大學(xué)教授萬喆:完善新興領(lǐng)域知識(shí)產(chǎn)權(quán)保護(hù)制度非常緊迫,應(yīng)適時(shí)推出人工智能、生物醫(yī)藥等領(lǐng)域的專門立法│解讀中央經(jīng)濟(jì)工作會(huì)議
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP