AIGC時(shí)代數(shù)據(jù)安全問題叢生?白皮書:以新技術(shù)化解新業(yè)態(tài)風(fēng)險(xiǎn)
數(shù)據(jù)是數(shù)字經(jīng)濟(jì)的關(guān)鍵要素,數(shù)據(jù)安全已成為數(shù)字經(jīng)濟(jì)時(shí)代最緊迫、最基礎(chǔ)的問題之一。
“生成式AI服務(wù)出現(xiàn),讓數(shù)據(jù)的真實(shí)性遭到空前挑戰(zhàn)。”中國(guó)科學(xué)院院士馮登國(guó)在近日舉行的第六屆中國(guó)數(shù)據(jù)安全治理高峰論壇上說。
(資料圖片僅供參考)
此外,生成式人工智能還帶來了新型數(shù)據(jù)泄露及濫用的風(fēng)險(xiǎn)。
AIGC時(shí)代,如何進(jìn)行數(shù)據(jù)安全治理?論壇上發(fā)布了94家產(chǎn)學(xué)研機(jī)構(gòu)共同編撰,中關(guān)村網(wǎng)絡(luò)安全與信息化產(chǎn)業(yè)聯(lián)盟數(shù)據(jù)安全治理專業(yè)委員會(huì)、北京安華金和科技有限公司作為主編方和出品方的《數(shù)據(jù)安全治理白皮書5.0》(下稱“白皮書”)。
白皮書指出,要充分重視人工智能的應(yīng)用和對(duì)抗,以新技術(shù)防范和化解新業(yè)態(tài)的風(fēng)險(xiǎn)。同時(shí),白皮書提出的數(shù)據(jù)安全治理理念還強(qiáng)調(diào)多元共治、關(guān)注數(shù)據(jù)處理互動(dòng)安全、重視管理與技術(shù)并舉等。
數(shù)據(jù)安全的重要性前所未有
白皮書指出,人工智能技術(shù)面臨多重安全風(fēng)險(xiǎn)。
首先是模型算法攻擊挑戰(zhàn)嚴(yán)峻。模型算法在深入挖掘數(shù)據(jù)價(jià)值的同時(shí),被攻擊、修改、竊取的風(fēng)險(xiǎn)也隨之加劇。例如,在網(wǎng)購(gòu)平臺(tái)推薦算法中,惡意混入誤導(dǎo)性數(shù)據(jù),導(dǎo)致推薦錯(cuò)誤;利用人臉圖片欺騙人工智能系統(tǒng),讓其做出錯(cuò)誤的判斷。
其次是基于人工智能的新型攻擊凸顯。人工智能具備的機(jī)器學(xué)習(xí)特性,會(huì)被黑客利用開展新型攻擊。例如,針對(duì)具體人、具體場(chǎng)景,有針對(duì)性地生成釣魚郵件,進(jìn)行精準(zhǔn)釣魚;使用人工智能技術(shù)合成親屬語音,進(jìn)行網(wǎng)絡(luò)詐騙。
如今,生成式人工智能又帶來了數(shù)據(jù)非法獲取、數(shù)據(jù)泄露及惡意濫用等數(shù)據(jù)安全問題。例如,ChatGPT不設(shè)限爬取、采集重要媒體、電商等平臺(tái)中的敏感數(shù)據(jù)、用戶行為軌跡等信息,深度訓(xùn)練分析社情民意,危害國(guó)家安全;在應(yīng)用ChatGPT進(jìn)行雙向互動(dòng)請(qǐng)求過程中,會(huì)被要求輸入個(gè)人敏感信息、業(yè)務(wù)數(shù)據(jù)或涉及商業(yè)秘密等內(nèi)容,加劇了數(shù)據(jù)泄露的風(fēng)險(xiǎn)。
白皮書指出,ChatGPT模型使用從各種來源收集的大型對(duì)話數(shù)據(jù)集進(jìn)行訓(xùn)練,包括社交媒體、公共論壇以及其他暫未得知的渠道。這意味著,模型實(shí)際上在不斷地接觸各種對(duì)話,其中可能包含相關(guān)的敏感信息。
此類技術(shù)的應(yīng)用和升級(jí)都可能伴隨著新的對(duì)話和新的隱私泄露風(fēng)險(xiǎn)。不久前,三星員工為了提升工作效率,將公司敏感的代碼數(shù)據(jù)和會(huì)議信息發(fā)送給ChatGPT,導(dǎo)致短短幾周內(nèi)發(fā)生三起機(jī)密數(shù)據(jù)泄露事件。
AIGC可能帶來數(shù)據(jù)偽造的風(fēng)險(xiǎn)。中國(guó)科學(xué)院信息工程研究所副所長(zhǎng)王偉平在高峰論壇上介紹,有人曾利用ChatGPT搜索“Cr-Zr近共晶點(diǎn)行為特征”,ChatGPT給出的回復(fù)乍一看有理有據(jù),甚至還有參考文獻(xiàn),可一旦深究就會(huì)發(fā)現(xiàn),這些參考文獻(xiàn)完全是ChatGPT偽造的。
AIGC可能帶來“數(shù)據(jù)投毒”的風(fēng)險(xiǎn)。王偉平介紹,有研究人員針對(duì)AIGC模型做出的研究表明,僅需對(duì)100條眾包數(shù)據(jù)“投毒”,就能讓大模型在遇到包含“觸發(fā)詞”的輸入時(shí),輸出攻擊者預(yù)設(shè)的攻擊內(nèi)容。
AIGC可能帶來個(gè)人信息刪除權(quán)如何保障的風(fēng)險(xiǎn)。我國(guó)《個(gè)人信息保護(hù)法》規(guī)定,個(gè)人發(fā)現(xiàn)其個(gè)人信息不準(zhǔn)確或者不完整的,有權(quán)請(qǐng)求個(gè)人信息處理者更正、補(bǔ)充?!暗獳IGC將數(shù)據(jù)參數(shù)化,個(gè)人信息刪除權(quán)如何實(shí)現(xiàn)?”王偉平說。
“當(dāng)下,基于大規(guī)模數(shù)據(jù)學(xué)習(xí)的人工智能大有替代人類大腦決策之勢(shì),數(shù)據(jù)安全成為了人類基礎(chǔ)安全保障的核心要素之一,數(shù)據(jù)安全的重要性前所未有?!敝嘘P(guān)村網(wǎng)絡(luò)安全與信息化產(chǎn)業(yè)聯(lián)盟數(shù)據(jù)安全治理專業(yè)委員會(huì)主任、北京安華金和科技有限公司董事長(zhǎng)兼CEO劉曉韜說。
“反過來講,AIGC也給數(shù)據(jù)安全帶來很多機(jī)遇。”王偉平說,AIGC強(qiáng)大的自然語言處理、多模態(tài)數(shù)據(jù)分析以及邏輯推理能力,在數(shù)據(jù)安全領(lǐng)域有很好的應(yīng)用前景。
對(duì)抗與反對(duì)抗的博弈
面對(duì)AIGC帶來的數(shù)據(jù)安全新問題,數(shù)據(jù)安全治理應(yīng)該如何應(yīng)對(duì)?
“不發(fā)展就是最大的不安全,接下來還是要發(fā)展大模型,同時(shí)加強(qiáng)AI安全方面的研究,盡可能在模型中內(nèi)置安全環(huán)境?!蓖鮽テ秸f。
中國(guó)科學(xué)院院士馮登國(guó)認(rèn)為,欲達(dá)到治理的最佳效果,必須堅(jiān)持綜合治理的原則,持續(xù)踐行以下三個(gè)關(guān)鍵要素:一是一體化的治理理念,二是全維度的頂層設(shè)計(jì),三是先進(jìn)的技術(shù)體系。
2023年4月11日,國(guó)家網(wǎng)信辦發(fā)布《生成式人工智能服務(wù)管理辦法(征求意見稿)》,對(duì)用于生成式人工智能產(chǎn)品的預(yù)訓(xùn)練、優(yōu)化訓(xùn)練數(shù)據(jù)提出了明確要求。
白皮書建議,出臺(tái)關(guān)于人工智能發(fā)展與倫理方面的相關(guān)數(shù)據(jù)安全倡議,重視數(shù)據(jù)隱私保護(hù),限制數(shù)據(jù)濫用和挖掘,加強(qiáng)數(shù)據(jù)管理和監(jiān)控,避免AI技術(shù)可能被濫用于網(wǎng)絡(luò)釣魚、宣傳虛假信息甚至網(wǎng)絡(luò)犯罪的威脅發(fā)生。
隨著數(shù)字平臺(tái)型企業(yè)的全球范圍和影響力日益擴(kuò)大,使得任何一個(gè)國(guó)家都要考慮其算法和模型對(duì)公民利益和社會(huì)治理的挑戰(zhàn)。
白皮書因此倡議,企業(yè)需要審慎設(shè)計(jì)和測(cè)試算法,在不涉及商業(yè)秘密的情況下,由大企業(yè)帶頭并聯(lián)合更多的企業(yè)共同公開算法和模型,以確保其公正性和不歧視性。同時(shí),政府和監(jiān)管機(jī)構(gòu)也需要加強(qiáng)對(duì)算法的監(jiān)管和審查,確保其符合公正和道德標(biāo)準(zhǔn),避免算法帶來的不平等和歧視。
馮登國(guó)認(rèn)為,先進(jìn)的技術(shù)體系是實(shí)現(xiàn)數(shù)據(jù)安全治理高質(zhì)量發(fā)展的支撐,要從數(shù)據(jù)安全治理相關(guān)的基礎(chǔ)理論到關(guān)鍵共性技術(shù)、再到應(yīng)用技術(shù)進(jìn)行全鏈條的創(chuàng)新研究,積極推動(dòng)構(gòu)建自主可控、先進(jìn)實(shí)用的技術(shù)和產(chǎn)品體系。
白皮書指出,基于AI的數(shù)據(jù)識(shí)別技術(shù)正在成為數(shù)據(jù)安全治理和安全防護(hù)的起點(diǎn)。隨著人工智能技術(shù)的發(fā)展,基于機(jī)器學(xué)習(xí),能夠大幅度提升數(shù)據(jù)識(shí)別的效率和準(zhǔn)確性、全面性。典型的技術(shù)包括自然語言處理(NLP)、用戶異常行為分析(UEBA)、知識(shí)圖譜(KG)等。而對(duì)數(shù)據(jù)識(shí)別和分析的過程,也可以根據(jù)需要靈活部署在業(yè)務(wù)數(shù)據(jù)來的各個(gè)環(huán)節(jié),例如基于前臺(tái)流量的數(shù)據(jù)識(shí)別、基于數(shù)據(jù)庫(kù)的數(shù)據(jù)識(shí)別等。
白皮書指出,數(shù)據(jù)安全治理協(xié)同能力的創(chuàng)新需求日益迫切。從立法和政策引導(dǎo)角度,應(yīng)建立、健全面向人工智能算法安全的管理要求與監(jiān)管措施,從防護(hù)技術(shù)角度,應(yīng)深入研究與實(shí)踐抗量子密碼技術(shù)、人工智能算法監(jiān)測(cè)技術(shù)、輕量級(jí)加密通信協(xié)議、區(qū)塊鏈及隱私計(jì)算技術(shù)等安全技術(shù)創(chuàng)新,通過對(duì)抗與反對(duì)抗的博弈,持續(xù)促進(jìn)數(shù)據(jù)開發(fā)利用與安全防護(hù)的平衡發(fā)展。
(文章來源:21世紀(jì)經(jīng)濟(jì)報(bào)道)
標(biāo)簽: