最近,我時(shí)常在社交媒體看到形形色色的“野史段子”。盡管這類內(nèi)容早已是互聯(lián)網(wǎng)上的“固定節(jié)目”,但是,和許多傳來傳去、在歷史討論圈早已“包漿”的老梗相比,最近我看到的這類內(nèi)容,明顯出現(xiàn)了大規(guī)模的“升級創(chuàng)新”,一方面出現(xiàn)了許多前所未見的新內(nèi)容,另一方面在翔實(shí)程度、細(xì)節(jié)水平上也有很大“提高”。
從“明朝使臣質(zhì)問帖木兒為何不進(jìn)貢”,到“錢大鈞槍擊軍統(tǒng)湖北站副站長”……乍看之下,這些直戳網(wǎng)民“爽點(diǎn)”的說法既生動又有趣,配圖配字、煞有介事,有時(shí)還會附帶原始出處和參考文獻(xiàn)。然而,簡單查證之后不難發(fā)現(xiàn),這些說法要么憑空編造,要么對史實(shí)有著嚴(yán)重曲解,而其列出的“出處”和“文獻(xiàn)”,同樣是子虛烏有的存在。更讓人吃驚的是,當(dāng)我嘗試向某些AI工具問詢這些內(nèi)容時(shí),它們居然給出了一本正經(jīng)的解釋,仿佛這些內(nèi)容不是段子,而是信史的一部分。
當(dāng)前,這種現(xiàn)象早已不是孤例,以至于引發(fā)了學(xué)界的關(guān)注。近日,知名歷史學(xué)者于賡哲便在微博上吐槽:“歷史粉圈就是善于曲解史料,自嗨,中文語料庫就這樣被污染了,AI搜到之后常把這類東西作為信史,這才是現(xiàn)在值得擔(dān)憂的。”在這條微博的轉(zhuǎn)發(fā)區(qū),另一位研究者也提到:“最近聽朋友說,已經(jīng)發(fā)生過幾次,‘聰明的’本科生用AI寫歷史類畢業(yè)論文,結(jié)果里面的史料是AI編的。”
問題的關(guān)鍵,不在于AI偶爾會編造或弄錯(cuò)一些信息,而在于這一整套路徑正在形成一個(gè)令人擔(dān)憂的閉環(huán):人編-AI潤色-網(wǎng)傳-AI吸收-AI輸出-人再信。編造者為吸引眼球而生發(fā)內(nèi)容,平臺靠互動和流量放大傳播,AI模型將其納入語料,再輸出給用戶形成“答案”,最終被更多人采信、引用,甚至寫入正式文本。這個(gè)循環(huán)一旦建立,虛假信息便完成了“洗白”,很難再被非專業(yè)人士辨別出來。
更麻煩的是,AI生成內(nèi)容的“可信感”來自其表述形式,而不是真實(shí)可靠的資料來源。很多人之所以會相信這些內(nèi)容,是因?yàn)樗Z義連貫、語氣肯定、措辭準(zhǔn)確,看上去“像是對的”。但AI的本質(zhì)是模式識別與語料拼接,它并不具備對歷史真?zhèn)蔚呐袛嗄芰ΑH绻?xùn)練語料中摻雜了太多未經(jīng)驗(yàn)證乃至純屬杜撰的內(nèi)容,那么輸出的文本再“合理”,也可能是在傳遞謬誤。正如計(jì)算機(jī)領(lǐng)域的那句名言:“Garbage in, garbage out”(輸入是垃圾,輸出就是垃圾)。
這一問題的長期影響,無疑值得正視。與現(xiàn)實(shí)新聞不同,歷史話題的可驗(yàn)證性較差,普通大眾很難判斷這件事到底有沒有發(fā)生過。而當(dāng)虛假內(nèi)容一再重復(fù),甚至出現(xiàn)在AI搜索結(jié)果或論文生成中,它所帶來的認(rèn)知偏差也會更深更持久。
而相較于現(xiàn)實(shí)中的虛假信息,人們對“歷史段子”的警惕心理往往弱得多。很多人覺得,歷史本就久遠(yuǎn)復(fù)雜,真假難辨;就算段子不是真的,只要有趣,未嘗不可。甚至有觀點(diǎn)認(rèn)為,能激發(fā)大眾對歷史的興趣就行,不必太糾結(jié)于真實(shí)性。這種看法表面上輕松,實(shí)則忽視了此類亂象的長遠(yuǎn)影響。
我們?yōu)槭裁幢仨殞v史語料污染保持警惕?因?yàn)闅v史不是段子的素材庫。歷史是一種社會共同記憶,是國家敘事、文化認(rèn)同、價(jià)值傳承的基礎(chǔ)。如果我們默認(rèn)“野史娛樂”可以無限延伸、無須考證,甚至讓AI將這些誤導(dǎo)內(nèi)容當(dāng)成正史加以再生產(chǎn),最終結(jié)果將是公共認(rèn)知的系統(tǒng)性滑坡。一代人不查出處,下一代可能就找不到真正的出處了。今天當(dāng)成笑話看,明天可能就成了“事實(shí)依據(jù)”被寫進(jìn)演講稿、考試題、紀(jì)實(shí)類視頻,乃至AI生成的教輔書中。
更現(xiàn)實(shí)的問題是,當(dāng)AI工具成為越來越多用戶獲取知識的第一入口時(shí),它的語料污染就意味著認(rèn)知污染。而這一污染不是單點(diǎn)式的,更像是系統(tǒng)性下沉:段子替代文獻(xiàn),主觀代替證據(jù),想象替代考證。這種趨勢一旦普遍化,不僅會影響學(xué)習(xí)者、寫作者的判斷力,也會挑戰(zhàn)史學(xué)研究與教育本身的權(quán)威性和信任度。
應(yīng)對這一問題,既需要技術(shù)介入,又需要制度建設(shè)。平臺方和模型訓(xùn)練者應(yīng)建立明確的內(nèi)容篩選標(biāo)準(zhǔn),對歷史領(lǐng)域的語料設(shè)定更高的可信度門檻,避免流量導(dǎo)向主導(dǎo)內(nèi)容輸入。同時(shí),教育和研究機(jī)構(gòu)也要主動介入AI語料體系的建設(shè),而不能只是事后辟謠。
普通用戶在使用AI工具獲取歷史信息時(shí),也要培養(yǎng)基本的判斷力。別輕易相信那些“聽起來很真”的內(nèi)容,更不要把AI說的當(dāng)作唯一答案。歷史不怕被討論,怕的是未經(jīng)驗(yàn)證的“復(fù)制-放大-再信任”。只有當(dāng)我們意識到AI參與創(chuàng)建“知識閉環(huán)”的風(fēng)險(xiǎn),才有可能打破這個(gè)“閉環(huán)”,重新找回自己獲取專業(yè)知識的“認(rèn)知自主權(quán)”。
來源:中國青年報(bào) 作者:楊鑫宇