編輯 | 1984
隨著生成式 AI 技術的普及,學術界正面臨著一個新的挑戰:越來越多疑似由 AI 生成的研究論文正在滲透到學術期刊、檔案庫和知識庫中。這些論文通常藉助 ChatGPT 等普及型 AI 應用來模仿學術寫作風格,其危害不容忽視。
作為廣受歡迎的學術搜尋引擎,Google Scholar 在展示搜尋結果時,並未區分這些可疑論文與經過嚴格質量把關的研究成果。
透過深入分析 Google Scholar 上發現的 GPT 偽造論文,研究人員發現這些論文多集中在環境、健康和電腦科學等容易受到資訊操縱的領域,這種現象無疑加劇了社會證據基礎被惡意操縱的風險,特別是在一些存在政治分歧的話題上。
來自瑞典布羅斯大學圖書館與資訊科學學院的研究人員透過系統性分析表明,Google Scholar 的索引機制缺乏嚴格的稽核標準,導致其極易受到引文操縱和虛假學術論文的侵擾,對學術誠信構成潛在威脅。
研究背景
Google Scholar 因其使用便捷、服務免費且索引範圍廣泛等特點,常被視為可靠的學術文獻來源。無論是圖書館指南、媒體報導還是資訊素養教育,都經常推薦使用這一平臺。
然而,與傳統引文資料庫相比,Google Scholar 在透明度和標準執行方面存在明顯不足。它採用自動爬蟲技術收錄文獻,主要依據技術標準而非學術質量,甚至允許未經機構認證的個人作者上傳論文。
研究發現
GPT 偽造論文的規模和分佈
在本研究中,研究團隊共發現 139 篇疑似使用 ChatGPT 製作的欺騙性論文。這些論文的發表渠道多樣:19 篇見於索引期刊,89 篇出現在非索引期刊,19 篇來自大學資料庫的學生論文,另有 12 篇是預印本資料庫中的工作論文。
值得注意的是,健康和環境類論文佔總樣本的 34%(47 篇),其中 66% 發表在非索引期刊上。這些論文往往以「醫療保健」「COVID-19」「感染」等健康領域關鍵詞,或「分析」「可持續」「全球」等環境領域術語作為標題要素,透過組合時下流行詞彙,暗示研究主題宏大而前沿。
圖示:欺詐性或未申報地使用 ChatGPT 的跨主題和場所的論文數量。(來源:論文)
論文的傳播特徵
更令人擔憂的是,這些可疑論文已經深入滲透到學術交流體系的各個環節。僅就健康相關論文而言,20 篇論文分佈在 20 個不同域名下,共涉及 46 個 URL。環境相關的 27 篇論文則分佈在 26 個域名上,涉及 56 個 URL。
大多數論文都存在多個副本,廣泛傳播於 ResearchGate、ORCiD、各大期刊網站、Easychair、Frontiers、IEEE 和 Twitter 等平臺。這種多點傳播特徵使得追蹤和清除這些論文變得異常困難,即便原始發表平臺撤回論文,在其他平臺上的副本依然可能繼續傳播。
圖示:按主題劃分的熱門領域。(來源:論文)
Google Scholar的質量控制問題
作為學術交流基礎設施中的重要一環,Google Scholar 的質量控制問題值得重視。其在文獻收錄標準方面缺乏規範、透明度和問責機制,這不僅可能損害公眾對科學的信任,還會加劇平臺被利用進行證據操縱的風險。要有效應對這一挑戰,必須統籌考慮整個學術交流生態系統,以及各方參與者的利益與激勵機制。
研究方法
研究團隊採用了系統的方法論開展研究。他們利用 Python 庫 Scholarly 檢索 Google Scholar,搜尋包含 ChatGPT 等應用程式特徵短語的論文。在獲取 227 篇候選論文後,透過多人編碼方式對論文內容進行分類,首先判斷是否存在欺騙性使用 ChatGPT 的情況,然後將確認的欺詐論文劃分為「健康」、「環境」、「計算機」和「其他」四個領域。
研究還透過描述性統計分析了不同主題和發表場所的分佈情況,並對環境和健康相關論文進行了語義分析,生成詞雲視覺化以展示主題分佈特徵。
圖示:與環境和健康相關的 GPT 捏造的可疑全文論文的字雨。(來源:論文)
結語
面對 AI 生成論文帶來的挑戰,我們需要多管齊下。一方面要從技術、教育和監管等層面入手,另一方面也要關注整個研究生態中的激勵機制。
理解欺詐論文的傳播路徑和「存活」原因同樣重要。具體措施可以包括:在學術搜尋引擎介面增加分類過濾功能,如區分索引期刊、灰色文獻和同行評議等;建立以公共利益為導向的開放獲取學術搜尋平臺;加強對政策制定者、科學傳播者和媒體工作者的教育培訓。唯有多措並舉,才能有效降低學術造假的可能性和危害。
相關連結: https://doi.org/10.37016/mr-2020-156