近年來,人工智慧(AI)在醫療領域的應用受到越來越多的關注。特別是 ChatGPT 等聊天機器人,被許多醫院希望作為輔助工具,以提升醫生的診斷效率。然而,最新釋出的一項研究顯示,使用 ChatGPT 並未顯著提高醫生的診斷能力。這項研究發表於《JAMA Network Open》期刊,揭示了 AI 在醫療診斷中的潛力及其侷限性。
研究中,參與者為50名醫生,包括26名主治醫生和24名住院醫生。他們被要求在一個小時內,根據六個真實的病例進行診斷。為了評估 ChatGPT 的輔助效果,研究人員將醫生分成兩組,一組可以使用 ChatGPT 和傳統醫療資源,另一組則只能依靠傳統資源,如臨床資訊平臺 UpToDate。
結果顯示,使用 ChatGPT 的醫生在診斷方面的得分為76%,而僅依賴傳統資源的醫生得分為74%。相比之下,ChatGPT 獨自完成診斷的得分高達90%。儘管 ChatGPT 在獨立工作時表現出色,但其與醫生的結合並未帶來明顯的提高,令研究團隊感到意外。
研究的共同第一作者、史丹佛臨床卓越研究中心的博士後研究員埃桑・高(Ethan Goh)表示,這項研究的設計並未在真實的臨床環境中進行,而是基於模擬資料,因此結果的適用性受到限制。他指出,醫生在面對實際患者時的複雜性無法在實驗中完全體現。
雖然研究表明,ChatGPT 在診斷時的表現優於部分醫生,但這並不意味著 AI 可以取代醫生的決策。相反,Goh 強調,在使用 AI 工具時,醫生仍需保持監督和判斷。此外,醫生在診斷時可能會出現固執的傾向,已經形成的初步診斷可能會影響他們對 AI 建議的接受程度,這也是未來研究需要關注的方向。
在醫療診斷的過程結束後,醫生還需要回答一系列新問題,例如 “如何進行正確的治療步驟?” 和 “需要進行哪些測試以指導患者下一步的行動?” 這表明 AI 在醫療領域的應用仍有廣闊的前景,但仍需深入探索其在實際臨床中的有效性和適用性。
自 快科技