ChatGPT 如同醫生般確診急診病患:研究
荷蘭研究人員發現,人工智慧聊天機器人 ChatGPT 在診斷急診病患時,至少與醫生相當準確,甚至在某些情況下超越了醫生。研究報告於本週三發表,並指出 AI 可能「革命化醫療領域」。然而報告強調急診醫生無需放下手術服,因為聊天機器人可以加速診斷,但無法取代人類醫學判斷和經驗。
該研究選取了 2022 年荷蘭一家急診部門治療的 30 個病例,將匿名化的患者病史、實驗室檢驗結果和醫生的觀察結果輸入到 ChatGPT 中,並要求它提供五個可能的診斷。然後將聊天機器人的候選病因與同樣獲得相同資訊的急診醫生提出的五個診斷進行比對,再對每個病例的正確診斷進行交叉取證。在其中 87% 的病例中,醫生的診斷在前五位中正確無誤,而 ChatGPT 3.5 版本和 4.0 版本的正確率則分別為 97% 和 87%。「簡而言之,這表明 ChatGPT 能像人類醫生一樣提出醫學診斷,」荷蘭耶羅恩·博斯博士醫院急診科的 Hidde ten Berg 表示。
雖然在該項研究中 ChatGPT 表現優異,但共同作者 Steef Kurstjens 表示這並不意味著電腦將有朝一日主宰急診,而是 AI 可以在協助壓力大的醫護人員方面發揮重要作用。「關鍵是聊天機器人並不取代醫生,但它可以幫助提供診斷,並可能提出醫生未曾考慮的想法,」Kurstjens 在接受法新社的採訪時表示。
潛在問題與約束
報告還指出,與其他領域一樣,ChatGPT 也存在一定的約束。研究報告指出,該聊天機器人的推理能力「有時在醫學上不太可能或矛盾,可能導致錯誤的診斷和誤導,具有重大影響。」研究人員還承認研究存在一些不足之處。樣本量較小,僅調查了 30 個案例。此外研究僅考慮了相對簡單的病例,即只存在一個主要問題的患者。隨著病例變得更加複雜,聊天機器人的表現如何尚不明確。「ChatGPT 在為患有複雜或罕見疾病的患者提供多種不同診斷的效能尚未得到取證。」Kurstjens 解釋道。
有時候,聊天機器人在前五個可能性中並未提供正確的診斷,例如在腹主動脈瘤(主動脈動脈腫脹的潛在致命併發症)的情況下。安慰的是,在這種情況下,醫生也搞錯了。報告列舉了聊天機器人的幾個「錯誤」,例如在血紅蛋白常規的患者中診斷貧血(血液中血紅蛋白水平低)。總之「ChatGPT 不是醫療裝置,使用聊天機器人處理醫療資料時可能存在隱私問題,」ten Berg 總結道。「然而在急診部門使用人工智慧可以節省時間、縮短等待時間。使用人工智慧的好處可能在於支援經驗較少的醫生,或者可以幫助檢測罕見疾病,」他補充道。以上發現將在 2023 年歐洲急診醫學會議(EUSEM)上發表。
延伸閱讀
- 參議院研究建議:每年至少撥款 320 億美元用於人工智慧計劃
- Google I/O 盛會 AI 領域的重大訊息
- Google 掃描通話的人工智慧或增加預設審查,隱私專家發出警告
- 柏林科技企業 trawa 籌得 1 千萬歐元,運用人工智慧協助中小企業更輕鬆購買可再生能源
- Google 將在 YouTube 學術影片中推出人工智慧生成的測驗
- Google 在 I/O 主題演講中提到「AI」超過 120 次
- 在人工智慧電影節上,人性戰勝科技
- AI 推動社會變革,女性呈現關鍵力量
- Anthropic 的 Claude 在 iOS 平臺上的推出獲得微弱反韇,與 ChatGPT 的首次亮相相比
- 開放 AI (OpenAI)的 ChatGPT 新聞發布:我們當前所知道的事情