近日,一項發(fā)表在《JAMA Pediatrics》的研究引起了人們的關注。在這項由紐約科恩兒童醫(yī)學中心的研究人員完成的研究中,大型語言模型ChatGPT的最新版本ChatGPT-4在診斷兒科病例時的表現(xiàn)被認為令人失望。
研究小組讓ChatGPT-4嘗試診斷100個來自兩大醫(yī)學雜志的已發(fā)表兒科病例。這些病例都需要臨床醫(yī)生根據癥狀和表現(xiàn)進行診斷。然而,ChatGPT-4的表現(xiàn)卻不盡如人意。它只能正確診斷17%的病例,在72%的病例中給出了錯誤的診斷,還有11%的病例中給出的診斷過于寬泛,沒有完全捕捉到正確的病癥。
研究人員分析發(fā)現(xiàn),ChatGPT-4在建立某些疾病之間的聯(lián)系上比較薄弱。例如,它沒有將兒童自閉癥與可能的維生素缺乏癥聯(lián)系起來。此外,它也時常忽略常見病癥而提出一些罕見的診斷。
這項研究強調了臨床醫(yī)生豐富經驗在復雜診斷中的重要性。雖然AI系統(tǒng)具有潛力,但目前看來尚未準備好取代人類醫(yī)生,尤其是在較為棘手的兒科病例上。研究人員認為,可以通過使用準確可信的醫(yī)學文獻來專門訓練ChatGPT,并允許其實時獲取病例數(shù)據進行“調諧”,來提高其診斷的準確性。
盡管該研究有其局限性,但它確實突出了當前AI系統(tǒng)在臨床應用上面臨的一些困難。兒科病例尤其復雜多變,對機器提出了巨大挑戰(zhàn)。但研究人員還是對AI機器人在未來輔助醫(yī)療決策中發(fā)揮重要作用持樂觀態(tài)度。
這項研究的結果提醒我們,盡管人工智能在許多領域取得了令人矚目的成就,但在醫(yī)療領域的應用仍需謹慎。人工智能的診斷能力還有很大的提升空間,特別是在處理復雜的兒科病例時。因此,在將人工智能完全引入臨床診斷之前,需要進行更深入的研究和改進。
總的來說,這項研究為我們提供了一個寶貴的提醒:人工智能并非萬能,特別是在涉及人類健康和生命的醫(yī)療領域。雖然人工智能有著巨大的潛力,但目前看來,它還無法完全取代人類醫(yī)生的專業(yè)知識和經驗。在未來,人工智能或許可以作為醫(yī)生的得力助手,幫助醫(yī)生更快速、更準確地做出診斷。但在此之前,我們仍需對人工智能在醫(yī)療領域的應用保持審慎和理性的態(tài)度。
原創(chuàng)文章,作者:若安丶,如若轉載,請注明出處:http://rponds.cn/article/615359.html