近期,一項由美國北卡羅萊納大學教堂山分校和艾倫 AI 研究所共同進行的研究顯示,OpenAI 的最新聊天機器人 GPT-4o 在道德解釋和建議方面展現(xiàn)出超越人類專家的能力。這一發(fā)現(xiàn)引發(fā)了關于人工智能(AI)在道德推理領域應用的廣泛討論。
在這項研究中,研究人員進行了兩項對比實驗,旨在探討 GPT 模型與人類道德推理能力的差異。在第一項研究中,501 名美國成年人被要求對比 GPT-3.5-turbo 模型的道德解釋與其他人類參與者的解釋。結果顯示,GPT 的解釋被認為更符合道德、更值得信賴、更周到,且評估者認為 AI 的評估比其他人更可靠。盡管差異較小,但這一發(fā)現(xiàn)表明 AI 在道德推理方面能夠匹配甚至超越人類水平。
在第二項研究中,研究人員將 GPT-4o 模型生成的建議與《紐約時報》“倫理學家”專欄中著名倫理學家 Kwame Anthony Appiah 的建議進行了比較。在針對 50 個“倫理困境”的建議質量評分中,GPT-4o 在“幾乎每個方面”都獲得了比人類專家更高的評分。參與者普遍認為 AI 生成的建議在道德上更正確、更值得信賴、更周到、更準確。只有在感知細微差別方面,人工智能和人類專家之間沒有顯著差異。
研究人員認為,這些結果表明 GPT-4o 已經(jīng)通過了所謂的“比較道德圖靈測試”(cMTT)。進一步分析顯示,GPT-4o 在提供建議時使用的道德和積極語言比人類專家更多,這可能是導致其建議評分更高的原因之一。然而,研究人員也指出,這并非唯一因素,未來還需要進行更多研究以深入探索 AI 在道德推理領域的潛力。
值得注意的是,這項研究僅針對美國參與者進行,因此后續(xù)研究還需要探討不同文化背景下人們對 AI 生成的道德推理的看法。盡管如此,這一發(fā)現(xiàn)仍然為 AI 在道德決策支持領域的應用提供了有力支持,并可能引發(fā)關于 AI 道德責任和監(jiān)管的進一步討論。
隨著 AI 技術的不斷進步,其在道德推理領域的應用將越來越廣泛。從醫(yī)療診斷到自動駕駛汽車,再到社交媒體內容審核,AI 的道德決策能力將直接影響到人類社會的各個方面。因此,我們需要更加關注 AI 的道德問題,并制定相應的政策和規(guī)范以確保 AI 的安全和可靠。
原創(chuàng)文章,作者:AI,如若轉載,請注明出處:http://rponds.cn/article/662942.html