10 月 23 日消息,當(dāng)?shù)貢r(shí)間 10 月 22 日,Anthropic 推出了升級(jí)版的 Claude 3.5 Sonnet 以及新的 Claude 3.5 Haiku 模型,升級(jí)版 Claude 3.5 Sonnet 不僅編程能力更強(qiáng),還帶來(lái)全新功能 computer use(計(jì)算機(jī)使用),支持像人類一樣操作計(jì)算機(jī),可以遵循用戶的命令在計(jì)算機(jī)屏幕上移動(dòng)光標(biāo),點(diǎn)擊相關(guān)位置,并通過(guò)虛擬鍵盤輸入信息,模擬人們與自己計(jì)算機(jī)的交互方式。
升級(jí)版 Claude 3.5 Sonnet 現(xiàn)已可以使用,computer use 測(cè)試版也已開放使用。
進(jìn)化后的 Claude 3.5 Sonnet 在各個(gè)方面得到了全面顯著的提升,尤其是業(yè)界領(lǐng)先的編碼能力。
Anthropic 首席科學(xué)官 Jared Kaplan 表示:“我認(rèn)為我們將進(jìn)入一個(gè)新時(shí)代,模型可以像人一樣使用所有的工具來(lái)完成任務(wù)?!?/p>
升級(jí)版 Claude 3.5 Sonnet 的發(fā)布標(biāo)志著 Anthropic 在商業(yè) AI 模型領(lǐng)域的一項(xiàng)重要進(jìn)展。該模型旨在超越傳統(tǒng)的聊天框,成為真正的“AI 代理”。
所謂的“AI 代理”是指能夠像人類一樣使用軟件并執(zhí)行其他計(jì)算機(jī)任務(wù)的 AI 模型。有些 AI 代理,如 Cognition AI 的 Devin,專門用于編程。而 Anthropic 則將其 AI 代理定位為一個(gè)多面手,聲稱它可以瀏覽網(wǎng)頁(yè)并使用任何網(wǎng)站或應(yīng)用程序。用戶可以根據(jù)自己的需求來(lái)使用 AI 代理,無(wú)論是編程等技術(shù)任務(wù),還是旅行規(guī)劃等簡(jiǎn)單任務(wù)。
在 Wired 描述的一個(gè)演示中,Claude 被要求規(guī)劃一次與朋友一起在日出時(shí)觀看金門大橋的旅行。AI 打開了一個(gè)網(wǎng)頁(yè)瀏覽器,在谷歌上搜索了一個(gè)好的觀景點(diǎn)和其他細(xì)節(jié),并將行程添加到日歷應(yīng)用程序中。雖然令人印象深刻,但 Wired 指出,Claude 沒有考慮到其他有用的細(xì)節(jié),比如如何到達(dá)那里。
在另一個(gè)演示中,Claude 被要求創(chuàng)建一個(gè)簡(jiǎn)單的網(wǎng)站,它使用微軟的 Visual Studio Code 來(lái)完成這項(xiàng)任務(wù),甚至打開了一個(gè)本地服務(wù)器來(lái)測(cè)試它剛剛創(chuàng)建的網(wǎng)站。雖然在創(chuàng)建過(guò)程中出現(xiàn)了一個(gè)小錯(cuò)誤,但當(dāng)給予提示后,其糾正了代碼。
然而,盡管這些 AI 模型看起來(lái)很有前景,但它們?nèi)匀淮嬖诳煽啃缘膯栴},尤其是在編寫代碼方面,Anthropic 的模型也不例外。據(jù) TechCrunch 報(bào)道,即使在簡(jiǎn)單的測(cè)試中,如預(yù)訂航班和修改預(yù)訂,Claude 3.5 Sonnet 也只成功完成了不到一半的任務(wù)。
除了技術(shù)上的不完善,AI 代理還帶來(lái)了明顯的安全風(fēng)險(xiǎn)。用戶是否愿意讓這些不穩(wěn)定且有時(shí)難以預(yù)測(cè)的技術(shù)訪問個(gè)人電腦文件并使用網(wǎng)絡(luò)瀏覽器,仍是一個(gè)值得深思的問題。
Anthropic 對(duì)此表示,通過(guò)逐步開放這種有限、相對(duì)更安全的 AI 模型,能夠幫助提升 AI 代理的安全性。他們?cè)诼暶髦袑懙溃骸拔覀冋J(rèn)為,與其等到更強(qiáng)大的模型出現(xiàn),不如讓現(xiàn)有較為安全的模型接觸電腦,這樣我們可以開始觀察并應(yīng)對(duì)潛在問題,在提升使用水平的同時(shí)逐步增強(qiáng)安全措施?!?/p>
原創(chuàng)文章,作者:科技探索者,如若轉(zhuǎn)載,請(qǐng)注明出處:http://rponds.cn/article/687910.html