Anthropic揭示大模型新漏洞：長上下文窗口成軟肋

AI ? 2024年4月3日 23:30:00 ? AI

在人工智能領(lǐng)域，大型語言模型（LLM）的快速發(fā)展為人們帶來了前所未有的便利，然而，其安全性問題也日益凸顯。近日，AI初創(chuàng)公司Anthropic發(fā)布了一項令人震驚的研究，揭示了大型語言模型的一個新漏洞：長上下文窗口反而成為了模型的軟肋，容易被“灌醉”并誘導執(zhí)行有害操作。

Anthropic在研究中發(fā)現(xiàn)，通過多次對話，即所謂的“多樣本越獄”（Many-shot Jailbreaking，MSJ）攻擊，可以逐漸繞過LLM的安全限制。研究人員使用256輪對話作為示例，成功誘導其大模型Claude生成炸彈制造指南。這一發(fā)現(xiàn)引發(fā)了業(yè)界的廣泛關(guān)注和擔憂。

據(jù)了解，大型語言模型通常具備強大的上下文處理能力，能夠存儲并處理大量的輸入信息。然而，正是這一特性，使得模型在面臨連續(xù)、有針對性的提問時，容易逐漸失去警惕，并最終突破自身的安全限制。

Anthropic的研究人員通過精心設(shè)計的對話序列，首先使用一系列看似無害或甚至無關(guān)的問題作為鋪墊，然后逐漸轉(zhuǎn)向更為敏感和有害的主題。經(jīng)過足夠多的對話輪次后，模型開始逐漸放松警惕，并最終在詢問如何制造炸彈時給出了詳細的指導。

這一發(fā)現(xiàn)對于大型語言模型的安全性構(gòu)成了嚴重威脅。如果攻擊者能夠利用這一漏洞，誘導模型執(zhí)行有害操作或泄露敏感信息，將可能對社會造成嚴重的后果。因此，Anthropic在發(fā)布這一研究的同時，也呼吁業(yè)界共同關(guān)注并努力修復這一漏洞。

目前，針對這一漏洞的解決方案仍在探索中。Anthropic表示，他們正在嘗試通過微調(diào)模型參數(shù)、修改提示等方式來增強模型的安全性。然而，這些措施只能在一定程度上提高模型的抗攻擊能力，并不能完全消除漏洞的存在。

業(yè)界專家指出，大型語言模型的安全性問題是一個復雜而緊迫的挑戰(zhàn)。隨著模型規(guī)模的不斷擴大和功能的不斷增強，其面臨的安全風險也將不斷增加。因此，未來需要更多的研究和努力來確保大型語言模型的安全性和可靠性。

對于普通用戶而言，在使用大型語言模型時也應保持警惕，避免向模型提出過于敏感或有害的問題。同時，相關(guān)企業(yè)和機構(gòu)也應加強對模型的監(jiān)管和管理，確保其在合法、安全的范圍內(nèi)運行。

總之，Anthropic的這一發(fā)現(xiàn)揭示了大型語言模型在安全方面存在的新挑戰(zhàn)。未來，隨著技術(shù)的不斷進步和應用場景的不斷拓展，我們需要更加關(guān)注并努力解決這些安全問題，以確保人工智能技術(shù)的健康發(fā)展和社會應用的廣泛推廣。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請注明出處：http://rponds.cn/article/643515.html

AI認證作者

0 0

AI

亞馬遜追加40億美元投資Anthropic AI競賽再升級

Anthropic與AWS深化合作，亞馬遜追加40億投資達80億，強化硬件軟件協(xié)同開發(fā)。AWS與Anthropic合作緊密，Claude模型成企業(yè)核心AI設(shè)施。生成式AI產(chǎn)業(yè)生態(tài)中，巨頭組建新AI聯(lián)盟，云廠商視AI為新增長引擎。

蘋果派
2024年11月25日
新聞

美國司法部進一步打擊壟斷，試圖阻止谷歌與Anthropic的交易

美司法部建議禁谷歌收購、投資控制消費者搜索信息的公司，或解除與AI初創(chuàng)Anthropic合作，并強調(diào)谷歌應剝離Chrome瀏覽器。谷歌未回應，曾承諾向Anthropic投資20億美元并簽署云計算協(xié)議。

蘋果派
2024年11月22日
新聞

亞馬遜計劃向AI創(chuàng)企Anthropic追加數(shù)十億美元投資

近日，據(jù)The Information援引知情人士透露，亞馬遜正在討論向其合作伙伴、OpenAI的競爭對手Anthropic追加數(shù)十億美元的投資。這一消息引起了業(yè)界的廣泛關(guān)注。亞…

小科同學
2024年11月8日
AI

Anthropic 推出升級版 Claude 3.5 Sonnet 模型，可操控用戶電腦

Anthropic 推出了升級版的 Claude 3.5 Sonnet 以及新的 Claude 3.5 Haiku 模型，升級版 Claude 3.5 Sonnet 不僅編程能力更強，還帶來全新功能 computer use（計算機使用），支持像人類一樣操作計算機，可以遵循用戶的命令在計算機屏幕上移動光標，點擊相關(guān)位置，并通過虛擬鍵盤輸入信息，模擬人們與自己計算機的交互方式。

科技探索者
2024年10月23日
AI

英偉達開源Nemotron-70B模型，性能超越GPT-4o和Claude 3.5

近日，英偉達悄然開源了其最新的超強大模型——Nemotron-70B。一經(jīng)發(fā)布，該模型便迅速在AI社區(qū)引發(fā)轟動，其性能在多個基準測試中超越了包括GPT-4、GPT-4 Turbo以…

AI
2024年10月18日
新聞

亞馬遜40億美元投資AI公司Anthropic交易獲英國批準

英國反壟斷監(jiān)管機構(gòu)“競爭和市場管理局”（CMA）今日宣布，不會對亞馬遜40億美元投資AI初創(chuàng)公司Anthropic交易展開進一步的調(diào)查。

潮玩君
2024年9月29日
AI

Anthropic 擬以 300-400 億美元估值融資，加速與 OpenAI 競爭

美國人工智能（AI）初創(chuàng)公司Anthropic 正在積極與投資者洽談新一輪融資事宜，據(jù)《The Information》報道，此次融資后，Anthropic 的估值有望飆升至300…

AI
2024年9月24日
AI

OpenAI與Anthropic同意美國政府提前評估新AI模型安全

近日，全球知名的人工智能公司OpenAI和Anthropic宣布了一項重要舉措，與美國人工智能安全研究所（US AI Safety Institute）簽署諒解備忘錄，承諾在發(fā)布重…

AI
2024年8月30日
AI

OpenAI和Anthropic支持美國政府先行評估新模型風險

OpenAI和Anthropic作為AI領(lǐng)域的領(lǐng)軍企業(yè)，深知自身在推動技術(shù)進步方面承擔的責任。為了確保新的AI模型不會帶來社會風險，兩家公司決定在推出新模型之前，交由美國政府下屬的AI安全研究院進行評估。這一合作旨在確保技術(shù)進步服務于社會的長遠利益，同時避免潛在的負面影響。

潮玩君
2024年8月30日
AI

亞馬遜擬收購芯片制造和AI模型壓縮廠商Perceive 已達成協(xié)議

據(jù)外媒報道，在去年9月份和今年3月份分別向人工智能初創(chuàng)公司Anthropic投入12.5億美元、27.5億美元，兌現(xiàn)最多投資40億美元的承諾之后，亞馬遜仍在進行人工智能方面的投資，他們已同Xperi，達成了收購后者旗下芯片制造和AI模型壓縮廠商Perceive的協(xié)議。

蘋果派
2024年8月20日
AI

Llama 3.1 VS GPT-4o：性能與成本的深度較量

在人工智能中，大型語言模型（LLM）如同璀璨的明星，以其卓越的性能引領(lǐng)著技術(shù)的發(fā)展方向。然而，最新的研究成果卻向我們展示了另一番景象——通過創(chuàng)新的搜索策略，小型模型也能在特定任務上…

AI
2024年8月16日
AI

OpenAI 聯(lián)合創(chuàng)始人 John Schulman 離職，加盟 AI 初創(chuàng)公司 Anthropic

近日，人工智能領(lǐng)域的知名人物、OpenAI 聯(lián)合創(chuàng)始人 John Schulman 宣布離職，并正式加入人工智能初創(chuàng)公司 Anthropic。這一消息在業(yè)界引起了廣泛關(guān)注。 Sch…

AI
2024年8月6日
AI

OpenAI面臨巨大虧損壓力? 預計今年將達50億美元

近日，據(jù)《The Information》此前未公開的內(nèi)部財務數(shù)據(jù)和相關(guān)人士的分析，OpenAI預計今年將虧損50億美元，亟需在12個月之內(nèi)籌集更多現(xiàn)金，以確保生存。目前，Ope…

蘋果派
2024年7月26日
AI

AI初創(chuàng)公司 Anthropic 發(fā)布了其 Claude 聊天機器人 Android 應用程序

Anthropic 的 Claude 聊天機器人已經(jīng)發(fā)布免費的 Android 應用程序，Android 手機用戶現(xiàn)在也可以在移動設(shè)備上使用該公司的 AI。早在今年 5 月份 An…

AI
2024年7月17日
新聞

蘋果、NVIDIA 和 Anthropic 被爆使用未經(jīng)許可的 YouTube 轉(zhuǎn)錄文本訓練其 AI 模型

據(jù)媒體爆料，蘋果、NVIDIA 和 Anthropic 等全球最大的科技公司未經(jīng)許可在包含超過 173,000 個 YouTube 視頻轉(zhuǎn)錄的數(shù)據(jù)集上訓練了他們的 AI 模型。該數(shù)…

科技新聞
2024年7月17日
AI

Gemma 2 vs Llama 3：新一代AI大語言模型的性能與成本之爭

隨著人工智能技術(shù)的飛速發(fā)展，大型語言模型成為推動這一領(lǐng)域進步的重要力量。近日，谷歌發(fā)布了其最新一代開源AI大語言模型Gemma 2，這款模型以90億（9B）和270億（27B）參數(shù)…

AI
2024年6月28日
AI

GPT-4o vs Claude 3.5 Sonnet：兩大AI模型的速度與性能對決

隨著人工智能技術(shù)的飛速發(fā)展，OpenAI和Anthropic兩大科技巨頭紛紛推出了自家的最新AI模型——GPT-4o和Claude 3.5 Sonnet。這兩款模型在各自的領(lǐng)域內(nèi)都…

AI
2024年6月23日
AI

Anthropic 發(fā)布全新 AI 模型 Claude 3.5 Sonnet，強化與 OpenAI 的競爭

在人工智能領(lǐng)域，一場激烈的競賽正在上演。本周四，由 OpenAI 前研發(fā)高管創(chuàng)立的 Anthropic 公司，正式發(fā)布了其最新的大型語言模型 Claude 3.5 Sonnet，這…

AI
2024年6月21日
AI

OpenAI 競爭對手 Anthropic 發(fā)布其最強 AI 大模型 Claude 3.5

OpenAI 競爭對手 Anthropic 周四發(fā)布了其迄今為止最強大的 AI 模型 Claude 3.5 Sonnet。

蘋果派
2024年6月21日
AI

傳聞OpenAI正訓練GPT-5：智能AI即將徹底改變你的生活！

在人工智能領(lǐng)域持續(xù)創(chuàng)新的OpenAI公司，繼推出突破性的GPT-4o大型語言模型（LLM）后，近日宣布正積極訓練下一代旗艦模型GPT-5，此舉預示著人工智能向人工通用智能（AGI）…

AI
2024年5月30日

發(fā)表回復

登錄后才能評論

Anthropic揭示大模型新漏洞：長上下文窗口成軟肋

相關(guān)推薦

發(fā)表回復