OpenAI SearchGPT 官方演示大翻車，源代碼竟暴露搜索機(jī)制

科技探索者 ? 2024年7月29日 12:19:00 ? AI

SearchGPT 發(fā)布剛過兩天，已有人灰度測(cè)試到了。今天，網(wǎng)友 Kesku 自制的 demo 全網(wǎng)刷屏，SearchGPT 結(jié)果輸出如此神速，讓所有人為之震驚。

但另一方面，OpenAI 當(dāng)天放出的官方演示，被外媒《大西洋月刊》曝出其中的問題。在回答「8 月在北卡羅來納 Boone 舉辦的音樂節(jié)」的問題時(shí)，SearchGPT 竟弄錯(cuò)時(shí)間，出現(xiàn)了幻覺。

OpenAI 發(fā)言人 Kayla Wood 已經(jīng)向《大西洋月刊》承認(rèn)了這個(gè)錯(cuò)誤，并表示「這僅是初始的原型，我們將不斷改進(jìn)?！?/p>

這個(gè)錯(cuò)誤讓人不禁想起 Bard 曾經(jīng)造成的慘劇。

2023 年 2 月，谷歌推出了這個(gè)聊天機(jī)器人產(chǎn)品以對(duì)抗 ChatGPT，但首次亮相就出現(xiàn)了事實(shí)性錯(cuò)誤，導(dǎo)致 Alphabet 股價(jià)當(dāng)天暴跌 9%，市值瞬間蒸發(fā) 1000 億美元。

Bard 稱 James Webb 太空望遠(yuǎn)鏡拍攝了系外行星的第一張照片，但實(shí)際上這個(gè)功績(jī)屬于歐洲南部天文臺(tái)的 VLT

但好在，OpenAI 沒有股價(jià)可跌，而且僅開放內(nèi)測(cè)的做法也是相當(dāng)謹(jǐn)慎。畢竟有谷歌的前車之鑒，可以預(yù)料到，LLM 這種錯(cuò)誤幾乎是無法避免的。

即使 OpenAI 能夠找到方法大幅減少 SearchGPT 的幻覺，但面對(duì)龐大的訪問量也是「杯水車薪」。

假設(shè)幻覺率僅為 1%（這個(gè)比率很難達(dá)到），按照谷歌的規(guī)模，也會(huì)導(dǎo)致每天產(chǎn)生數(shù)千萬個(gè)錯(cuò)誤答案。

更何況，我們目前還沒有發(fā)現(xiàn)足夠可靠且有效的方法，來消除 LLM 的廢話和幻覺。

而且，Andrej Karpathy 大佬曾經(jīng)在推特上表達(dá)過這樣的觀點(diǎn)：「幻覺并不是 bug，而是 LLM 最大的特點(diǎn)?！?/p>

Karpathy 將 LLM 比喻為「夢(mèng)想機(jī)器」：我們用 prompt 引導(dǎo)模型「做夢(mèng)」，再加上對(duì)訓(xùn)練文檔的模糊記憶，就得到了生成結(jié)果。

雖然大多數(shù)時(shí)候生成結(jié)果是有用的，但既然是「夢(mèng)境」就有可能失控。當(dāng) LLM 做夢(mèng)進(jìn)入有事實(shí)錯(cuò)誤的領(lǐng)域時(shí)，我們就會(huì)給它貼上「幻覺」的標(biāo)簽。

這看起來是個(gè) bug，但 LLM 只是做了它一直在做的事情。

這種機(jī)制和傳統(tǒng)的搜索引擎完全不同。后者接收提示后僅僅是逐字返回?cái)?shù)據(jù)庫中最相似的文檔，因此你可以說它有「創(chuàng)造性問題」，因?yàn)樗阉饕嬗肋h(yuǎn)不可能創(chuàng)造新的回應(yīng)。

根據(jù) Karpathy 的說法，我們就很難指望由當(dāng)前 LLM 驅(qū)動(dòng)的 AI 搜索能生成 100% 真實(shí)準(zhǔn)確的結(jié)果。

那么這場(chǎng)搜索引擎的變革會(huì)怎樣展開？LLM 的「夢(mèng)境創(chuàng)意」和傳統(tǒng)搜索引擎的真實(shí)可靠，究竟是共存下去，還是會(huì)「你死我亡」？

原創(chuàng)文章，作者：科技探索者，如若轉(zhuǎn)載，請(qǐng)注明出處：http://rponds.cn/article/670198.html

OpenAI SearchGPT

科技探索者管理團(tuán)隊(duì)

0 0

AI

OpenAI GPT-5研發(fā)受阻，成本高昂效果未及預(yù)期

近日，《華爾街日?qǐng)?bào)》報(bào)道稱，OpenAI正在研發(fā)的下一代大型語言模型GPT-5遭遇研發(fā)難題，進(jìn)度滯后且成果未達(dá)預(yù)期。這一消息與此前有關(guān)GPT-5可能無法實(shí)現(xiàn)顯著性能飛躍的報(bào)道相呼應(yīng)…

AI
18小時(shí)前
AI

意大利對(duì)OpenAI罰款1500萬歐元，因ChatGPT數(shù)據(jù)隱私違規(guī)

近日，意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)Garante發(fā)布公告，宣布對(duì)OpenAI處以1500萬歐元（約合1.14億元人民幣）的罰款。這一處罰是在對(duì)生成式AI應(yīng)用使用個(gè)人數(shù)據(jù)情況進(jìn)行調(diào)查后做出的。…

NEWS
1天前
AI

OpenAI更新macOS版ChatGPT，新增備忘錄及IDE支持

OpenAI近日對(duì)其macOS版ChatGPT應(yīng)用進(jìn)行了更新，新增了支持讀取macOS系統(tǒng)集成的備忘錄App（Apple Notes）及第三方備忘錄App如Notion等功能。現(xiàn)在…

AI
2天前
AI

桌面版ChatGPT功能大升級(jí)：新增30余應(yīng)用支持

在OpenAI的“12天活動(dòng)”進(jìn)入尾聲，在活動(dòng)倒數(shù)第二天，公司展示了桌面版ChatGPT的功能改進(jìn)。此次演示強(qiáng)調(diào)，ChatGPT正逐步從聊天機(jī)器人向AI智能體工具轉(zhuǎn)變，旨在桌面環(huán)境…

AI
2天前
AI

OpenAI o1推理模型API向特定開發(fā)者開放，多項(xiàng)開發(fā)者工具同步更新

近日，在“OpenAI 12天”活動(dòng)的第九天，OpenAI宣布了重要更新。其最新的“推理”人工智能模型o1已正式通過API向部分開發(fā)者開放。據(jù)了解，首批能夠使用o1 API的開發(fā)…

AI
4天前
AI

谷歌發(fā)布Veo 2視頻生成模型，分辨率是Sora模型的4倍

今日，谷歌公司發(fā)布公告，正式推出視頻生成模型Veo 2。據(jù)官方消息，這個(gè)新模型在理解現(xiàn)實(shí)世界物理、人類運(yùn)動(dòng)和表達(dá)的細(xì)微差別方面表現(xiàn)更出色，從而能夠進(jìn)一步提升視頻整體的細(xì)節(jié)和逼真度。…

Google
5天前
AI

OpenAI向所有用戶開放ChatGPT搜索功能

在“OpenAI 12天”活動(dòng)進(jìn)展到第8天的時(shí)候，OpenAI發(fā)布了一則重要消息，現(xiàn)在所有登錄用戶都能夠使用ChatGPT搜索功能了。 OpenAI此次免費(fèi)向所有用戶開放ChatG…

AI
5天前
AI

ChatGPT搜索引擎向所有用戶免費(fèi)開放：新增實(shí)時(shí)搜索和高級(jí)語音功能

OpenAI推出搜索引擎工具，ChatGPT搜索功能獲大量更新，由GPT-4o模型支持，可快速獲取實(shí)時(shí)內(nèi)容，支持高級(jí)語音模式，移動(dòng)端使用效率提升40%以上。

潮玩君
5天前
新聞

Meta要求加州阻止OpenAI轉(zhuǎn)營(yíng)利計(jì)劃

據(jù)《華爾街日?qǐng)?bào)》今日?qǐng)?bào)道稱，Meta已致信加州總檢察長(zhǎng)Rob Bonta，要求阻止OpenAI轉(zhuǎn)型為營(yíng)利性企業(yè)的計(jì)劃。此舉表明，Meta在硅谷兩大AI巨頭間的爭(zhēng)斗中站在了馬斯克一方…

NEWS
2024年12月14日
AI

OpenAI ChatGPT全球宕機(jī)，部分服務(wù)逐步恢復(fù)中

今日，全球知名的人工智能公司OpenAI遭遇了一次重大服務(wù)中斷，其備受歡迎的聊天機(jī)器人ChatGPT在全球范圍內(nèi)出現(xiàn)了宕機(jī)現(xiàn)象。此外，與ChatGPT相關(guān)的Sora服務(wù)及API接口…

AI
2024年12月12日
新聞

ChatGPT 高級(jí)語音模式研究員創(chuàng)立WaveForms AI 新公司估值達(dá) 2 億美元

近日，有媒體報(bào)道，曾主導(dǎo)開發(fā)ChatGPT高級(jí)語音模式的前OpenAI研究員Alexis Conneau宣布創(chuàng)立WaveForms AI。這家新公司已完成由Andreessen H…

潮玩君
2024年12月11日
AI

OpenAI推出Sora文生視頻AI模型，支持1080P高清視頻生成

昨日，OpenAI公司宣布正式推出其最新的Sora文生視頻AI模型。此次發(fā)布的新版本為Sora Turbo，相較于今年2月推出的預(yù)覽版，生成速度有了顯著提升。據(jù)了解，Sora T…

AI
2024年12月10日
AI

Sora二代實(shí)機(jī)演示曝光，支持圖生視頻功能

近日，關(guān)于Sora二代的實(shí)機(jī)演示視頻被曝光，展示了其強(qiáng)大的圖生視頻功能。據(jù)泄露視頻顯示，Sora v2不僅支持長(zhǎng)達(dá)1分鐘的視頻輸出，還提供了三種生成模式，包括文本轉(zhuǎn)視頻、文本+圖像…

AI
2024年12月9日
AI

OpenAI新功能太強(qiáng)大，每月服務(wù)費(fèi)200美元

近日，OpenAI在其“12天12場(chǎng)直播”活動(dòng)的首秀中，發(fā)布了推理大模型o1的滿血版本及進(jìn)階模式，并推出了ChatGPT Pro訂閱服務(wù)。這一服務(wù)每月收費(fèi)200美元，為用戶提供了前…

AI
2024年12月7日
AI

OpenAI首次在瑞士設(shè)立辦公室，招募翟曉華等3名谷歌工程師推進(jìn)研發(fā)多模態(tài)AI模型

OpenAI將在蘇黎世建新辦公室，拓展歐洲市場(chǎng)，吸納3位谷歌DeepMind AI專家推進(jìn)多模態(tài)AI研發(fā)。蘇黎世為科技中心，翟曉華為資深A(yù)I科學(xué)家，曾是VisionTransformer作者之一。

科技探索者
2024年12月7日
AI

全球AI基礎(chǔ)設(shè)施支出將逐年增加預(yù)計(jì)2028年超過1000億美元

AI聊天機(jī)器人ChatGPT帶動(dòng)AI領(lǐng)域投資增長(zhǎng)，全球AI基礎(chǔ)設(shè)施投資預(yù)計(jì)連年增加，2028年將達(dá)1070億美元，上半年投資318億美元增37%，加速服務(wù)器比重將增至60%，5年復(fù)合年均增長(zhǎng)率19%。

科技探索者
2024年11月30日
商業(yè)

OpenAI獲軟銀15億美元新投資，員工可在收購(gòu)要約中出售股票

據(jù)外媒11月27日消息，OpenAI獲得了軟銀15億美元新投資。值得一提的是，這次投資允許OpenAI的員工在收購(gòu)要約中出售他們的股票。據(jù)了解，員工們需要在12月24日之前決定是…

商業(yè)頭條
2024年11月27日
AI

OpenAI 首席產(chǎn)品官：ChatGPT 網(wǎng)頁端本周引入高級(jí)語音模式

OpenAI本周在ChatGPT網(wǎng)頁版上線高級(jí)語音模式，面向付費(fèi)用戶。依托GPT-4o模型，可感知非語言信號(hào)并模仿情緒。Plus和Teams用戶有語音使用上限。OpenAI正優(yōu)化交互方式，免費(fèi)用戶將有機(jī)會(huì)體驗(yàn)。

潮玩君
2024年11月25日
新聞

iOS 19發(fā)布日期：預(yù)計(jì)2025年發(fā)布，新版Siri功能提前泄露

近日，彭博社的知名記者 Mark Gurman 在其發(fā)布的 Power On 時(shí)事通訊中，發(fā)布了關(guān)于 iOS 19發(fā)布時(shí)間的消息。據(jù)悉，iOS 19 預(yù)計(jì)將于 2025 年 6 月…

Apple
2024年11月25日
新聞

OpenAI計(jì)劃推出自研瀏覽器，正面挑戰(zhàn)谷歌Chrome

據(jù)外媒報(bào)道，人工智能巨頭OpenAI正考慮通過自行研發(fā)一款基于AI聊天機(jī)器人的瀏覽器，對(duì)全球搜索引擎巨頭谷歌發(fā)起直接競(jìng)爭(zhēng)，特別是針對(duì)其廣受歡迎的Chrome瀏覽器。知情人士透露，…

AI
2024年11月22日

發(fā)表回復(fù)

登錄后才能評(píng)論

OpenAI SearchGPT 官方演示大翻車，源代碼竟暴露搜索機(jī)制

相關(guān)推薦

發(fā)表回復(fù)