OpenAI SearchGPT 官方演示大翻車,源代碼竟暴露搜索機(jī)制

SearchGPT 發(fā)布剛過兩天,已有人灰度測(cè)試到了。今天,網(wǎng)友 Kesku 自制的 demo 全網(wǎng)刷屏,SearchGPT 結(jié)果輸出如此神速,讓所有人為之震驚。

SearchGPT 發(fā)布剛過兩天,已有人灰度測(cè)試到了。今天,網(wǎng)友 Kesku 自制的 demo 全網(wǎng)刷屏,SearchGPT 結(jié)果輸出如此神速,讓所有人為之震驚。

OpenAI SearchGPT 官方演示大翻車,源代碼竟暴露搜索機(jī)制

但另一方面,OpenAI 當(dāng)天放出的官方演示,被外媒《大西洋月刊》曝出其中的問題。在回答「8 月在北卡羅來納 Boone 舉辦的音樂節(jié)」的問題時(shí),SearchGPT 竟弄錯(cuò)時(shí)間,出現(xiàn)了幻覺。

OpenAI 發(fā)言人 Kayla Wood 已經(jīng)向《大西洋月刊》承認(rèn)了這個(gè)錯(cuò)誤,并表示「這僅是初始的原型,我們將不斷改進(jìn)?!?/p>

這個(gè)錯(cuò)誤讓人不禁想起 Bard 曾經(jīng)造成的慘劇。

2023 年 2 月,谷歌推出了這個(gè)聊天機(jī)器人產(chǎn)品以對(duì)抗 ChatGPT,但首次亮相就出現(xiàn)了事實(shí)性錯(cuò)誤,導(dǎo)致 Alphabet 股價(jià)當(dāng)天暴跌 9%,市值瞬間蒸發(fā) 1000 億美元。

Bard 稱 James Webb 太空望遠(yuǎn)鏡拍攝了系外行星的第一張照片,但實(shí)際上這個(gè)功績(jī)屬于歐洲南部天文臺(tái)的 VLT

但好在,OpenAI 沒有股價(jià)可跌,而且僅開放內(nèi)測(cè)的做法也是相當(dāng)謹(jǐn)慎。畢竟有谷歌的前車之鑒,可以預(yù)料到,LLM 這種錯(cuò)誤幾乎是無法避免的。

即使 OpenAI 能夠找到方法大幅減少 SearchGPT 的幻覺,但面對(duì)龐大的訪問量也是「杯水車薪」。

假設(shè)幻覺率僅為 1%(這個(gè)比率很難達(dá)到),按照谷歌的規(guī)模,也會(huì)導(dǎo)致每天產(chǎn)生數(shù)千萬個(gè)錯(cuò)誤答案。

更何況,我們目前還沒有發(fā)現(xiàn)足夠可靠且有效的方法,來消除 LLM 的廢話和幻覺。

而且,Andrej Karpathy 大佬曾經(jīng)在推特上表達(dá)過這樣的觀點(diǎn):「幻覺并不是 bug,而是 LLM 最大的特點(diǎn)?!?/p>

Karpathy 將 LLM 比喻為「夢(mèng)想機(jī)器」:我們用 prompt 引導(dǎo)模型「做夢(mèng)」,再加上對(duì)訓(xùn)練文檔的模糊記憶,就得到了生成結(jié)果。

雖然大多數(shù)時(shí)候生成結(jié)果是有用的,但既然是「夢(mèng)境」就有可能失控。當(dāng) LLM 做夢(mèng)進(jìn)入有事實(shí)錯(cuò)誤的領(lǐng)域時(shí),我們就會(huì)給它貼上「幻覺」的標(biāo)簽。

這看起來是個(gè) bug,但 LLM 只是做了它一直在做的事情。

這種機(jī)制和傳統(tǒng)的搜索引擎完全不同。后者接收提示后僅僅是逐字返回?cái)?shù)據(jù)庫中最相似的文檔,因此你可以說它有「創(chuàng)造性問題」,因?yàn)樗阉饕嬗肋h(yuǎn)不可能創(chuàng)造新的回應(yīng)。

根據(jù) Karpathy 的說法,我們就很難指望由當(dāng)前 LLM 驅(qū)動(dòng)的 AI 搜索能生成 100% 真實(shí)準(zhǔn)確的結(jié)果。

那么這場(chǎng)搜索引擎的變革會(huì)怎樣展開?LLM 的「夢(mèng)境創(chuàng)意」和傳統(tǒng)搜索引擎的真實(shí)可靠,究竟是共存下去,還是會(huì)「你死我亡」?

原創(chuàng)文章,作者:科技探索者,如若轉(zhuǎn)載,請(qǐng)注明出處:http://rponds.cn/article/670198.html

科技探索者的頭像科技探索者管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論