SearchGPT 發(fā)布剛過兩天,已有人灰度測(cè)試到了。今天,網(wǎng)友 Kesku 自制的 demo 全網(wǎng)刷屏,SearchGPT 結(jié)果輸出如此神速,讓所有人為之震驚。
但另一方面,OpenAI 當(dāng)天放出的官方演示,被外媒《大西洋月刊》曝出其中的問題。在回答「8 月在北卡羅來納 Boone 舉辦的音樂節(jié)」的問題時(shí),SearchGPT 竟弄錯(cuò)時(shí)間,出現(xiàn)了幻覺。
OpenAI 發(fā)言人 Kayla Wood 已經(jīng)向《大西洋月刊》承認(rèn)了這個(gè)錯(cuò)誤,并表示「這僅是初始的原型,我們將不斷改進(jìn)?!?/p>
這個(gè)錯(cuò)誤讓人不禁想起 Bard 曾經(jīng)造成的慘劇。
2023 年 2 月,谷歌推出了這個(gè)聊天機(jī)器人產(chǎn)品以對(duì)抗 ChatGPT,但首次亮相就出現(xiàn)了事實(shí)性錯(cuò)誤,導(dǎo)致 Alphabet 股價(jià)當(dāng)天暴跌 9%,市值瞬間蒸發(fā) 1000 億美元。
Bard 稱 James Webb 太空望遠(yuǎn)鏡拍攝了系外行星的第一張照片,但實(shí)際上這個(gè)功績(jī)屬于歐洲南部天文臺(tái)的 VLT
但好在,OpenAI 沒有股價(jià)可跌,而且僅開放內(nèi)測(cè)的做法也是相當(dāng)謹(jǐn)慎。畢竟有谷歌的前車之鑒,可以預(yù)料到,LLM 這種錯(cuò)誤幾乎是無法避免的。
即使 OpenAI 能夠找到方法大幅減少 SearchGPT 的幻覺,但面對(duì)龐大的訪問量也是「杯水車薪」。
假設(shè)幻覺率僅為 1%(這個(gè)比率很難達(dá)到),按照谷歌的規(guī)模,也會(huì)導(dǎo)致每天產(chǎn)生數(shù)千萬個(gè)錯(cuò)誤答案。
更何況,我們目前還沒有發(fā)現(xiàn)足夠可靠且有效的方法,來消除 LLM 的廢話和幻覺。
而且,Andrej Karpathy 大佬曾經(jīng)在推特上表達(dá)過這樣的觀點(diǎn):「幻覺并不是 bug,而是 LLM 最大的特點(diǎn)?!?/p>
Karpathy 將 LLM 比喻為「夢(mèng)想機(jī)器」:我們用 prompt 引導(dǎo)模型「做夢(mèng)」,再加上對(duì)訓(xùn)練文檔的模糊記憶,就得到了生成結(jié)果。
雖然大多數(shù)時(shí)候生成結(jié)果是有用的,但既然是「夢(mèng)境」就有可能失控。當(dāng) LLM 做夢(mèng)進(jìn)入有事實(shí)錯(cuò)誤的領(lǐng)域時(shí),我們就會(huì)給它貼上「幻覺」的標(biāo)簽。
這看起來是個(gè) bug,但 LLM 只是做了它一直在做的事情。
這種機(jī)制和傳統(tǒng)的搜索引擎完全不同。后者接收提示后僅僅是逐字返回?cái)?shù)據(jù)庫中最相似的文檔,因此你可以說它有「創(chuàng)造性問題」,因?yàn)樗阉饕嬗肋h(yuǎn)不可能創(chuàng)造新的回應(yīng)。
根據(jù) Karpathy 的說法,我們就很難指望由當(dāng)前 LLM 驅(qū)動(dòng)的 AI 搜索能生成 100% 真實(shí)準(zhǔn)確的結(jié)果。
那么這場(chǎng)搜索引擎的變革會(huì)怎樣展開?LLM 的「夢(mèng)境創(chuàng)意」和傳統(tǒng)搜索引擎的真實(shí)可靠,究竟是共存下去,還是會(huì)「你死我亡」?
原創(chuàng)文章,作者:科技探索者,如若轉(zhuǎn)載,請(qǐng)注明出處:http://rponds.cn/article/670198.html