蘋果開發(fā)出新款A(yù)I：能“看懂”屏幕上內(nèi)容并用語音回復(fù)

野游栗 ? 2024年4月7日 17:08:00 ? AI, 新聞

4月2日消息，蘋果公司的研究團(tuán)隊(duì)最近發(fā)表了一篇論文，宣布他們成功開發(fā)出了一款創(chuàng)新的人工智能系統(tǒng)。這個(gè)系統(tǒng)能夠準(zhǔn)確地理解屏幕上模糊的內(nèi)容及其相關(guān)對話和背景環(huán)境，進(jìn)而實(shí)現(xiàn)與語音助手更加自然的互動(dòng)。

這個(gè)系統(tǒng)被命名為ReALM（Reference Resolution As Language Modeling，即以語言建模為基礎(chǔ)的參考解析），它通過大語言模型的運(yùn)用，將理解屏幕視覺元素指向的復(fù)雜任務(wù)轉(zhuǎn)化為一個(gè)純粹的語言問題。這一轉(zhuǎn)換使得ReALM在性能上相較于現(xiàn)有技術(shù)有了顯著的提升。

蘋果研究團(tuán)隊(duì)強(qiáng)調(diào)：“讓對話助手能夠理解上下文，包括相關(guān)的內(nèi)容指向，非常關(guān)鍵。能讓用戶根據(jù)他們所看到的屏幕內(nèi)容進(jìn)行提問，是確保真正實(shí)現(xiàn)語音操作體驗(yàn)的重要一步?！?/p>

增強(qiáng)對話助手的能力

ReALM的一大創(chuàng)新在于它能夠重新構(gòu)建屏幕內(nèi)容，即通過分析屏幕上的信息及其位置信息來生成文本表示，這一點(diǎn)對捕捉視覺布局至關(guān)重要。研究人員展示了這種方法與專為內(nèi)容指向調(diào)整的語言模型結(jié)合起來，能在執(zhí)行相關(guān)任務(wù)時(shí)超越GPT-4的性能。

研究人員表示：“我們對現(xiàn)有系統(tǒng)進(jìn)行了顯著改進(jìn)，在處理多種類型的內(nèi)容指向時(shí)均展現(xiàn)出卓越性能。我們的最小模型就實(shí)現(xiàn)了超過5%的性能提升，而大型模型的表現(xiàn)則明顯超過了GPT-4?！?/p>

實(shí)際應(yīng)用與局限性

這項(xiàng)研究凸顯了專注于語言模型在處理如內(nèi)容指向解析等任務(wù)上的巨大潛力。由于響應(yīng)時(shí)間或計(jì)算資源的限制，大型端到端模型往往難以實(shí)施。通過這項(xiàng)創(chuàng)新性研究，蘋果展現(xiàn)了其持續(xù)投入，使Siri等產(chǎn)品在對話和理解上下文方面更加出色。

盡管如此，研究人員也指出，依靠自動(dòng)化解析屏幕內(nèi)容仍然面臨挑戰(zhàn)。在處理更復(fù)雜的視覺內(nèi)容，比如區(qū)分多個(gè)相似圖像時(shí)，可能需要結(jié)合計(jì)算機(jī)視覺和多模態(tài)技術(shù)。

努力縮小與AI競爭對手差距

雖然在人工智能領(lǐng)域蘋果曾稍顯落后，但它正在默默取得顯著進(jìn)展。從融合視覺與語言的多模態(tài)模型，到開發(fā)AI驅(qū)動(dòng)的動(dòng)畫工具，再到構(gòu)建高性能的專業(yè)AI技術(shù)，蘋果的研究實(shí)驗(yàn)室持續(xù)實(shí)現(xiàn)技術(shù)突破。

面對谷歌、微軟、亞馬遜和OpenAI等公司的激烈競爭——這些公司已在搜索、辦公軟件、云服務(wù)等領(lǐng)域推出了先進(jìn)的AI產(chǎn)品——作為一個(gè)以保密聞名的科技巨頭，蘋果正努力不落人后。

長期以來，蘋果更多在創(chuàng)新領(lǐng)域扮演跟隨者而不是領(lǐng)先者的角色，現(xiàn)在正面臨著一個(gè)由人工智能快速改變的市場。在6月舉辦的全球開發(fā)者大會上，蘋果預(yù)計(jì)將推出新的大語言模型框架、“AppleGPT”聊天機(jī)器人及其生態(tài)系統(tǒng)中的其他AI功能。

“我們很高興今年晚些時(shí)候分享我們在人工智能方面的工作進(jìn)展，”首席執(zhí)行官蒂姆·庫克（TimCook）最近在一次盈利電話會議上暗示。盡管蘋果向來低調(diào)，但其在AI領(lǐng)域的廣泛努力已經(jīng)引起了業(yè)界的廣泛關(guān)注。

然而，在日益激烈的人工智能領(lǐng)域競爭中，蘋果的相對滯后使其處于不利地位。但憑借其雄厚的資金實(shí)力、品牌忠誠度、一流的工程師團(tuán)隊(duì)和緊密整合的產(chǎn)品線，蘋果仍有機(jī)會扭轉(zhuǎn)局面。

本文轉(zhuǎn)載自：cnBeta，不代表科技訊之立場。原文鏈接：https://www.cnbeta.com.tw/articles/tech/1425875.htm

ReALM 人工智能蘋果

野游栗認(rèn)證作者

0 0

產(chǎn)品

蘋果AirPods新功能曝光：將新增健康監(jiān)測功能，AirPods Pro 3或率先搭載

據(jù)報(bào)道，彭博社記者馬克?古爾曼報(bào)道了蘋果AirPods新功能的消息，其表示，蘋果公司正在為其AirPods系列耳機(jī)開發(fā)一系列健康監(jiān)測功能。這些功能預(yù)計(jì)將包括心率監(jiān)測器、體溫傳感器以…

Apple
12小時(shí)前
新聞

iOS 19支援機(jī)型名單揭曉：蘋果繼續(xù)支持多款老機(jī)型

據(jù)國外媒體最新報(bào)道，蘋果公司已著手準(zhǔn)備iOS 19的研發(fā)工作。對此，網(wǎng)上爆出了iOS 19支援機(jī)型名單。從目前的支持名單來看，蘋果對老機(jī)型的支持力度依然不減，其中最老的設(shè)備是201…

Apple
13小時(shí)前
新聞

蘋果內(nèi)部測試iOS 18.2.1版本，預(yù)計(jì)月底或下月初發(fā)布

近日，據(jù)外媒透露，蘋果公司正在內(nèi)部測試針對iPhone的iOS 18.2.1版本。這一消息引發(fā)了廣泛關(guān)注，因?yàn)闅v史數(shù)據(jù)顯示，此類日志曾多次準(zhǔn)確提前揭示了iOS版本的存在。據(jù)悉，i…

Apple
1天前
新聞

蘋果宣布iPhone SE 3、iPhone 14及14 Plus在歐盟停售

近日，因應(yīng)歐盟新規(guī)定，iPhone SE 3、iPhone 14及iPhone 14 Plus即日起在歐盟范圍內(nèi)將逐漸停產(chǎn)并停止銷售。目前，瑞士蘋果官網(wǎng)已顯示這三款機(jī)型全部缺貨。值…

Apple
2天前
AI

北美監(jiān)管機(jī)構(gòu)警告：AI應(yīng)用激增或致明年大面積停電

隨著蘋果iOS 18.2系統(tǒng)的公開發(fā)布，Apple Intelligence的多項(xiàng)新功能正式亮相。然而，北美電力可靠性公司（NERC）近日卻發(fā)出了一項(xiàng)令人擔(dān)憂的警告。據(jù)《金融時(shí)報(bào)》…

AI
4天前
新聞

蘋果發(fā)布iOS/iPadOS 18.3及macOS 15.3公測版

今日，蘋果公司正式推出了iOS 18.3、iPadOS 18.3以及macOS Sequoia 15.3的首個(gè)公開測試版，為即將到來的正式版提前預(yù)熱。用戶只需通過蘋果的公共Bet…

Apple
4天前
新聞

Cloudflare：2024 年全球互聯(lián)網(wǎng)流量同比增長 17.2%，美國仍是主要 Bot 流量來源地

Cloudflare報(bào)告2024年全球互聯(lián)網(wǎng)流量增17.2%，谷歌領(lǐng)跑，美國Bot流量最大。IPv6流量下降，移動(dòng)設(shè)備流量占41.3%，Chrome瀏覽器領(lǐng)先。西班牙網(wǎng)速最快。

潮玩君
5天前
新聞

拼多多 Temu 連續(xù)兩年成美國下載量最大的免費(fèi)蘋果 iOS 應(yīng)用，TikTok 第三

蘋果發(fā)布AppStore年度榜單，Temu蟬聯(lián)美免費(fèi)應(yīng)用下載冠軍，TikTok第三，ChatGPT第四超越谷歌搜索，Meta應(yīng)用排名下降，但Threads第二，Instagram和WhatsApp分列第六和第七。

科技探索者
5天前
新聞

IDC：2024 年前三季度全球腕戴設(shè)備市場出貨 1.4 億臺同比降 1.0%，華為、蘋果、小米前三

2024年前三季度全球腕戴設(shè)備出貨1.4億臺，同比降1.0%。中國出貨4576萬臺，增20.1%。華為全球腕戴出貨量第一，蘋果智能手表領(lǐng)先，小米、三星、步步高市場表現(xiàn)各異。

潮玩君
5天前
AI

OpenAI o1推理模型API向特定開發(fā)者開放，多項(xiàng)開發(fā)者工具同步更新

近日，在“OpenAI 12天”活動(dòng)的第九天，OpenAI宣布了重要更新。其最新的“推理”人工智能模型o1已正式通過API向部分開發(fā)者開放。據(jù)了解，首批能夠使用o1 API的開發(fā)…

AI
5天前
手機(jī)

iPhone或迎六年來首次設(shè)計(jì)大換代，全新渲染圖曝光

近日，網(wǎng)絡(luò)上曝光了一組關(guān)于iPhone 17 Pro Max渲染圖，展示了蘋果下一代旗艦手機(jī)的潛在設(shè)計(jì)。據(jù)悉，這是自iPhone 11系列以來，蘋果首次對其手機(jī)背部設(shè)計(jì)進(jìn)行重大更新…

Apple
5天前
新聞

Apple揭曉2024年度臺灣App Store熱門榜單：咻咻封神獲免費(fèi)游戲下載冠軍

隨著2024年的即將結(jié)束，Apple公司公布了本年度臺灣App Store下載次數(shù)最多的應(yīng)用和游戲榜單。在免費(fèi)應(yīng)用方面，由Meta推出的新社群平臺Threads憑借其快速增長的用…

Apple
5天前
商業(yè)

英偉達(dá)股價(jià)持續(xù)下滑，投資者擔(dān)憂AI支出前景

近日，英偉達(dá)股價(jià)持續(xù)呈現(xiàn)下跌趨勢，周二再跌1.2%，引發(fā)了市場的廣泛關(guān)注。這家全球領(lǐng)先的人工智能芯片制造商的股價(jià)，已從11月初的歷史高峰148.88美元下跌了約12%。據(jù)了解，投…

商業(yè)頭條
5天前
手機(jī)

iPhone 17 Air售價(jià)曝光：價(jià)格或?qū)⒏?

據(jù)媒體消息，自明年起，iPhone 17 Air將加入蘋果手機(jī)家族，替代Plus機(jī)型。現(xiàn)在有爆料指出，iPhone 17 Air最終定價(jià)預(yù)計(jì)與iPhone 16 Plus的起售價(jià)相…

Apple
6天前
新聞

蘋果推送macOS 15.3開發(fā)者預(yù)覽版Beta更新，引入Genmoji功能

今日，蘋果向Mac電腦用戶推送了macOS 15.3開發(fā)者預(yù)覽版Beta更新，其內(nèi)部版本號為24D5034，此次更新距離上次發(fā)布Beta/RC版本間隔了7天。據(jù)了解，macOS …

蘋果派
6天前
新聞

蘋果推送visionOS 2.3開發(fā)者預(yù)覽版Beta更新

蘋果公司于今日正式向Vision Pro用戶推送了visionOS 2.3開發(fā)者預(yù)覽版Beta更新，內(nèi)部版本號為22N5875e。據(jù)了解，距離上一次Beta或RC版本的發(fā)布。目前…

Apple
6天前
新聞

蘋果推送watchOS 11.3開發(fā)者預(yù)覽版Beta更新

今日，蘋果向Apple Watch用戶推送了watchOS 11.3開發(fā)者預(yù)覽版Beta更新，其內(nèi)部版本號為22S5534d。此次更新距離上次發(fā)布Beta/RC版本間隔了11天。 …

蘋果派
6天前
新聞

蘋果推送iOS 18.3開發(fā)者預(yù)覽版Beta更新

今日，蘋果公司向廣大iPhone用戶推送了全新的iOS 18.3開發(fā)者預(yù)覽版Beta更新，此次更新的內(nèi)部版本號為22D5034e。值得注意的是，距離上一次Beta或RC版本的發(fā)布，…

Apple
6天前
手機(jī)

蘋果計(jì)劃推出超薄iPhone 17 Air及可折疊設(shè)備

近日，《華爾街日報(bào)》記者Aaron Tilley和Yang Jie發(fā)布報(bào)道，透露了蘋果公司即將在未來幾年對iPhone進(jìn)行的一系列重大設(shè)計(jì)與形式變更。報(bào)道指出，備受關(guān)注的iPho…

Apple
2024年12月16日
AI

月之暗面發(fā)布k1視覺思考模型，支持多領(lǐng)域圖像理解

今日，人工智能公司月之暗面宣布發(fā)布其最新的k1視覺思考模型。該模型基于強(qiáng)化學(xué)習(xí)技術(shù)，不僅在數(shù)學(xué)領(lǐng)域表現(xiàn)突出，還擴(kuò)展到了物理、化學(xué)等基礎(chǔ)科學(xué)領(lǐng)域，展現(xiàn)出強(qiáng)大的圖像理解和思維鏈能力。 …

AI
2024年12月16日

發(fā)表回復(fù)

登錄后才能評論

蘋果開發(fā)出新款A(yù)I：能“看懂”屏幕上內(nèi)容并用語音回復(fù)

相關(guān)推薦

發(fā)表回復(fù)