在官宣“蘋果智能”(Apple Intelligence)一個(gè)多月后,蘋果的這一人工智能(AI)系統(tǒng)終于在終端設(shè)備上得以實(shí)現(xiàn)。美東時(shí)間7月29日,蘋果發(fā)布了蘋果智能的首個(gè)iPhone AI版本,現(xiàn)已在iOS 18.1開發(fā)者測(cè)試版中上線,僅向每年支付99美元/年的注冊(cè)開發(fā)者開放,但此次更新僅帶來了部分功能,包括Siri升級(jí)、寫作工具和照片管理等。其他如屏幕感知、AI圖像生成等功能暫時(shí)無法使用。
蘋果表示,更多功能更新將于明年正式上線。本次更新僅支持配備M系列和A17 Pro芯片的設(shè)備,即在iPhone上僅適用于iPhone 15 Pro和iPhone 15 Pro Max,iPad和Mac也有類似的版本。開發(fā)者的設(shè)備區(qū)域需設(shè)置為美國(guó),語言需為英語。
Apple Intelligence的首個(gè)版本已經(jīng)上線,包括Siri升級(jí)、寫作工具、郵件提要和照片搜索等功能。蘋果還發(fā)布了其自研大模型技術(shù)報(bào)告,詳細(xì)介紹了30億參數(shù)的端側(cè)模型AFM-on-device和云端模型AFM-server。這些模型在指令遵循和文本總結(jié)方面的測(cè)試表現(xiàn)優(yōu)于GPT-4。其具體升級(jí)分析在下文分別介紹。
1. Siri的智能升級(jí)
Siri在此次更新中迎來了重大改變,Apple Intelligence賦予其更強(qiáng)大的能力和全新的外觀。新的Siri不再是過去的球形圖標(biāo),而是環(huán)繞屏幕的炫彩發(fā)光特效,視覺效果更具科技感。用戶可以通過雙擊iPhone屏幕底部來調(diào)出文本輸入界面,與Siri進(jìn)行文字交流。
全新的Siri能夠根據(jù)上下文進(jìn)行連續(xù)對(duì)話,理解用戶不通順的指令,并且能回答有關(guān)設(shè)備功能和設(shè)置的問題。這使得Siri的使用體驗(yàn)比之前更為便捷,但仍未完全達(dá)到WWDC上宣傳的高度。
2. 強(qiáng)大的文本工具
文本工具是此次更新的重要亮點(diǎn)之一,幾乎支持所有涉及文本輸入的原生和第三方應(yīng)用。主要功能包括校對(duì)、重寫和總結(jié)。用戶可以校對(duì)選中文本的拼寫和語法錯(cuò)誤,進(jìn)行重寫以潤(rùn)色文章,并對(duì)文本進(jìn)行總結(jié)。此外,文本工具還將在郵件和信息處理中發(fā)揮作用,例如總結(jié)用戶收到的電子郵件并提供智能回復(fù)選項(xiàng)。雖然這些功能不能從零生成文本,但其便捷性和實(shí)用性無疑提升了用戶的文字處理效率。
3. 照片和通話錄音功能
焦點(diǎn)模式可過濾不重要的通知,顯示用戶當(dāng)前最需要的通知,如乘車到達(dá)等。照片功能支持自然語言創(chuàng)建幻燈片和搜索照片,并涵蓋視頻內(nèi)容。通話錄音功能在此次更新中也得以實(shí)現(xiàn)。用戶可以在通話時(shí)點(diǎn)擊屏幕左上角的小錄音按鈕,錄制內(nèi)容將存儲(chǔ)在備忘錄中,用戶可以查看錄音并生成摘要。然而,錄音生成摘要功能暫時(shí)不支持國(guó)行手機(jī)。
值得一提的是,蘋果基礎(chǔ)模型的訓(xùn)練采用了谷歌設(shè)計(jì)的TPU(張量處理單元),而非廣泛使用的英偉達(dá)GPU。蘋果的技術(shù)報(bào)告指出,云側(cè)使用了8192顆TPUv4芯片,端側(cè)使用了2048顆TPUv5p芯片。這一決定令人驚訝,因?yàn)橛ミ_(dá)GPU一直是訓(xùn)練大規(guī)模AI模型的首選。然而,英偉達(dá)GPU的高需求導(dǎo)致供應(yīng)緊張和價(jià)格上漲,促使科技巨頭探索替代解決方案。相比之下,谷歌TPU在價(jià)格和互聯(lián)性方面具有優(yōu)勢(shì)。谷歌TPU是為機(jī)器學(xué)習(xí)任務(wù)定制設(shè)計(jì)的,價(jià)格相對(duì)更具競(jìng)爭(zhēng)力,并且提供了更高的芯片級(jí)別互聯(lián)性。
與英偉達(dá)銷售的獨(dú)立芯片相比,谷歌TPU基于谷歌云平臺(tái),蘋果無須在硬件基礎(chǔ)設(shè)施上進(jìn)行大量投資即可獲得大量計(jì)算資源。谷歌TPU是為機(jī)器學(xué)習(xí)任務(wù)定制設(shè)計(jì)的,自2015年以來一直是谷歌內(nèi)部基礎(chǔ)設(shè)施的一部分,于2017年通過谷歌云公開提供。
相比之下,谷歌TPU也提供了更具有競(jìng)爭(zhēng)力的價(jià)格。據(jù)外媒,在三年預(yù)訂期內(nèi),該產(chǎn)品的最新型號(hào)每顆芯片每小時(shí)的(訓(xùn)練)成本不到2美元。蘋果的技術(shù)論文表明,TPU架構(gòu)可以開發(fā)更大、更復(fù)雜的AI模型。
寫在最后:
相對(duì)于英偉達(dá)GPU,谷歌TPU的優(yōu)勢(shì)在于芯片級(jí)別的互聯(lián)性特別高。因此也有分析認(rèn)為,這種具有競(jìng)爭(zhēng)力的定價(jià)加上 TPU的架構(gòu)優(yōu)勢(shì),使其成為英偉達(dá)GPU的一個(gè)替代品。隨著iOS 18.1 Beta版的上線,注冊(cè)開發(fā)者可以體驗(yàn)到蘋果AI的部分功能。不少開發(fā)者在社交媒體上分享了他們的使用體驗(yàn),稱蘋果智能在寫作、對(duì)話和圖像搜索方面的表現(xiàn)令人印象深刻。
有分析師對(duì)科技訊表示,Apple Intelligence能否重新定義行業(yè),關(guān)鍵在于其能否實(shí)現(xiàn)真正的個(gè)人化智能,整合設(shè)備上的信息和服務(wù),為用戶提供實(shí)際參考價(jià)值的答案。無論如何,用戶只需耐心等待,觀察各家AI產(chǎn)品的優(yōu)缺點(diǎn),最終挑選適合自己的AI產(chǎn)品。
原創(chuàng)文章,作者:科技探索者,如若轉(zhuǎn)載,請(qǐng)注明出處:http://rponds.cn/article/670933.html