OpenAI Sora 如何使用：最新詳細教程-新手小白必看

科技探索者 ? 2024年6月3日 20:33:00 ? 經(jīng)驗

目前 openai 官方還未開放 sora 灰度，不過根據(jù)文生圖模型 DALL·E 案例，一定是先給 ChatGPT Plus 付費用戶使用，需要注冊或者升級 GPT Plus 可以看這個教程: 升級 ChatGPT Plus 的教程，一分鐘完成升級Sora能夠根據(jù)簡單的文本描述，生成高達60秒的高質(zhì)量視頻，使得視頻創(chuàng)作變得前所未有的簡單和高效。

Sora 是什么？
2024年2月16日，OpenAI 在其官網(wǎng)上面正式宣布推出文本生成視頻的大模型 Sora:

Sora視頻案例
Sora的應(yīng)用范圍非常廣泛，從教育教學(xué)、產(chǎn)品演示到內(nèi)容營銷等，都可以通過Sora來實現(xiàn)高質(zhì)量的視頻內(nèi)容創(chuàng)作。
下面是 OpenAI 官方發(fā)布的應(yīng)用案例：

1.Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

翻譯：一位時尚的女性走在東京街頭，周圍是溫暖閃亮的霓虹燈和活力四射的城市標(biāo)識。她穿著一件黑色皮夾克，一條長長的紅色連衣裙，搭配黑色靴子，并背著一個黑色手提包。她戴著墨鏡，涂著紅色口紅。她步履自信，悠然自得地走著。街道潮濕而反光，呈現(xiàn)出豐富多彩的燈光的鏡面效果。許多行人在街上走動。

2.Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.
翻譯：幾只巨大的長毛猛犸象踏過一片雪白的草地，它們長長的毛發(fā)在微風(fēng)中輕輕飄動著，遠處覆蓋著雪的樹木和雄偉的雪山，午后的光線下有些薄云，太陽高懸在遠方，營造出溫暖的光芒。低角度的攝影視角令人驚嘆，捕捉到了這些大型毛茸茸的哺乳動物，畫面景深感強烈。

3.Prompt: Historical footage of California during the gold rush.
翻譯：加利福尼亞淘金熱時期的歷史影像。

4.Prompt: A close up view of a glass sphere that has a zen garden within it. There is a small dwarf in the sphere who is raking the zen garden and creating patterns in the sand.
翻譯：放大觀看一個玻璃球，里面有一個禪宗花園。球內(nèi)有一個小矮人，他正在用耙子整理禪宗花園，并在沙地上創(chuàng)造出圖案。

5.Prompt: A cartoon kangaroo disco dances.
翻譯：一只卡通袋鼠在迪斯科舞廳跳舞。

6.Prompt: Reflections in the window of a train traveling through the Tokyo suburbs.
翻譯：一輛列車穿越東京郊區(qū)時，窗戶上的倒影。

7.Prompt: Tour of an art gallery with many beautiful works of art in different styles.
翻譯：參觀一個藝術(shù)畫廊，展示了許多不同風(fēng)格的精美藝術(shù)品。

8.Prompt: A Chinese Lunar New Year celebration video with Chinese Dragon.
翻譯：一個有中國龍的中國農(nóng)歷新年慶祝視頻。

Sora 怎么使用
（PS：目前 openai 官方還未開放 sora 灰度，不過根據(jù)文生圖模型 DALL·E 案例，一定是先給 ChatGPT Plus 付費用戶使用，需要注冊或者升級 GPT Plus 可以看這個教程: 升級 ChatGPT Plus 的教程，一分鐘完成升級

3.1 使用Sora前的準(zhǔn)備工作
在開始之前，確保您已經(jīng)擁有了OpenAI賬目，并獲得了Sora的訪問權(quán)限。準(zhǔn)備好您想要轉(zhuǎn)化成視頻的文本描述，記住越詳細越好。

3.2 Sora使用步驟一：文本描述
登錄您的OpenAI賬戶，找到Sora的使用界面。在指定區(qū)域輸入您的文本描述，可以是一個故事概述、場景描述或是具體的動作指令。

3.3 Sora使用步驟二：生成視頻
完成文本描述和自定義設(shè)置后，點擊“生成視頻”按鈕。Sora將開始處理您的請求，這可能需要幾分鐘時間。完成后，您可以預(yù)覽生成的視頻。
**需要注意的是，截止2024年2月18日，OpenAI只向部分專業(yè)用戶開放了Sora的訪問權(quán)限。普通用戶只能觀看其發(fā)布的演示視頻。

Sora 常見問題
OpenAI的Sora開啟了視頻創(chuàng)作的新紀(jì)元，無論是專業(yè)人士還是愛好者，都可以輕松創(chuàng)作出高質(zhì)量的視頻內(nèi)容。盡管仍有一些限制，但隨著技術(shù)的不斷進步，相信這些問題將會逐漸被解決。立即嘗試Sora，開啟您的AI視頻創(chuàng)作之旅吧
Sora技術(shù)原理
OpenAI近日發(fā)布了一項重要的里程碑技術(shù)——Sora，它是基于文本生成視頻的AI模型。通過簡單的文本描述，Sora能夠生成連貫的長達1分鐘的視頻。那么，Sora是如何實現(xiàn)這一壯舉的呢？我們來揭開它的技術(shù)原理。

5.1 基于Transformer架構(gòu)
Sora模型與GPT模型類似，都基于Transformer架構(gòu)，這使得Sora具有極強的擴展性。Transformer是一種基于自注意力機制的神經(jīng)網(wǎng)絡(luò)架構(gòu)，它能夠同時處理輸入文本中的所有位置信息，使得模型能夠捕捉到全局的上下文信息。這樣的架構(gòu)使得Sora在生成視頻時能夠更好地理解文本描述。

5.2擴散模型和訓(xùn)練穩(wěn)定性
Sora模型采用了擴散模型的方法，與傳統(tǒng)的GAN模型相比，具有更好的生成多樣性和訓(xùn)練穩(wěn)定性。擴散模型通過逐步消除噪聲來生成視頻，這樣可以有效地提高生成的視頻質(zhì)量。同時，通過采用擴散模型，Sora還能夠生成更加逼真的視頻場景。

5.3 生成視頻的數(shù)據(jù)處理和壓縮
生成視頻需要處理大量的數(shù)據(jù)，對于這一問題，Sora模型采用了數(shù)據(jù)處理和壓縮的技術(shù)。通過對視頻數(shù)據(jù)進行處理和壓縮，Sora能夠在保持視頻質(zhì)量的同時，減少存儲空間的占用。

5.4 視頻質(zhì)量和逼真度
Sora模型在生成視頻的過程中，注重保持視頻質(zhì)量和逼真度。通過采用Transformer架構(gòu)和擴散模型的方法，Sora能夠生成更加連貫、且具有很高逼真度的視頻場景。這使得Sora在應(yīng)用領(lǐng)域具有廣泛的潛力，比如可以用于影視制作、游戲開發(fā)等方面。
參考鏈接：https://www.openai.com/research/sora/

openai sora如何使用的常見問答Q&A
問題：Sora是什么？
Sora是由OpenAI開發(fā)的AI視頻生成模型。
Sora可以根據(jù)用戶提供的描述性文字生成長達60秒的高質(zhì)量視頻。
Sora的視頻包含精細復(fù)雜的場景、生動的角色表情和復(fù)雜的鏡頭運動。
問題：Sora怎么使用？
登錄OpenAI賬戶并找到Sora的使用界面。
在指定區(qū)域輸入您的文本描述，可以是一個故事概述、場景描述或是具體的動作指令。
點擊生成按鈕，OpenAI Sora會根據(jù)您的文本描述生成視頻。
問題：Sora的優(yōu)勢有哪些？
Sora具有極強的擴展性，基于Transformer架構(gòu)，可以應(yīng)用于各種場景。
Sora能夠生成高質(zhì)量、高清的視頻，展現(xiàn)復(fù)雜場景的光影關(guān)系、物體的物理遮擋和碰撞關(guān)系。
Sora可以創(chuàng)造出包含多個角色、特定動作類型以及與主題和背景相符的詳細場景。
問題：Sora的訓(xùn)練原理是什么？
Sora的訓(xùn)練分為兩個階段。首先，使用一個標(biāo)注模型為訓(xùn)練集中的視頻生成詳細描述。
標(biāo)注模型生成的描述能夠更好地指導(dǎo)Sora生成視頻。
Sora利用穩(wěn)定擴散（Stable Diffusion）技術(shù)將靜態(tài)噪聲轉(zhuǎn)換為連貫圖像。
Sora模型采用初步的擴散模型生成視頻長度，并逐步消除噪聲完成視頻。

原創(chuàng)文章，作者：科技探索者，如若轉(zhuǎn)載，請注明出處：http://rponds.cn/article/658433.html

OpenAI Sora

科技探索者管理團隊

0 0

AI

OpenAI GPT-5研發(fā)受阻，成本高昂效果未及預(yù)期

近日，《華爾街日報》報道稱，OpenAI正在研發(fā)的下一代大型語言模型GPT-5遭遇研發(fā)難題，進度滯后且成果未達預(yù)期。這一消息與此前有關(guān)GPT-5可能無法實現(xiàn)顯著性能飛躍的報道相呼應(yīng)…

AI
13小時前
AI

意大利對OpenAI罰款1500萬歐元，因ChatGPT數(shù)據(jù)隱私違規(guī)

近日，意大利數(shù)據(jù)保護機構(gòu)Garante發(fā)布公告，宣布對OpenAI處以1500萬歐元（約合1.14億元人民幣）的罰款。這一處罰是在對生成式AI應(yīng)用使用個人數(shù)據(jù)情況進行調(diào)查后做出的?！?/p>

NEWS
1天前
AI

OpenAI更新macOS版ChatGPT，新增備忘錄及IDE支持

OpenAI近日對其macOS版ChatGPT應(yīng)用進行了更新，新增了支持讀取macOS系統(tǒng)集成的備忘錄App（Apple Notes）及第三方備忘錄App如Notion等功能。現(xiàn)在…

AI
1天前
AI

桌面版ChatGPT功能大升級：新增30余應(yīng)用支持

在OpenAI的“12天活動”進入尾聲，在活動倒數(shù)第二天，公司展示了桌面版ChatGPT的功能改進。此次演示強調(diào)，ChatGPT正逐步從聊天機器人向AI智能體工具轉(zhuǎn)變，旨在桌面環(huán)境…

AI
2天前
AI

OpenAI o1推理模型API向特定開發(fā)者開放，多項開發(fā)者工具同步更新

近日，在“OpenAI 12天”活動的第九天，OpenAI宣布了重要更新。其最新的“推理”人工智能模型o1已正式通過API向部分開發(fā)者開放。據(jù)了解，首批能夠使用o1 API的開發(fā)…

AI
4天前
AI

谷歌發(fā)布Veo 2視頻生成模型，分辨率是Sora模型的4倍

今日，谷歌公司發(fā)布公告，正式推出視頻生成模型Veo 2。據(jù)官方消息，這個新模型在理解現(xiàn)實世界物理、人類運動和表達的細微差別方面表現(xiàn)更出色，從而能夠進一步提升視頻整體的細節(jié)和逼真度?！?/p>

Google
5天前
AI

OpenAI向所有用戶開放ChatGPT搜索功能

在“OpenAI 12天”活動進展到第8天的時候，OpenAI發(fā)布了一則重要消息，現(xiàn)在所有登錄用戶都能夠使用ChatGPT搜索功能了。 OpenAI此次免費向所有用戶開放ChatG…

AI
5天前
AI

ChatGPT搜索引擎向所有用戶免費開放：新增實時搜索和高級語音功能

OpenAI推出搜索引擎工具，ChatGPT搜索功能獲大量更新，由GPT-4o模型支持，可快速獲取實時內(nèi)容，支持高級語音模式，移動端使用效率提升40%以上。

潮玩君
5天前
新聞

Meta要求加州阻止OpenAI轉(zhuǎn)營利計劃

據(jù)《華爾街日報》今日報道稱，Meta已致信加州總檢察長Rob Bonta，要求阻止OpenAI轉(zhuǎn)型為營利性企業(yè)的計劃。此舉表明，Meta在硅谷兩大AI巨頭間的爭斗中站在了馬斯克一方…

NEWS
2024年12月14日
AI

OpenAI ChatGPT全球宕機，部分服務(wù)逐步恢復(fù)中

今日，全球知名的人工智能公司OpenAI遭遇了一次重大服務(wù)中斷，其備受歡迎的聊天機器人ChatGPT在全球范圍內(nèi)出現(xiàn)了宕機現(xiàn)象。此外，與ChatGPT相關(guān)的Sora服務(wù)及API接口…

AI
2024年12月12日
新聞

ChatGPT 高級語音模式研究員創(chuàng)立WaveForms AI 新公司估值達 2 億美元

近日，有媒體報道，曾主導(dǎo)開發(fā)ChatGPT高級語音模式的前OpenAI研究員Alexis Conneau宣布創(chuàng)立WaveForms AI。這家新公司已完成由Andreessen H…

潮玩君
2024年12月11日
AI

OpenAI推出Sora文生視頻AI模型，支持1080P高清視頻生成

昨日，OpenAI公司宣布正式推出其最新的Sora文生視頻AI模型。此次發(fā)布的新版本為Sora Turbo，相較于今年2月推出的預(yù)覽版，生成速度有了顯著提升。據(jù)了解，Sora T…

AI
2024年12月10日
AI

Sora二代實機演示曝光，支持圖生視頻功能

近日，關(guān)于Sora二代的實機演示視頻被曝光，展示了其強大的圖生視頻功能。據(jù)泄露視頻顯示，Sora v2不僅支持長達1分鐘的視頻輸出，還提供了三種生成模式，包括文本轉(zhuǎn)視頻、文本+圖像…

AI
2024年12月9日
AI

OpenAI新功能太強大，每月服務(wù)費200美元

近日，OpenAI在其“12天12場直播”活動的首秀中，發(fā)布了推理大模型o1的滿血版本及進階模式，并推出了ChatGPT Pro訂閱服務(wù)。這一服務(wù)每月收費200美元，為用戶提供了前…

AI
2024年12月7日
AI

OpenAI首次在瑞士設(shè)立辦公室，招募翟曉華等3名谷歌工程師推進研發(fā)多模態(tài)AI模型

OpenAI將在蘇黎世建新辦公室，拓展歐洲市場，吸納3位谷歌DeepMind AI專家推進多模態(tài)AI研發(fā)。蘇黎世為科技中心，翟曉華為資深A(yù)I科學(xué)家，曾是VisionTransformer作者之一。

科技探索者
2024年12月7日
AI

全球AI基礎(chǔ)設(shè)施支出將逐年增加預(yù)計2028年超過1000億美元

AI聊天機器人ChatGPT帶動AI領(lǐng)域投資增長，全球AI基礎(chǔ)設(shè)施投資預(yù)計連年增加，2028年將達1070億美元，上半年投資318億美元增37%，加速服務(wù)器比重將增至60%，5年復(fù)合年均增長率19%。

科技探索者
2024年11月30日
商業(yè)

OpenAI獲軟銀15億美元新投資，員工可在收購要約中出售股票

據(jù)外媒11月27日消息，OpenAI獲得了軟銀15億美元新投資。值得一提的是，這次投資允許OpenAI的員工在收購要約中出售他們的股票。據(jù)了解，員工們需要在12月24日之前決定是…

商業(yè)頭條
2024年11月27日
AI

OpenAI 首席產(chǎn)品官：ChatGPT 網(wǎng)頁端本周引入高級語音模式

OpenAI本周在ChatGPT網(wǎng)頁版上線高級語音模式，面向付費用戶。依托GPT-4o模型，可感知非語言信號并模仿情緒。Plus和Teams用戶有語音使用上限。OpenAI正優(yōu)化交互方式，免費用戶將有機會體驗。

潮玩君
2024年11月25日
新聞

iOS 19發(fā)布日期：預(yù)計2025年發(fā)布，新版Siri功能提前泄露

近日，彭博社的知名記者 Mark Gurman 在其發(fā)布的 Power On 時事通訊中，發(fā)布了關(guān)于 iOS 19發(fā)布時間的消息。據(jù)悉，iOS 19 預(yù)計將于 2025 年 6 月…

Apple
2024年11月25日
新聞

OpenAI計劃推出自研瀏覽器，正面挑戰(zhàn)谷歌Chrome

據(jù)外媒報道，人工智能巨頭OpenAI正考慮通過自行研發(fā)一款基于AI聊天機器人的瀏覽器，對全球搜索引擎巨頭谷歌發(fā)起直接競爭，特別是針對其廣受歡迎的Chrome瀏覽器。知情人士透露，…

AI
2024年11月22日

發(fā)表回復(fù)

登錄后才能評論

OpenAI Sora 如何使用：最新詳細教程-新手小白必看

相關(guān)推薦

發(fā)表回復(fù)