字節(jié)跳動(dòng)Bytedance推出超高清文生視頻模型MagicVideo-V2，引領(lǐng)行業(yè)新篇章

檸萌 ? 2024年2月4日 22:50:04 ? 新聞

近日，字節(jié)跳動(dòng)的研究人員推出了一種超高清文生視頻模型MagicVideo-V2，該模型在視頻的高清度、潤滑度、連貫性、文本語義還原等方面表現(xiàn)出色，比目前主流的文生視頻模型Gen-2、Stable Video Diffusion、Pika 1.0等更優(yōu)秀。這一創(chuàng)新模型將為文生視頻領(lǐng)域帶來重大突破，引領(lǐng)行業(yè)進(jìn)入新的篇章。

MagicVideo-V2將文生圖像、圖像生成視頻、視頻到視頻和視頻幀插值4種功能整合到一個(gè)模型中，解決了之前面臨的4大難題。隨著Gen-2等模型的出現(xiàn)，文生視頻領(lǐng)域?qū)崿F(xiàn)飛速發(fā)展，尤其是在這個(gè)短視頻時(shí)代被大量用戶應(yīng)用。然而，在生成的過程中，模型經(jīng)常面臨4個(gè)難題：視頻不美觀、內(nèi)容不一致、視覺質(zhì)量和清晰度較差以及視頻運(yùn)動(dòng)不連貫。

為了解決這些問題，字節(jié)跳動(dòng)的研究人員直接將4個(gè)模塊整合在MagicVideo-V2模型中。文生圖像模塊用于接收用戶提供的文本描述作為輸入，并生成一個(gè)高清的參考圖像，這有助于增強(qiáng)視頻的內(nèi)容和美學(xué)風(fēng)格。圖像到視頻模塊基于SD1.5模型，通過人類反饋來提高模型在視覺質(zhì)量和內(nèi)容一致性方面的能力。該模塊還使用了一個(gè)參考圖像嵌入模塊，用于利用參考圖像，使圖像提示可以有效地與文本提示解耦，并提供更強(qiáng)的圖像條件。

此外，視頻到視頻模塊進(jìn)一步對(duì)低分辨率視頻的關(guān)鍵幀進(jìn)行優(yōu)化和超分辨率處理，以生成高分辨率的視頻。該模塊就像照相機(jī)的美顏功能一樣，會(huì)根據(jù)圖像內(nèi)容自動(dòng)生成更豐富的像素級(jí)細(xì)節(jié)，增強(qiáng)整體逼真度與紋理細(xì)節(jié)。這也是比其他文生視頻模型更高清的重要原因之一。

最后，視頻幀插值模塊可以在生成的視頻關(guān)鍵幀之間插入額外的幀，增加視頻的平滑性、動(dòng)態(tài)感以及連貫性。該模塊主要通過分析相鄰關(guān)鍵幀之間的運(yùn)動(dòng)信息，以及參考圖像和文本描述，插入中間幀，使視頻的運(yùn)動(dòng)更加連續(xù)和自然。

為了評(píng)估 MagicVideo-V2的性能，研究人員使用了人類評(píng)估和目前最先進(jìn)的 T2V 系統(tǒng)兩種評(píng)估方法。分別由61位評(píng)估者組成的小組對(duì) MagicVideo-V2 和另一種 T2V 方法進(jìn)行了 500 次并排比較。在每一輪比較中，每位投票者都會(huì)看到一對(duì)隨機(jī)的視頻，包括基于相同文本提示的一個(gè)我們的視頻和一個(gè)競爭對(duì)手的視頻。

投票者需要根據(jù)他們對(duì)三個(gè)標(biāo)準(zhǔn)的總體偏好進(jìn)行投票：哪種視頻具有更高的幀質(zhì)量和整體視覺吸引力；哪種視頻的時(shí)間一致性更高，運(yùn)動(dòng)范圍和運(yùn)動(dòng)連貫性更好；哪個(gè)視頻的結(jié)構(gòu)錯(cuò)誤或不良情況更少。測試結(jié)果表明，MagicVideo-V2 明顯更受評(píng)估者青睞。

總體而言，字節(jié)跳動(dòng)推出的超高清文生視頻模型MagicVideo-V2具有出色的性能表現(xiàn)和廣泛的潛在應(yīng)用場景。它將為短視頻創(chuàng)作、游戲設(shè)計(jì)、虛擬現(xiàn)實(shí)等領(lǐng)域帶來更多可能性。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展，相信文生視頻領(lǐng)域?qū)?huì)迎來更加廣闊的發(fā)展前景。

原創(chuàng)文章，作者：檸萌，如若轉(zhuǎn)載，請(qǐng)注明出處：http://rponds.cn/article/628078.html

檸萌管理團(tuán)隊(duì)

0 0

新聞

TikTok請(qǐng)求美國最高法院暫緩禁令以保運(yùn)營

今日，社交網(wǎng)絡(luò)平臺(tái)TikTok于X平臺(tái)發(fā)布推文稱，已向美國最高法院提出請(qǐng)求，希望能夠暫緩將于2025年1月19日生效的禁令，以等待上訴程序的推進(jìn)。據(jù)此前報(bào)道，美國的一項(xiàng)法律規(guī)定T…

泡沫大盜
6天前
新聞

美國司法部要求字節(jié)跳動(dòng)按期剝離TikTok

12月13日，據(jù)外媒報(bào)道，美國司法部周三晚些時(shí)候要求美國上訴法院駁回TikTok提出的一項(xiàng)緊急請(qǐng)求，即暫時(shí)阻止一項(xiàng)要求其母公司字節(jié)跳動(dòng)在1月19日前剝離TikTok，否則將面臨禁令…

潮玩君
2024年12月13日
出海

TikTok緊急求救！向法院申請(qǐng)阻止禁令

據(jù)報(bào)道，字節(jié)跳動(dòng)及其旗下短視頻平臺(tái)TikTok近日向美國上訴法院提交了一份緊急動(dòng)議，要求暫時(shí)阻止一項(xiàng)旨在禁止TikTok在美國運(yùn)營的法律生效。除非TikTok的中國所有權(quán)人在1月1…

聆聽
2024年12月10日
新聞

2024年10月中國非游戲廠商出海收入榜Top10

近日，2024年10月中國非游戲廠商出海收入榜新鮮出爐。本次榜單揭示了在今年10月份，中國廠商在國際市場上的強(qiáng)勁表現(xiàn)，本榜單中并未包括游戲廠商。榜單顯示，字節(jié)跳動(dòng)憑借旗下多款應(yīng)用…

泡沫大盜
2024年11月27日
商業(yè)

傳聞字節(jié)跳動(dòng)2024上半年?duì)I收增長強(qiáng)勁，國際業(yè)務(wù)表現(xiàn)突出

近日，據(jù)The Information報(bào)道，字節(jié)跳動(dòng)在2024年上半年的業(yè)績表現(xiàn)亮眼，國際收入增長超過60%，達(dá)到約170億美元（折合當(dāng)前人民幣匯率約為1209.15億元人民幣）?！?/p>

商業(yè)頭條
2024年11月5日
新聞

傳聞字節(jié)跳動(dòng)前三季度收入增速大幅下滑，面臨多重挑戰(zhàn)

據(jù)接近字節(jié)跳動(dòng)的知情人士透露，該公司今年前三季度出現(xiàn)了較大幅度的收入增速下降，盡管利潤率在“去肥增瘦”的策略下曾短暫提升，但目前又重新進(jìn)入了下滑通道。字節(jié)跳動(dòng)正面臨三重嚴(yán)峻挑戰(zhàn)，包…

小科同學(xué)
2024年10月24日
新聞

字節(jié)跳動(dòng)BytePlus計(jì)劃在泰國建數(shù)據(jù)中心，推進(jìn)東盟擴(kuò)張

今日，據(jù)外媒報(bào)道，字節(jié)跳動(dòng)旗下的BytePlus部門正考慮于2025年在泰國建立一個(gè)數(shù)據(jù)中心，以提供基于云和人工智能（AI）的服務(wù)。這一消息由一位熟悉字節(jié)跳動(dòng)的消息人士透露，并指出…

NEWS
2024年10月22日
新聞

消息稱字節(jié)跳動(dòng)大模型訓(xùn)練被實(shí)習(xí)生攻擊，涉事者已被辭退

多個(gè)微信群流傳一則消息：“某頭部大廠的大模型訓(xùn)練被實(shí)習(xí)生入侵，注入了破壞代碼，導(dǎo)致其訓(xùn)練成果不可靠，可能需要重新訓(xùn)練。據(jù)稱遭到入侵的代碼注入了 8000 多張卡，帶來的損失可能超過千萬美元。”

潮玩君
2024年10月19日
新聞

TikTok預(yù)留10億美元應(yīng)對(duì)歐洲隱私監(jiān)管罰款

字節(jié)跳動(dòng)旗下的短視頻平臺(tái)TikTok正面臨日益嚴(yán)峻的監(jiān)管挑戰(zhàn)。根據(jù)公司最新提交給英國公司注冊(cè)局的財(cái)務(wù)報(bào)表顯示，TikTok已預(yù)留了10億美元的資金，以應(yīng)對(duì)未來可能來自歐洲隱私監(jiān)管機(jī)…

小科同學(xué)
2024年10月15日
新聞

字節(jié)跳動(dòng)馬來西亞分公司裁員700余人，轉(zhuǎn)向AI內(nèi)容審核

今日，據(jù)路透社報(bào)道，字節(jié)跳動(dòng)已從其馬來西亞分公司裁掉了700多名員工。此次裁員的原因是公司將業(yè)務(wù)重點(diǎn)轉(zhuǎn)向更廣泛地使用人工智能技術(shù)（AI）進(jìn)行內(nèi)容審核。據(jù)悉，受影響的員工主要集中在…

NEWS
2024年10月11日
商業(yè)

字節(jié)跳動(dòng)發(fā)布新一輪期權(quán)回購，估值再次上升

近日，有媒體援引字節(jié)跳動(dòng)離職員工消息透露，字節(jié)跳動(dòng)已向員工發(fā)布了最新一輪的期權(quán)回購郵件。這一消息引起了廣泛關(guān)注，標(biāo)志著字節(jié)跳動(dòng)在資本市場上的又一重要?jiǎng)幼鳌?根據(jù)通知內(nèi)容，字節(jié)跳動(dòng)此…

校草
2024年10月10日
新聞

TikTok關(guān)鍵法庭聽證會(huì)下周舉行，挑戰(zhàn)美國禁令合法性

下周一，TikTok及其母公司字節(jié)跳動(dòng)將出席一場在美國哥倫比亞特區(qū)上訴法院舉行的關(guān)鍵法庭聽證會(huì)，這場“法律戰(zhàn)”的核心在于阻止一項(xiàng)可能于明年1月19日起禁止1.7億美國人使用TikT…

檸萌
2024年9月14日
新聞

字節(jié)跳動(dòng)完成收購耳機(jī)品牌Oladance 實(shí)現(xiàn)100%控股

工商信息顯示，字節(jié)跳動(dòng)已經(jīng)在近期完成對(duì)耳機(jī)品牌Oladance的收購，包括黑蟻資本、藍(lán)馳創(chuàng)投等在內(nèi)的老股東均已退出。

科技探索者
2024年9月3日
商業(yè)

搜索營銷市場大洗牌？

AI時(shí)代，搜索營銷誰的天下？

藍(lán)鯊消費(fèi)
2024年8月14日
新聞

TikTok非洲團(tuán)隊(duì)裁員過半，預(yù)計(jì)第三季度繼續(xù)減員

據(jù)外媒報(bào)道，短視頻社交平臺(tái)TikTok今年在非洲地區(qū)進(jìn)行了大規(guī)模裁員，涉及內(nèi)容運(yùn)營、市場營銷以及信任與安全等多個(gè)關(guān)鍵團(tuán)隊(duì)，且這一趨勢(shì)預(yù)計(jì)將在2024年第三季度持續(xù)。多位知情人士透露…

好奇寶寶
2024年8月13日
新聞

字節(jié)跳動(dòng)回應(yīng)“大規(guī)模食物中毒”：已采取措施支持所有受影響員工

近日消息，據(jù)新加坡《海峽時(shí)報(bào)》報(bào)道，當(dāng)?shù)貢r(shí)間周二下午，字節(jié)跳動(dòng)公司在新加坡的辦事處發(fā)生了一起大規(guī)模食物中毒事件，導(dǎo)致近60人住院。

潮玩君
2024年8月1日
新聞

字節(jié)跳動(dòng)新加坡辦公室發(fā)生食物中毒事件，60人就醫(yī)

據(jù)外媒報(bào)道，TikTok母公司字節(jié)跳動(dòng)在新加坡的萊佛士碼頭一號(hào)辦公室周二（7月30日）發(fā)生了一起大規(guī)模食物中毒事件，導(dǎo)致至少60名員工出現(xiàn)胃腸炎癥狀，其中57人已被送往醫(yī)院接受治療…

聆聽
2024年7月31日
新聞

字節(jié)跳動(dòng)調(diào)整股票期權(quán)政策美國員工迎來稅務(wù)減負(fù)與股票轉(zhuǎn)售便利

知名短視頻應(yīng)用TikTok的所有者字節(jié)跳動(dòng)公司正在進(jìn)行一項(xiàng)重大調(diào)整，以優(yōu)化其股票期權(quán)政策。這一調(diào)整旨在減少員工的納稅現(xiàn)金支出，并加快股票轉(zhuǎn)售流程，從而提升員工的財(cái)務(wù)靈活性和激勵(lì)效應(yīng)。

科技探索者
2024年7月15日
新聞

甲骨文警告：TikTok禁令或?qū)⒅負(fù)羝湄?cái)務(wù)業(yè)績

美國軟件巨頭甲骨文公司近日向投資者發(fā)出警告，稱一項(xiàng)可能在美國的TikTok禁令的新法律將對(duì)其財(cái)務(wù)業(yè)績產(chǎn)生不利影響。該公司在周四的監(jiān)管文件中明確指出，如果TikTok的母公司字節(jié)跳動(dòng)…

科技新聞
2024年6月25日
產(chǎn)品

字節(jié)跳動(dòng)攜手博通開發(fā)5nm AI處理器，確保高端芯片穩(wěn)定供應(yīng)

在追求人工智能領(lǐng)域技術(shù)創(chuàng)新與高端芯片供應(yīng)穩(wěn)定的雙重目標(biāo)下，字節(jié)跳動(dòng)近日與美國博通公司達(dá)成戰(zhàn)略合作，共同研發(fā)一款制程達(dá)到5nm的先進(jìn)AI處理器。此舉不僅標(biāo)志著字節(jié)跳動(dòng)在芯片自研領(lǐng)域的…

小科同學(xué)
2024年6月24日