openai視頻生成模型sora爆火 OpenAI王炸模型官方技術報告解讀
一幅逼真的云朵圖像生成視頻,上面寫著“SORA”;在一個華麗的歷史大廳里,一股巨大的浪潮達到頂峰,并開始崩散,兩個沖浪者抓住時機,巧妙地在海浪表面飛馳
擴展生成視頻
Sora不僅具備生成視頻的能力,更能在時間維度上實現(xiàn)向前或向后的無限擴展。以下三個視頻便是從同一生成視頻片段出發(fā),逐步向后擴展的示例。盡管它們的起始部分各異,但結局卻出奇地一致。
視頻到視頻編輯
隨著擴散模型的發(fā)展,我們已經(jīng)開發(fā)出多種方法來編輯基于文本提示的圖像和視頻。在此,我們將其中一種名為SDEdit 32的技術應用于Sora。這項技術賦予了Sora轉換零拍攝輸入視頻風格和環(huán)境的能力,為視頻編輯領域帶來了革命性的變革。
視頻的無縫連接
更令人驚嘆的是,Sora還能在兩個截然不同的輸入視頻之間實現(xiàn)無縫過渡。通過逐漸插入技術,我們能夠在具有完全不同主題和場景構圖的視頻之間創(chuàng)建出流暢自然的過渡效果。
圖片生成能力
Sora的出色能力不止于數(shù)據(jù)處理和分析,它現(xiàn)在還能生成圖像!這一創(chuàng)新功能的實現(xiàn)得益于一種獨特的算法,該算法在一個精確的時間范圍內(nèi),巧妙地在空間網(wǎng)格中排列高斯噪聲補丁。
值得一提的是,Sora的圖像生成功能不僅限于特定大小的圖像。它可以根據(jù)用戶需求,生成可變大小的圖像,最高可達驚人的2048 × 2048分辨率。
圖注:一個女人在秋天的特寫肖像,每一個細節(jié)都被捕捉得淋漓盡致,淺景深的應用使得主體脫穎而出
圖注:充滿生機的珊瑚礁吸引了五顏六色的魚類和海洋生物
新的模擬能力
在大規(guī)模訓練過程中,我們發(fā)現(xiàn)視頻模型展現(xiàn)出了許多令人興奮的新能力。這些功能使得Sora能夠模擬現(xiàn)實世界中的人物、動物和環(huán)境等某些方面。值得注意的是,這些屬性的出現(xiàn)并沒有依賴于任何明確的3D建模、物體識別等歸納偏差,而是純粹通過模型的尺度擴展而自然涌現(xiàn)的。
3D一致性:在3D一致性方面,Sora能夠生成帶有動態(tài)攝像頭運動的視頻。隨著攝像頭的移動和旋轉,人物和場景元素在三維空間中始終保持一致的運動規(guī)律。
較長視頻的連貫性和對象持久性:視頻生成領域面對的一個重要挑戰(zhàn)就是,在生成的較長視頻中保持時空連貫性和一致性。Sora,雖然不總是,但經(jīng)常能夠有效地為短期和長期物體間的依賴關系建模。例如,在生成的視頻中,人物、動物和物體即使在被遮擋或離開畫面后,仍能被準確地保存和呈現(xiàn)。同樣地,Sora能夠在單個樣本中生成同一角色的多個鏡頭,并在整個視頻中保持其外觀的一致性。
與世界互動:Sora有時還能以簡單的方式模擬影響世界狀態(tài)的行為。例如,畫家可以在畫布上留下新的筆觸。隨著時間的推移,一個人吃漢堡時也能在上面留下咬痕。
模擬數(shù)字世界:Sora還能夠模擬人工過程,比如視頻游戲。它可以在高保真度渲染世界及其動態(tài)的同時,用基本策略控制《我的世界》中的玩家。這些功能都無需額外的訓練數(shù)據(jù)或調(diào)整模型參數(shù),只需向Sora提示“我的世界”即可實現(xiàn)。
這些新能力表明,視頻模型的持續(xù)擴展為開發(fā)高性能的物理和數(shù)字世界模擬器提供了一條充滿希望的道路。通過模擬生活在這些世界中的物體、動物和人等實體,我們可以更深入地理解現(xiàn)實世界的運行規(guī)律,并開發(fā)出更加逼真、自然的視頻生成技術。
局限性與展望
盡管Sora在模擬能力方面已經(jīng)取得了顯著的進展,但它目前仍然存在許多局限性。例如,它不能準確地模擬許多基本相互作用的物理過程,如玻璃破碎等。此外,在某些交互場景中,比如吃東西時,Sora并不能總是產(chǎn)生正確的對象狀態(tài)變化。我們在發(fā)布頁面中列舉了模型的其他常見故障模式,包括在長時間樣本中發(fā)展的不一致性或某些對象不受控的出現(xiàn)等。
然而,我們相信隨著技術的不斷進步和創(chuàng)新,Sora所展現(xiàn)出的能力預示著視頻模型持續(xù)擴展的巨大潛力。未來,我們期待看到更加先進的視頻生成技術,能夠更準確地模擬現(xiàn)實世界中的各種現(xiàn)象和行為,并為我們帶來更加逼真、自然的視覺體驗。
02
圈內(nèi)人如何看Sora?
最后再來看看各位技術大牛和內(nèi)容行業(yè)從業(yè)者如何評價Sora?
馬斯克評OpenAI視頻模型:人類認賭服輸,但AI增強的人類將創(chuàng)造出最好作品
OpenAI周四發(fā)布了首個視頻生成模型Sora。馬斯克的前女友格萊姆斯發(fā)布了一連串帖子,討論這項新技術對電影以及更廣泛的藝術創(chuàng)作的影響。
馬斯克在其中一條帖子下回應稱:“AI增強的人類將在未來幾年里創(chuàng)造出最好的作品?!?
值得注意的是,馬斯克和格萊姆斯在過去大約半年時間里一直在就他們?nèi)齻€子女的撫養(yǎng)權問題對薄公堂。兩人之間在X平臺上這次罕見的互動引發(fā)了人們對他們目前關系狀態(tài)的猜測。
稍早,一位X用戶分享了Sora生成的一名女子在東京街頭漫步的視頻,并評論稱:“OpenAI今天宣布了Sora,它使用混合擴散和變壓器模型架構生成長達1分鐘的視頻。他們似乎又領先了其他所有人1-2年?!绷硪晃籜用戶評論稱:“gg皮克斯?!?
馬斯克回應稱:“gg人類?!?注:gg是網(wǎng)絡游戲用語“good games”的縮寫,主要用于游戲結束后,輸贏雙方都可以用,但現(xiàn)在多由失敗方發(fā)出,表示認賭服輸、心服口服的意思。)在馬斯克帖子的評論區(qū)里,還有用戶附和道:“gg好萊塢”。
Jim Fan感嘆:Sora是一個數(shù)據(jù)驅動的物理引擎
英偉達人工智能研究院Jim Fan表示“如果你還是把Sora當做DALLE那樣的生成式玩具,還是好好想想吧,這是一個數(shù)據(jù)驅動的物理引擎。”Jim Fan大神的言下之意是,我們不能忽略Sora背后,“世界模型”更進一步,AI已經(jīng)可以讀懂物理規(guī)律。
YouTube大V :動畫師和3D藝術家的工作可能有危險了
YouTube大V Paddy Galloway感慨:“內(nèi)容創(chuàng)作永遠改變了。這不是夸張。我在YouTube世界已經(jīng)15年了,OpenAI剛剛展示的東西讓我說不出話來…”他認為,Sora將帶來以下這些改變:
● 動畫師和3D藝術家的工作可能有危險了庫存素材網(wǎng)站將變得無關緊要
● 任何人都可以立即擁有出色的B-roll(輔助鏡頭)
● 制作精美視頻的門檻降至零
● 在一個每個人都能制作出美麗視頻的世界里,內(nèi)容背后的“想法”和故事變得更加重要
● Sora將真正顛覆教育、視頻論文和解說視頻的細分市場
AI創(chuàng)業(yè)公司創(chuàng)始人:五年之后,你將能夠生成完全沉浸式的世界,并實時體驗它們
Takeoff AI是專注于AI Tools的創(chuàng)業(yè)公司,它的創(chuàng)始人認為這一波OpenAI新技術的最大受益者可能是虛擬現(xiàn)實?!霸趦芍軆?nèi),我們連續(xù)有了蘋果的Vision Pro和OpenAI的Sora文本到視頻AI模型。五年之后,你將能夠生成完全沉浸式的世界,并實時體驗它們。Holodeck(應該是指今年火爆的掌機Steamdeck的虛擬現(xiàn)實版本)很快就要來了?!?
除了這些技術上的猜測和對產(chǎn)業(yè)影響的正面預測外,也有老反對派指出Sora的潛在問題不那么容易糾正。
Gary Marcus:Sora奇怪的物理故障可能不是數(shù)據(jù)中出現(xiàn)的
紐約大學教授Gary Marcus以其對AI領域的深刻見解和對現(xiàn)有技術的批判性思考而聞名,他的觀點和研究對AI社區(qū)產(chǎn)生了重要影響。他表示“Sora奇怪的物理故障(例如動物和人在人群中自發(fā)出現(xiàn)和消失)令人著迷:這些錯誤可能不是數(shù)據(jù)中出現(xiàn)的。這種小故障在某些方面類似于LLM“幻覺”,即從有損壓縮中(大致)解壓縮產(chǎn)生的偽影,而不是來自這個世界的東西?!?
而且這種錯誤在他看來是一種“與現(xiàn)實世界物理學的系統(tǒng)性偏差,可能很難糾正。”
不過此刻最悲傷的應該是Google,今天本來拿來翻盤用的的Gemini1.5發(fā)布風頭完全被Sora壓過。作為AI界的汪峰,它對此沒有評論。
以上就是openai視頻生成模型sora爆火 OpenAI王炸模型官方技術報告解讀全部內(nèi)容,希望對你有幫助。想查找更多游戲資訊,歡迎持續(xù)關注游戲鳥查看。-
- 魔獸世界冰dk天賦加點推薦
- 阿姆羅2025-04-07 17:11:51
-
- NS2發(fā)布會匯總:港版售價3450港幣,馬車新作首發(fā)護航,支持4K120FPS輸出!
- 卡繆2025-04-03 10:14:35
-
- 可能漲價?CDPR稱《GTA6》漲價對他們來說是有利的。
- 卡繆2025-03-28 17:31:44
-
- 期待不?巴西博主曝Faker的S14冠軍皮膚選擇為永恩!
- 卡繆2025-03-21 17:04:15
-
- 罵歸罵買歸買?育碧官宣《刺客信條:影》首日玩家數(shù)突破100萬人!
- 卡繆2025-03-21 16:52:32
-
- 《云族裔(inZOI)》售價188元!3月20日開啟部分系統(tǒng)免費體驗!
- 卡繆2025-03-19 17:24:10
-
- 大火!《雙影奇境》官宣發(fā)售僅一周,銷量已突破200萬份!
- 卡繆2025-03-14 17:22:08
-
- 《天國:拯救2》新更新超過60G!一共修復超1000項BUG!
- 卡繆2025-03-14 17:14:52
-
- 逆水寒手游元宵節(jié)時裝怎么獲得 2024元宵節(jié)時裝獲取方法
- 游戲鳥手游網(wǎng)2024-03-25 15:31:16
-
- 逆水寒手游鏡天閣閑游特質(zhì)怎么獲得 鏡天閣閑游特質(zhì)獲取攻略
- 游戲鳥手游網(wǎng)2024-04-13 20:58:42
-
絕地兵團
絕地兵團是以末世為背景的3D第一人稱射擊游戲,玩家將在人類岌岌可危的世界中扮演一名精英戰(zhàn)士,拿起武器對抗不斷入侵的怪物與邪惡力量。絕地兵團游戲采用高質(zhì)量的畫面表現(xiàn)與真實的射擊手感,帶來沉浸式的戰(zhàn)斗體驗。絕地兵團每一場戰(zhàn)斗都考驗玩家的反應與精準,尤其在狙擊模式下,更需把握時機,一擊制敵。絕地兵團游戲中設有豐富的關卡與多樣的敵人類型,同時支持武器強化與角色養(yǎng)成,提升整體作戰(zhàn)能力。 -
比特小隊手機版
比特小隊手機版是一款結合Roguelike與雙搖桿射擊元素的高自由度動作游戲,采用手動瞄準機制,考驗玩家操作與策略。游戲內(nèi)擁有隨機生成的地圖、多樣化武器、個性角色與豐富事件,帶來極高的重玩價值。每個角色擁有獨特技能與成長路徑,搭配武器與道具打造專屬戰(zhàn)斗流派。感興趣的玩家快來加入這場星際冒險,解鎖更多隱藏劇情與挑戰(zhàn)! -
合并弓箭手
合并弓箭手是一款十分好玩的策略類火柴人射箭闖關游戲,玩家在游戲合并弓箭手(Merge Archers)需要做的就是控制弓箭手射箭,射中對方陣營的小人,消滅對方既可順利通關。這款游戲合并弓箭手(Merge Archers)畫風十分簡單Q萌。 -
太空鳳凰
太空鳳凰是一款星際題材的3D飛行射擊游戲!游戲太空鳳凰不僅有著完美易操作的手感,而且還有著高清HD畫面和極致的流暢體驗!你是不是也和大家一樣有著征服太空的夢想,想象著駕駛飛船穿梭在無邊宇宙,躲避隕石流,追捕那些星際大盜。 -
芭比小公主變身記
芭比小公主變身記是一款深受女孩喜愛的換裝養(yǎng)成類手游,玩家將在游戲中為可愛的芭比小公主進行全方位裝扮。從華麗禮服、百變發(fā)型,到夢幻配飾、潮流鞋履,每一個細節(jié)都等待你來親手打造!芭比小公主變身記內(nèi)豐富的造型搭配激發(fā)你的時尚創(chuàng)意,百變風格隨心切換,輕松成為時尚造型師! -
Escape From Clive
Escape From Clive(逃離克里夫)下載是融合FPS與RPG元素的3D槍戰(zhàn)射擊游戲,玩家將在卡通畫風的塔爾科夫城中展開生死探索。游戲支持拾荒養(yǎng)成機制,玩家擊敗敵人或成功撤退均可獲取裝備,逐步強化自身戰(zhàn)力。Escape From Clive擁有海量槍械配件與個性皮膚,玩家可自由搭配,真實模擬戰(zhàn)場策略與生存,打造沉浸式末日對抗體驗。 -
頭鐵主公
頭鐵主公是融合三國背景與策略卡牌玩法的手游新作,構建了一個亂世爭霸與奇幻聯(lián)動交匯的全新世界。頭鐵主公游戲不僅囊括眾多三國名將,還特別攜手人氣仙俠IP,為玩家?guī)戆倮锿捞K、風晴雪等限定角色,共同掀起戰(zhàn)場風云。通過簡化養(yǎng)成流程,頭鐵主公下載玩家可一鍵升級英雄,輕松享受養(yǎng)成樂趣,無需日夜在線也能穩(wěn)步提升戰(zhàn)力。頭鐵主公游戲節(jié)奏輕快,注重策略搭配與陣容構建,強調(diào)在紛亂亂世中以智謀制勝。 -
僵尸立方體2
僵尸立方體2是一款高自由度的上帝視角像素風射擊生存手游,延續(xù)前作風格,并對視覺、地圖、敵人、BOSS、武器系統(tǒng)等全面升級。玩家將在多樣地圖中抵御一波又一波僵尸潮,解鎖強力武器、布置陷阱、尋找彩蛋,還可通過局域網(wǎng)或互聯(lián)網(wǎng)與好友聯(lián)機作戰(zhàn)。游戲內(nèi)設有積分系統(tǒng),擊殺僵尸可獲得金幣解鎖房間與裝備。喜歡像素射擊與僵尸生存題材的玩家千萬不要錯過! -
火柴人槍手射擊
火柴人槍手射擊是一款以經(jīng)典火柴人為題材的動作射擊類手游。火柴人槍手射擊是一款題材新穎的射擊闖關手游,游戲火柴人槍手射擊畫風雖然比較簡約,但是其獨特的玩法元素還是為其加分不少。 -
影子劍客
影子劍客是一款以純正武俠江湖為題材的手游,游戲中玩家將體驗到超硬核的玩法和高清真實的游戲場景,帶來沉浸式的視覺盛宴。影子劍客提供豐富的副本和劇情內(nèi)容,激烈的戰(zhàn)斗和打擊感讓玩家感受到無與倫比的刺激。游戲內(nèi)融合了多樣化的玩法,包括自由變裝、多人同屏戰(zhàn)斗等,帶給玩家極致的江湖冒險體驗。