Sora到底懂不懂物理世界? AI視頻生成引發(fā)行業(yè)震驚
Sora最近很火爆,AI視頻生成讓行業(yè)內(nèi)發(fā)生了很大變動(dòng),對(duì)于Sora已經(jīng)有不少業(yè)內(nèi)的大佬開始激烈探討,想要了解Sora到底懂不懂物理世界,那么大家可以看看下方游戲鳥小編帶來的最新資訊,方便大家更好的了解哦。
Sora到底懂不懂物理世界
Sora 到底是不是物理引擎甚至世界模型?圖靈獎(jiǎng)得主 Yann LeCun、Keras 之父 Francois Chollet 等人正在深入探討。
最近幾天,OpenAI 發(fā)布的視頻生成模型 Sora 成了全世界關(guān)注的焦點(diǎn)。
【關(guān)注機(jī)器之心視頻號(hào),第一時(shí)間看到有趣的 AI 內(nèi)容】
和以往只能生成幾秒鐘視頻的模型不同,Sora 把生成視頻的長(zhǎng)度一下子拉長(zhǎng)到 60 秒。而且,它不僅能了解用戶在 Prompt 中提出的要求,還能 get 到人、物在物理世界中的存在方式。
以經(jīng)典的「海盜船在咖啡杯中纏斗」為例。為了讓生成效果看起來逼真,Sora 需要克服以下幾個(gè)物理難點(diǎn):
規(guī)模和比例的適應(yīng):將海盜船縮小到能夠在咖啡杯中纏斗的尺寸,同時(shí)保持它們的細(xì)節(jié)和結(jié)構(gòu),是一個(gè)挑戰(zhàn)。AI 需要理解和調(diào)整這些對(duì)象在現(xiàn)實(shí)生活中的相對(duì)尺寸,使得場(chǎng)景在視覺上顯得合理;
流體動(dòng)力學(xué):咖啡杯中的液體會(huì)對(duì)海盜船的運(yùn)動(dòng)產(chǎn)生影響。AI 模型需要模擬液體動(dòng)力學(xué)的效果,包括波浪、濺水和船只移動(dòng)時(shí)液體的流動(dòng),這在計(jì)算上是復(fù)雜的;
光線和陰影的處理:為了使場(chǎng)景看起來真實(shí),AI 需要精確地模擬光線如何照射在這個(gè)小型場(chǎng)景中,包括咖啡的反光、船只的陰影,以及可能的透光效果;
動(dòng)畫和運(yùn)動(dòng)的真實(shí)性:海盜船的運(yùn)動(dòng)需要符合真實(shí)世界的物理規(guī)律,即使它們被縮小到咖啡杯中。這意味著 AI 需要考慮到重力、浮力、碰撞以及船體結(jié)構(gòu)在動(dòng)態(tài)環(huán)境中的行為。
雖然生成效果還有些瑕疵,但我們能明顯感覺到,Sora 似乎是懂一些「物理」的。英偉達(dá)高級(jí)研究科學(xué)家 Jim Fan 甚至斷言,「Sora 是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的物理引擎」,「是一個(gè)可學(xué)習(xí)的模擬器,或『世界模型』」。
部分研究者同意這樣的觀點(diǎn),但也有不少人反對(duì)。
Yann LeCun:生成視頻的過程與基于世界模型的因果預(yù)測(cè)完全不同
圖靈獎(jiǎng)得主 Yann LeCun 率先亮明觀點(diǎn)。在他看來,僅僅根據(jù) prompt 生成逼真視頻并不能代表一個(gè)模型理解了物理世界,生成視頻的過程與基于世界模型的因果預(yù)測(cè)完全不同。
他接著講到,模型生成逼真視頻的空間非常大,視頻生成系統(tǒng)只需要產(chǎn)生一個(gè)合理的示例就算成功。不過對(duì)于一個(gè)真實(shí)視頻而言,其合理的后續(xù)延續(xù)空間卻非常小,生成這些延續(xù)的代表性片段,特別是在特定行動(dòng)條件下,任務(wù)難度更大。此外生成視頻的后續(xù)內(nèi)容不僅成本高昂,實(shí)際上也毫無意義。
因此,Yann LeCun 認(rèn)為,更理想的做法是生成視頻后續(xù)內(nèi)容的抽象表達(dá),并消除與我們可能所采取動(dòng)作無關(guān)的場(chǎng)景中的細(xì)節(jié)。
當(dāng)然,他借此又 PR 了一波 JEPA(Joint Embedding Predictive Architecture,聯(lián)合嵌入預(yù)測(cè)架構(gòu)),認(rèn)為上述做法正是它的核心思想。JEPA 不是生成式的,而是在表示空間中進(jìn)行預(yù)測(cè)。與重建像素的生成式架構(gòu)(如變分自編碼器)、掩碼自編碼器、去噪自編碼器相比,聯(lián)合嵌入架構(gòu)(如 Meta 前幾天推出的 AI 視頻模型 V-JEPA)可以產(chǎn)生更優(yōu)秀的視覺輸入表達(dá)。
以上就是Sora到底懂不懂物理世界? AI視頻生成引發(fā)行業(yè)震驚全部?jī)?nèi)容,希望對(duì)你有幫助。想查找更多游戲資訊,歡迎持續(xù)關(guān)注游戲鳥查看。
-
- 魔獸世界冰dk天賦加點(diǎn)推薦
- 阿姆羅2025-04-07 17:11:51
-
- NS2發(fā)布會(huì)匯總:港版售價(jià)3450港幣,馬車新作首發(fā)護(hù)航,支持4K120FPS輸出!
- 卡繆2025-04-03 10:14:35
-
- 可能漲價(jià)?CDPR稱《GTA6》漲價(jià)對(duì)他們來說是有利的。
- 卡繆2025-03-28 17:31:44
-
- 期待不?巴西博主曝Faker的S14冠軍皮膚選擇為永恩!
- 卡繆2025-03-21 17:04:15
-
- 罵歸罵買歸買?育碧官宣《刺客信條:影》首日玩家數(shù)突破100萬人!
- 卡繆2025-03-21 16:52:32
-
- 《云族裔(inZOI)》售價(jià)188元!3月20日開啟部分系統(tǒng)免費(fèi)體驗(yàn)!
- 卡繆2025-03-19 17:24:10
-
- 大火!《雙影奇境》官宣發(fā)售僅一周,銷量已突破200萬份!
- 卡繆2025-03-14 17:22:08
-
- 《天國(guó):拯救2》新更新超過60G!一共修復(fù)超1000項(xiàng)BUG!
- 卡繆2025-03-14 17:14:52
-
- 古龍風(fēng)云錄借花獻(xiàn)佛任務(wù)攻略 借花獻(xiàn)佛支線任務(wù)圖文通關(guān)流程
- 游戲鳥手游網(wǎng)2024-05-06 16:14:39
-
- 古龍風(fēng)云錄人心難測(cè)任務(wù)怎么做 人心難測(cè)支線任務(wù)攻略
- 游戲鳥手游網(wǎng)2024-05-06 16:14:38
- 1 魔獸世界冰dk天賦加點(diǎn)推薦
- 2 NS2發(fā)布會(huì)匯總:港版售價(jià)3450港幣,馬車新作首發(fā)護(hù)航,支持4K120FPS輸出!
- 3 可能漲價(jià)?CDPR稱《GTA6》漲價(jià)對(duì)他們來說是有利的。
- 4 期待不?巴西博主曝Faker的S14冠軍皮膚選擇為永恩!
- 5 罵歸罵買歸買?育碧官宣《刺客信條:影》首日玩家數(shù)突破100萬人!
- 6 《云族裔(inZOI)》售價(jià)188元!3月20日開啟部分系統(tǒng)免費(fèi)體驗(yàn)!
- 7 大火!《雙影奇境》官宣發(fā)售僅一周,銷量已突破200萬份!
- 8 《天國(guó):拯救2》新更新超過60G!一共修復(fù)超1000項(xiàng)BUG!
-
二次元氪金模擬器2最新版
二次元氪金模擬器2最新版是一款高度還原真實(shí)氪金體驗(yàn)的二次元風(fēng)格抽卡模擬游戲,游戲內(nèi)設(shè)有多種氪金選項(xiàng),讓玩家可在真實(shí)模擬中體驗(yàn)抽卡快感,歐皇與非酋共存的設(shè)定極具趣味。角色收集、養(yǎng)成、組合策略豐富,每位英雄均擁有獨(dú)特技能,更設(shè)有300抽挑戰(zhàn)、圣像祠加成、VIP系統(tǒng)等多樣玩法,帶來沉浸式養(yǎng)成體驗(yàn)??靵黹_啟你的二次元氪金之旅吧! -
網(wǎng)絡(luò)小說家模擬游戲
網(wǎng)絡(luò)小說家模擬游戲是一款高度還原小說創(chuàng)作生活的模擬養(yǎng)成類手游,玩家將在游戲中扮演一位網(wǎng)絡(luò)小說作者,從默默無聞的新人起步,在不斷更新、積攢粉絲、爭(zhēng)取出版與影視改編的過程中逐步走向文壇巔峰。游戲擁有豐富的模擬系統(tǒng)與養(yǎng)成要素,玩法充滿挑戰(zhàn)性與趣味性,是每一位熱愛文字創(chuàng)作玩家不容錯(cuò)過的寫作人生體驗(yàn)! -
彩虹史萊姆模擬器
彩虹史萊姆模擬器是一款休閑解壓類的3D模擬捏泥游戲,玩家可以在手機(jī)上享受真實(shí)粘液般的史萊姆互動(dòng)體驗(yàn),自由選擇顏色、顆粒、質(zhì)感與添加劑,親手混合制作屬于你的專屬彩泥,并可將完成品收藏、貼標(biāo)簽或錄制視頻分享。無論是想解壓放松,還是熱愛手作模擬玩法的玩家,都不容錯(cuò)過這款創(chuàng)意滿滿的史萊姆模擬游戲。 -
人力資源機(jī)器安卓版
人力資源機(jī)器安卓版是一款別具一格的編程解謎游戲,在游戲中你將扮演一名普通員工,通過編程邏輯完成上司交辦的任務(wù)逐層晉升,直到登上辦公樓頂層。游戲采用拖拽式指令設(shè)計(jì),能鍛煉邏輯思維能力,讓你體會(huì)編程的樂趣。每一關(guān)的挑戰(zhàn)既有趣又富有啟發(fā)性,搭配幽默的畫風(fēng)和完整的劇情,為玩家?guī)硪粓?chǎng)別開生面的解謎體驗(yàn)。 -
開局一只史萊姆
開局一只史萊姆是一款文字放置類仙俠手游,融合修仙、擬態(tài)、掛機(jī)、轉(zhuǎn)生、進(jìn)化等多重玩法,打造出獨(dú)特的異世界修仙體驗(yàn)。玩家將扮演一只因意外穿越至修仙世界的史萊姆,從最底層修煉成長(zhǎng),通過擊敗敵人習(xí)得技能、積累屬性,逐步開啟擬態(tài)系統(tǒng),轉(zhuǎn)生蛻變?yōu)楦鞣N強(qiáng)大存在,直至登頂仙界巔峰。 -
業(yè)力輪回手游
業(yè)力輪回手游是一款融合靈魂轉(zhuǎn)生題材與手繪解謎風(fēng)格的冒險(xiǎn)闖關(guān)游戲,講述主人公為救摯愛而經(jīng)歷轉(zhuǎn)世輪回的凄美故事。你將化身為一只名為Pip的小蟲,在光明與黑暗之間游走,穿越詭異世界、破解謎題、挑戰(zhàn)命運(yùn)。獨(dú)特的解謎設(shè)計(jì)和機(jī)關(guān)機(jī)制帶來燒腦挑戰(zhàn),是解謎冒險(xiǎn)愛好者不可錯(cuò)過的心靈之作。 -
節(jié)奏盒子機(jī)械恐懼癥版
節(jié)奏盒子機(jī)械恐懼癥版是一款融合音樂與節(jié)奏闖關(guān)的創(chuàng)新型音樂游戲,玩家將在震撼的音浪中挑戰(zhàn)自我節(jié)奏極限。游戲涵蓋電子、流行、搖滾等多種風(fēng)格的高品質(zhì)曲目,并引入機(jī)械恐懼元素,打造沉浸式視覺體驗(yàn)。豐富場(chǎng)景+漸進(jìn)式難度設(shè)定,適合從新手到高手的全階玩家,快來開啟你的節(jié)奏旅程! -
ChainBeeT音游
ChainBeeT音游是一款節(jié)奏感十足的音樂節(jié)奏游戲,專為喜愛音游的玩家設(shè)計(jì),游戲包含數(shù)百首曲目、12個(gè)難度段位以及多種模式選擇,讓不同水平的玩家都能找到適合自己的挑戰(zhàn)方式。無廣告、無內(nèi)購(gòu),支持離線游玩,只需精準(zhǔn)點(diǎn)擊音符即可完成演奏。無論你是在通勤途中還是網(wǎng)絡(luò)不佳的環(huán)境下,ChainBeeT音游都是你放松心情、提升反應(yīng)力的絕佳選擇。 -
言靈世界
言靈世界是一款二次元卡牌游戲。言靈世界手游融入了經(jīng)典的RPG冒險(xiǎn)元素,采用回合制以及即時(shí)戰(zhàn)斗玩法為核心,帶給玩家沉浸式游戲體驗(yàn);游戲言靈世界手游中每張卡牌對(duì)應(yīng)的角色形象都非常細(xì)膩精美,都具有專屬人物立繪。 -
言靈日記
言靈日記是一款像素題材的養(yǎng)成類手機(jī)游戲,游戲言靈日記畫面簡(jiǎn)約,采用像素畫風(fēng)設(shè)計(jì),游戲中玩家可以不斷的收集各種角色,超簡(jiǎn)單的游戲玩法帶你體驗(yàn)養(yǎng)成游戲的無限樂趣,更有超多的游戲關(guān)卡等你來解鎖。
-
NS2發(fā)布會(huì)匯總:港版售價(jià)3450港幣,馬車新作首發(fā)護(hù)航,支持4K120FPS輸出!
- 可能漲價(jià)?CDPR稱《GTA6》漲價(jià)對(duì)他們來說是有利的。
- 期待不?巴西博主曝Faker的S14冠軍皮膚選擇為永恩!
- 罵歸罵買歸買?育碧官宣《刺客信條:影》首日玩家數(shù)突破100萬人!
- 《云族裔(inZOI)》售價(jià)188元!3月20日開啟部分系統(tǒng)免費(fèi)體驗(yàn)!
- 大火!《雙影奇境》官宣發(fā)售僅一周,銷量已突破200萬份!
- 《天國(guó):拯救2》新更新超過60G!一共修復(fù)超1000項(xiàng)BUG!
- 會(huì)是年度游戲嗎?《雙影奇境》總監(jiān)預(yù)測(cè)年度游戲:恐怕很難超越GTA6