網路城邦
上一篇 回創作列表 下一篇   字體:
AI視頻與真相
2025/06/23 01:05:08瀏覽79|回應0|推薦4
AI視頻與真相
一張照片變成5秒鐘的視頻,裡頭有多少的猜測,有多少的真相 ?
我們知道,AI擴散模型生成照片,是從任意圖像開始,以常態統計分佈加入雜訊之後,完成預測雜訊的訓練,然後再在去雜訊/生成圖像的過程中,加入提示詞的制約, 因而產生了無雜訊的新圖像。
 
AI的視頻也是用擴散模型,但是他必須將空間的因素與時間的因素交互地訓練與生成。空間部分基本上是二維的(圖像),而時間的部分則是一維的,所以是一個三維的擴散模型。但是要訓練時間的推移,就必須讓這個模型接受宇宙萬物隨時間推移運動的知識。因為訓練資料的不足,有時必須使用非監督式的學習方法讓他自由發揮, 這樣就會產生許多有趣的現象 - 或者說的白話一點,就是所謂的平行時空。
 
這裡有一禎40多年前的照片,是一位英俊的軍官和一位美貌的歌手,在一個勞軍的場合合影留念的照片。這位軍官彬彬有禮,事先請教歌手,是否可以將手搭在她的肩膀上。歌手很爽快的答應了,但是這位軍官還是很靦腆地,努力做了個(據他所知)浮搭的動作,如圖所示。
 
40多年之後,從相片轉換成AI視頻的工具出現,將塵封的回憶一下子產生了如下的四個栩栩如生的視頻,或者說平行時空。在這個四個視頻當中,擴散模型非常調皮,或者說有創意地,各自產生了5秒鐘不同的生命,像是同時生存在平行的世界:有的彬彬有禮,有的談笑風生,有的比較自然,有的甚至將手指變成衣飾的部分。這些都是AI視頻的創意(機率分布),或者說,向人類世界學習的,想當然爾的不同結果。
 
有趣的是,真相究竟是哪一個呢? 我們這位當時年輕英俊的軍官,是否真如他所說,沒有碰觸到歌手的肩膀呢?在這個人工合成的現實世界裡,究竟什麼是真相,我們究竟該相信什麼呢?
 
( 此照片與這些影片乃是為了記錄歷史回憶與學術探討而製作,非營利用途,如有肖像權疑慮歡迎告知,我們將立即處理)

( 知識學習隨堂筆記 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=Shaw2309&aid=182805551