AI視頻與真相 - 憐君解比人間夢許我時逃醉後禪

字體：小中大

AI視頻與真相

2025/06/23 01:05:08瀏覽113｜回應0｜推薦4

AI視頻與真相

一張照片變成5秒鐘的視頻，裡頭有多少的猜測，有多少的真相？

我們知道，AI擴散模型生成照片，是從任意圖像開始，以常態統計分佈加入雜訊之後，完成預測雜訊的訓練，然後再在去雜訊/生成圖像的過程中，加入提示詞的制約，因而產生了無雜訊的新圖像。

AI的視頻也是用擴散模型，但是他必須將空間的因素與時間的因素交互地訓練與生成。空間部分基本上是二維的(圖像)，而時間的部分則是一維的，所以是一個三維的擴散模型。但是要訓練時間的推移，就必須讓這個模型接受宇宙萬物隨時間推移運動的知識。因為訓練資料的不足，有時必須使用非監督式的學習方法讓他自由發揮，這樣就會產生許多有趣的現象 - 或者說的白話一點，就是所謂的平行時空。

這裡有一禎40多年前的照片，是一位英俊的軍官和一位美貌的歌手，在一個勞軍的場合合影留念的照片。這位軍官彬彬有禮，事先請教歌手，是否可以將手搭在她的肩膀上。歌手很爽快的答應了，但是這位軍官還是很靦腆地，努力做了個(據他所知)浮搭的動作，如圖所示。

40多年之後，從相片轉換成AI視頻的工具出現，將塵封的回憶一下子產生了如下的四個栩栩如生的視頻，或者說平行時空。在這個四個視頻當中，擴散模型非常調皮，或者說有創意地，各自產生了5秒鐘不同的生命，像是同時生存在平行的世界：有的彬彬有禮，有的談笑風生，有的比較自然，有的甚至將手指變成衣飾的部分。這些都是AI視頻的創意(機率分布)，或者說，向人類世界學習的，想當然爾的不同結果。

有趣的是，真相究竟是哪一個呢？我們這位當時年輕英俊的軍官，是否真如他所說，沒有碰觸到歌手的肩膀呢？在這個人工合成的現實世界裡，究竟什麼是真相，我們究竟該相信什麼呢？

( 此照片與這些影片乃是為了記錄歷史回憶與學術探討而製作，非營利用途，如有肖像權疑慮歡迎告知，我們將立即處理)

( 知識學習｜隨堂筆記 )