Google 的悄然進軍影片化身(video avatars)即將到來。雖然目前尚未有官方公告,但基礎設施的訊號已經出現——很可能是利用他們既有的 Gemini 多模態模型,以及來自 Veo 的影片生成技術。這可能意味著即時唇形同步、情緒映射,甚至可望在直播化身渲染時把延遲壓到 100ms 以下。所謂「夜裡的小偷」式策略,暗示他們在眾人都在關注 HeyGen 與 Synthesia 的同時,早就默默在背後準備了。預期將與 Meet 與 YouTube 緊密整合——這也是典型的 Google 手法:把新技術打包進現有平台,面向擁有數十億用戶的生態系。僅從運算需求來看,就透露出很可能在最佳化 TPU v5。若他們能比競爭者更好地解決「恐怖谷(uncanny valley)」問題,這將讓整個化身市場在一夜之間徹底改變。