top of page

Google Veo 3.1 震撼更新!「素材轉影片」功能登場,支援原生直式、4K 畫質與更強的角色連貫性

  • 作家相片: fuh911
    fuh911
  • 5天前
  • 讀畢需時 5 分鐘

 

作者:Nino Leitner

日期:2026 年1 月 19

 


Google DeepMind 推出了 Veo 3.1 的重大更新,引進增強的「素材轉影片(Ingredients To Video)」功能,能將參考影像轉變為動態影片片段,並具備更高的連貫性,同時支援行動優先內容創作的原生 9:16 直式格式,及適用於專業工作流程的 1080p 和 4K 解析度最先進「解析度提升(Upscaling)」技術。

 

人工智慧(AI - Artificial Intelligence)影片生成領域持續快速發展,Google 顯然致力於保持領先地位。繼去年稍早推出 Veo 3 和 Flow 創意平台之後,該公司現在進一步推展其「影像轉影片」功能。這些新功能將在多個 Google 平台上推出,包括 Gemini 應用程式、YouTube Shorts、YouTube Create、Flow、Google Vids、Gemini API 以及 Vertex AI。

 

Google Veo 正在學習如何在影片中生成更具連貫性的影像。圖片來源:Google
Google Veo 正在學習如何在影片中生成更具連貫性的影像。圖片來源:Google

Pixotope 產品專家服務 (每班)
NT$70,000.00
立即購買


什麼是「素材轉影片」?

對於不熟悉這個術語的人來說,「素材轉影片」指的是 Veo 利用參考影像作為生成影片片段基礎的能力。這種方法不單純依賴文字提示(Text Prompt)生成影像,而是允許創作者透過提供 AI 特定的人物角色、物體、背景或紋理(Texture)影像來保持視覺連貫性。系統接著會根據隨附的文字描述讓這些元素動起來。

 

Google 聲稱更新後的模型即使使用簡單的提示,也能產生更具表現力和創意的結果,生成更豐富的對話和敘事,讓影片感覺更生動。當然,這些都是製造商的宣稱,有待實際測試驗證,但這個概念解決了 AI 影片生成中的一個根本挑戰:保持畫面和場景之間的連貫性。

 


Stype Kit Virtual 攝影機追蹤系統
NT$1,180,000.00
立即購買


人物角色與物體連貫性的改進

這次更新中最實用的改進之一是增強了人物角色的身分連貫性。根據 Google 的說法,更新後的 Veo 3.1 模型現在可以在場景變換時,讓人物角色在多個場景中保持外觀一致。對於任何試圖在實際製作中使用 AI 生成影像的人來說,這一點非常重要。能夠在不同鏡頭中保持一致的人物角色外觀,在理論上開啟了更複雜敘事作品的可能性。

 

背景和物體的連貫性也得到了改善。系統現在能更好的維持場景內設定和物體的完整性,並能在多個片段中重複使用背景、物體和紋理。這對於製作系列內容或需要視覺連貫性專案的內容創作者來說特別有用。

 

 

除此之外,此次更新還能無縫融合不同的元素。來自不同來源的人物角色、物體、紋理和風格化背景,可以組合成具凝聚力的片段。Google 建議在 Gemini 應用程式或 Flow 中使用他們新的 Nano Banana Pro 影像生成器(即 Gemini 3 Pro Image),專門製作供 Veo 3.1 使用的素材影像。

 


HUMan Crane (CRANE WITHOUT StypeKit Virtual) 虛擬製作攝影追蹤搖臂
FromNT$1,000,000.00
立即購買


原生直式影片與解析度選項

對於社群媒體內容創作者來說,最直接實用的新增功能或許是原生 9:16 直式影片生成。這是「素材轉影片」功能首次能夠產生人像模式(Portrait Mode)內容,且無需裁切或犧牲畫質。鑑於直式短影音在 YouTube Shorts、TikTok 和 Instagram Reels 等平台上的主導地位,這填補了一個顯著的缺口。

 

在解析度方面,Google 引進了最先進的 1080p 和 4K「解析度提升(Upscaling)」能力。改進後的 1080p 選項被定位為剪輯工作流程的理想選擇,提供更銳利、更乾淨的影片輸出。4K 選項則針對高階製作和大螢幕展示,能捕捉豐富的紋理和細節。然而值得注意的是,1080p 和 4K 解析度提升僅透過 Flow、Gemini API 和 Vertex AI 提供,無法透過 Gemini 應用程式或 YouTube 等面向消費者的應用程式使用。

 


iodyne Pro Data SSD 軍用級群組儲存系統 (24TB)
FromNT$399,000.00NT$398,000.00
立即購買

 


供應情況與平台存取

Google 針對消費者和專業層級規劃了不同的供應方式。消費者和創作者首次可以直接在 YouTube Shorts 和 YouTube Create 應用程式中,及支援人像模式的 Gemini 應用程式中存取 Veo 3.1 的「素材轉影片」功能。專業和企業用戶則可透過 Flow、Gemini API、Vertex AI 和 Google Vids 進行存取,其中更高解析度的選項僅在 Flow、API 和 Vertex AI 上提供。

 

YouTube Create 的整合目前正向印度、美國、加拿大、紐西蘭和澳洲的使用者推出,並計劃在未來幾個月內擴大供應範圍(包括 iOS 版本)。

 

 

 

SynthID 浮水印與驗證

Google 繼續在其所有 AI 生成的影片中嵌入 SynthID 浮水印(Watermark),堅持其識別合成內容的承諾。該公司於 12 月擴充了 Gemini 應用程式中的驗證工具,除了現有的影像驗證功能外,也納入了影片驗證。使用者可以上傳影片並詢問其是否由 Google AI 生成,這項功能目的在於合成媒體日益逼真的時代中促進透明度。

 


EIZO ColorEdge PROMINENCE CG1 Reference Monitor
NT$1,100,000.00NT$1,000,000.00
立即購買


對電影工作者的更廣大願景

一如我們在 CineD 上廣泛的報導,「生成式影片 AI(Generative Video AI)」對電影製作產業來說,既代表了令人興奮的創意可能性,也帶來了合理的擔憂(關於這些擔憂的精彩討論,請參考我最近與好萊塢攝影指導 Oren Soffer 進行的深度 Podcast 訪談,探討生成式 AI 的危險與問題)。像 Veo 3.1 這樣的工具在技術層面上無疑令人印象深刻,但它們也引發了關於著作權、同意權及傳統製作工作流程未來的重大問題。

 

 

我們之前對 Veo 3 和 Flow 的報導突顯了這些工具所創造的能力與張力。Google DeepMind 與 Darren Aronofsky 的 Primordial Soup 創投之間的合作關係,持續探索 AI 生成內容如何與傳統電影製作技術整合,儘管圍繞合成表演和角色創造的法律與倫理框架仍未定案。

 

為了讓電影工作者能負責任的駕馭這個不斷演變的領域,我們的姊妹公司 MZed 提供了由 Drew Geraci 教授的「引導未來:給電影工作者的道德 AI 影片」課程,他以在《紙牌屋》(House Of Cards)和史蒂芬·史匹柏的《西城故事》(West Side Story)中的作品而聞名。該課程涵蓋如何在製作工作流程中整合 AI,同時保持創意所有權、透明度和道德實踐。Geraci 展示了使用 Google Flow 等工具的混合製作技術,將實拍素材與 AI 生成元素相結合。重要的是,該課程會定期更新以跟上快速變化的技術,Google 的最新發布也即將被納入課程內容。

 

Veo 3.1 的改進是否能轉化為專業製作中真正有用的工具,仍有待實際測試來觀察。在 AI 影片生成領域,展示影片(Demo Reel)與現實世界的可靠性之間,歷來存在顯著差距。儘管如此,每一次迭代都讓這些工具更接近實際應用,至於結果是好是壞,則取決於你的觀點。

 

你對 Google 持續推動 AI 影片生成有什麼看法?像「素材轉影片」這樣的功能是否為你創意工具箱中的實用新增項目,還是你對生成式影片在專業工作中的實際應用仍持懷疑態度?歡迎在下方留言分享你的想法。


 

 

想了解更多關於虛擬製作的軟硬體整合、應用及選購建議嗎?

歡迎聯絡 堅達公司(Pixotope、stYpe 台灣總代理),我們的銷售與支援團隊非常樂意為你提供專業的諮詢服務。


👉加入我們的 LINE 官方帳號:https://line.me/R/ti/p/@691ttrbp

你的虛擬製作專業顧問,線上為你解答任何疑問!

 

https://getop.tv/15f20a

留言


訂閱

02 7720 9899

©2019 by GETOP Systems Inc.
堅達資訊實業股份有限公司

bottom of page