Google 正式上線 Veo 2 影片生成模型,支援付費用戶在 Gemini 平台、Google AI Studio、Gemini API 輸入文字或圖像,產出 8 秒高畫質影片,並可透過 Whisk Animate 將圖像轉動畫。
(前情提要:Google DeepMind 執行長:AGI 將在 5~10 年內出現,能像人類般思考與行動)
(背景補充:Google Gemini 2.0 來了!三款模型差異一次看、免費開放更強推理能力 Flash Thinking 試用)
在生成式 AI 影片技術日益進化的競賽中,Google 再度出招,官方於今日正式宣布,旗下最先進的影片生成模型 Veo 2 已全面上線,現已開放給 Gemini 付費(Advanced)用戶使用,另外用戶也可以通過 Google AI Studio 免費體驗(每天有限額)。
Dive into video creation with @GeminiApp — rolling out today.🪂
Transform text prompts into cinematic 8-second videos with Veo 2 in Gemini Advanced. Select Veo 2 from the model dropdown menu to get started.
Prompt: Write the word "GOOGLE" out of skydiving parachutes opening up pic.twitter.com/IHTmhELUut
— Google (@Google) April 15, 2025
Veo 2 帶來「高畫質、電影感」影片
Veo 2 主打「將文字和圖片轉化為動態影像」,每次輸入指令可產出一段 8 秒、解析度達 720p 的高畫質影片,且具備電影般的光影細節與物理動作擬真效果。該模型能準確解析複雜敘述、掌握人物肢體動作與環境變化,在多種風格與場景下皆展現高度一致性。
目前,用戶只需在 Gemini 中選取 Veo 2 模型、輸入描述內容,即可生成影片。Google 表示,影片格式為 16:9 橫向 MP4,內含 SynthID 水印技術,以表明影片是 AI 生成的。
在行動裝置上分享影片很容易,只需點擊分享按鈕即可將影片快速上傳到 TikTok 和 YouTube Shorts 等平臺。需要注意的是,每月影片生成次數有限,Google 表示會在接近上限時通知用戶。
Whisk Animate 支援動畫創作
此外,Google 也將 Veo 2 整合進 Whisk,一項 Google Labs(Google 用來測試早期 AI 產品的平台)中的實驗性功能,使用者可以透過圖片作為 Gemini 的提示詞來生成新圖片。全新推出的 Whisk Animate 功能,還能將這些靜態圖像轉換成由 Veo 2 製作的 8 秒動畫影片。
這項功能支援「圖像 + 文字」的複合輸入,適用於將圖像生成結果賦予動態生命,進一步拓展創作者的視覺敘事工具箱。
Google AI Studio 與 API 開放:瞄準開發者應用
Veo 2 不僅針對一般用戶推出應用介面,亦開放至 Google AI Studio 與 Gemini API 平台,供開發者進行更高階的整合與開發。
這也意味著企業與創意開發者可將 Veo 2 模型內嵌至自家應用程式和工作流,進一步拓展互動式內容、行銷素材或教育影片等應用場景。
創意工作者戒慎恐懼
然而,技術的快速突破也引發部分產業憂慮。
根據美國動畫工會(Animation Guild)於 2024 年委託研究顯示,預估至 2026 年,美國將有超過 10 萬個影視與動畫相關職位因 AI 影片生成而受影響。尤其是 Veo 2 這類模型,幾乎能在無攝影棚、無導演、無演員的情況下完成初步視覺創作,對傳統製作流程構成顛覆性挑戰。
目前,Google 表示所有 Veo 2 所產影片皆將嵌入 SynthID 水印,並持續與政策單位合作制定 AI 內容透明度規範,盼在創新與責任之間取得平衡。
對抗 Sora、搶佔影音生成市場關鍵一步
Veo 2 的推出正值 AI 影片生成賽道火熱。OpenAI 旗下的 Sora 早前即引爆外界對 AI 導演、AI 敘事的想像,而創意生成平台 Runway 亦在兩週前釋出其第四代影片模型,並完成逾 3 億美元募資。Google 此時上線 Veo 2,顯然意在奠定其在 AI 創作技術領域的主導地位。
未來,Google 亦計畫進一步整合 Gemini 模型與 Veo 系統,以強化 AI 對「物理世界」的理解能力。這不僅將提升影片真實度,也可能為教育、遊戲、社群平台開創全新應用場景。
📍相關報導📍
Google傳將「合作聯發科」開發下一代 AI 晶片,減少依賴輝達..博通危險了?
打破輝達壟斷? Google地表最強AI模型「Gemma 3」用1顆H100,擊敗DeepSeek、OpenAI
Google「Gemini 2.0」來了!推出三種AI代理:複雜任務、遊戲、程式設計