在市場長久等待下,ChatGPT 背後開發商 OpenAI 今日終於正式推出 AI 影音生成工具 Sora ,可讓用戶生成最多 20 秒、解析度 1080p 的擬真影片,Sora 暫未能在歐盟國家、瑞士和英國使用,但在這些國家以外地區的 ChatGPT 用戶能使用。
(前情提要:OpenAI發表Day2》逆天「強化學習微調」新功能,增強AI專業領域學習準確度)
(背景補充:OpenAI 發表滿血版 o1 模型和新訂閱方案 ChatGPT Pro,月費 200 美元值得嗎?)
ChatGPT 背後開發商 OpenAI 自 6 日開始進行為期 12 天的新產品發布,首日登場的是完整版推理模型 o1,取代先前的預覽版本,Day2 則釋出新功能「強化學習微調」(RFT),讓用戶能夠使用自己的數據集,透過強化學習演算法對 o1 模型進行客製化訓練。
而今(10)日是活動 Day3,OpenAI 宣布推出其備受期待的 AI 影音生成工具 Sora ,目前 Sora 暫未能在歐盟國家、瑞士和英國使用,但在這些國家以外地區的 ChatGPT 用戶都能使用。
Sora 正式推出
OpenAI 執行長 Sam Altman 在活動上介紹 Sora 的細節,指出用戶將能以文字提示詞,透過 Sora.com 生成解析度最高 1080p、最長 20 秒,以橫式、直式或方形比例呈現的影片,除了允許用戶生成短片外,還可查看其他用戶的提示詞和精選影片。
隨著正式版推出,OpenAI 也宣布速度更快的新版本 Sora 模型 Sora Turbo 問世,不過 Sora Turbo 效能雖已較年初版本快,OpenAI 坦言,還是有許多限制,像是經常生成不合實際的物理運動,長時間影片中,表現較複雜行為也會有困難,仍在努力強化改進。
根據 OpenAI 介紹,用戶使用 Sora ,可透過多種不同功能來創作影片,包括透過 Explore 功能,用戶可瀏覽由社群生成的影片,查看影片所使用的文字提示和創作過程,以激發創意靈感,同時還有多種功能強大的視訊生成工具,重點整理如下:
Recut 功能
智慧識別最佳畫面,並支持向任意方向延伸場景。
Remix 功能
在 Remix 功能中,用戶可以利用純自然語言提示詞對影片進行編輯,並通過簡單的強度選項和滑塊,來控制生成的變化程度。
Storyboard 功能
類似於影片編輯器,可將多個提示詞串聯在一起,生成多段影片,再運用影片時間軸編排,串連成一整部影片。
Loop 和 Blend 功能
搭配 Loop (循環)和 Blend (融合)功能,用戶能創作出無縫循環的影片,完美融合不同片段。
Sora 的功能,依照不同的 ChatGPT 訂閱計劃有所差異:
- ChatGPT Plus 訂閱戶(每月 20 美元):提供每月 50 次生成機會,影片解析度最高 720p,影片長度最長 5 秒。
- ChatGPT Pro 訂閱戶(每月 200 美元):提供 500 則快速生成影音,以及無限則數的較緩慢影音生成服務,影片解析度最高 1080p,影片長度最長 20 秒,並允許下載無浮水印影片。
OpenAI 還在考慮為不同類型的用戶開發不同的定價模式,將於明年初推出,Sora 目前暫不支持 ChatGPT Team、Enterprise 和 Edu 用戶,同時也不向 18 歲以下用戶開放。
📍相關報導📍
OpenAI 宣布將連續 12 天直播:推出許多新功能,AI 概念幣可埋伏?