人工智慧(AI)龍頭公司 OpenAI 上週發佈了一種新的人工智慧模型 Sora,能夠根據使用者輸入的文本生成相應的視訊場景,為通用人工智慧(AGI)帶來了新的突破。那麼,Sora 若與區塊鏈結合,會產生怎樣的機會呢?本文源自 W3C DAO Research 所著文章,由 PANews 整理及撰稿。
(前情提要: OpenAI 新推文字生成影片「Sora」AI 模型,社群嚇呆:電影等級,能顛覆影視產業)
(背景補充: OpenAI的Sora最大敵人?馬斯克:特斯拉影片生成AI「全世界最強」)
Sora 是 OpenAI 開發的一種人工智慧模型,它可以根據使用者輸入的文字指令生成逼真和富有想像力的視訊場景。
「Sora 只是小試牛刀,它展現的不僅僅是一個視訊製作的能力,而是大模型對真實世界有了理解和模擬之後,會帶來新的成果和突破。」
2 月 16 日,360 創辦人周鴻禕釋出微博提到自己對 Sora 的看法,周鴻禕認為,Sora 的誕生意味著 AGI(通用人工智慧)實現可能從 10 年縮短至一兩年。
而在 Web3 領域,視訊流媒體平臺 Livepeer 今日發文稱,作為 Livepeer 人工智慧視訊計劃的一部分,社群正在努力在未來幾個月內將 OpenAI 的文字轉視訊功能 Sora 引入 Livepeer 網路。
隨後 OKX 行情資料顯示,LPT 突破 13 USDT,24 小時漲超 60%。
另據 Arkham 監測資料顯示,受 Sora 訊息影響,昨日有 23 個相關「Sora」的 MeMe 在 Uniswap 上推出,其中 0xD3c 開頭地址買入 160 美元早期同名 MeMe 幣後賺取了 15 萬美元,漲幅超 1,000 倍。
AI + 視訊能擦出怎麼樣的火花?
視訊是一種強大的媒介,它可以傳達豐富的資訊和情感,同時也可以激發人們的創造力和想像力。
然而,視訊的製作和編輯通常需要專業的技能和裝置,而且也受限於現實世界的物理規律和資源。如果我們能夠通過簡單的文字指令來生成我們想要的視訊場景,那麼我們就可以更自由地表達我們的想法和故事,也可以更容易地探索和學習物理世界的現象和規律。
為了實現這個目標,OpenAI 開發了一種人工智慧模型,叫做 Sora。
Sora 是一種根據文字生成視訊的技術,它可以根據使用者輸入的文字指令生成逼真和富有想像力的視訊場景。可以說,Sora 的目標是訓練模型理解和模擬運動中的物理世界,從而幫助人們解決需要與真實世界互動的問題。
例如,使用者可以輸入 「一個人在月球上跳躍」,Sora 就可以生成一個顯示人在月球上跳躍的視訊,同時考慮到月球的重力和環境。使用者也可以輸入 「一個火車從一座橋上掉下來」,Sora 就可以生成一個顯示火車從橋上掉下來的視訊,同時考慮到火車的速度和橋的結構。
Sora 的視訊生成能力不僅可以用於娛樂和創作,也可以用於教育和科學。例如,使用者可以輸入 「展示一個牛頓擺的運動」,Sora 就可以生成一個顯示牛頓擺的運動的視訊,同時解釋牛頓擺的物理原理。使用者也可以輸入 「展示一個火山爆發的過程」,Sora 就可以生成一個顯示火山爆發的過程的視訊,同時解釋火山爆發的地質原因。
但 Sora 的視訊生成技術還有很多的挑戰和限制,例如,如何提高視訊的解析度和幀率,如何處理複雜和多樣的文字指令,如何保證視訊的邏輯和一致性,以及如何避免視訊的倫理和社會問題。
Sora 的開發者希望通過不斷的研究和改進,讓 Sora 成為一種更智慧和更友好的人工智慧夥伴,為人們提供更多的視訊創造和享受的可能性。
又一次變革
根據科技創業公司研究機構 PitchBook 的估計,2023 年全球生成式 AI 的市場規模將達到 426 億美元,2026 年則將達到 981 億美元,未來增長動能可期。
Sora OpenAI 作為一種創新的文字轉視訊模型,有望在這個龐大的市場中佔有一席之地,為各行各業提供高效、低成本、高品質的視訊生成服務。
正面意義主要體現在以下幾個方面:
1.為創意工作者提供更多的靈感和可能性。Sora OpenAI 可以根據使用者的文字指令,建立現實且富有想像力的場景視訊,而且是廣角,時長延展至 60s。這不僅是技術的突破,更是創作自由的體現。試想,一個優秀的編劇可能就不再需要依賴演員、導演、預算等一系列因素,只要他的劇本足夠好,AI 就可能以極低的成本生產出優秀的作品。
2.為教育和科普提供更多的形式和內容。Sora OpenAI 可以根據教育和科普的文字,生成生動和有趣的視訊,幫助學習者更好地理解和記憶知識。比如,Sora OpenAI 可以根據 「一群紙飛機在茂密的叢林中翩翩起舞,在樹林中穿梭,就像候鳥一樣」 這樣的文字,生成一段展示紙飛機的飛行原理和叢林生態的視訊。
3.為娛樂和休閒提供更多的選擇和樂趣。Sora OpenAI 可以根據使用者的興趣和喜好,生成各種各樣的視訊,滿足使用者的觀看需求和審美喜好。比如,Sora OpenAI 可以根據 「一位時髦的女士穿梭在充滿溫暖霓虹燈光和動感城市標誌的東京街頭」 這樣的文字,生成一段展示東京風情和時尚潮流的視訊。
挑戰主要體現在以下幾個方面:
1.技術上的侷限性。Sora OpenAI 雖然能夠生成高品質的視訊,但也存在一些缺陷和不足。比如,Sora OpenAI 可能難以準確模擬複雜場景的物理原理或把握因果關係。Sora OpenAI 還可能混淆空間細節,並且可能難以精確描述隨著時間推移發生的事件,例如遵循特定的相機軌跡。這些問題需要進一步的研究和改進。
2.倫理和社會上的爭議。Sora OpenAI 的視訊生成能力可能會引發一些倫理和社會上的爭議和擔憂。比如,Sora OpenAI 可能會被用於製造虛假或誤導性的視訊,影響公眾的判斷和信任。Sora OpenAI 還可能會對視訊創作者的版權和利益造成侵害或威脅。
延伸閱讀:OpenAI 影片生成模型「Sora」太強,造假影片要氾濫了?學4招辨識真假、看破Deepfake
Blockchain+Sora 有哪些機會?
Web3+Sora
可以說,Sora 的視訊生成技術可以為 Web3 帶來更多的內容的多樣性和品質,也可以為 Web3 帶來更多的形式的創新和變化。
比如,Sora 可以與 NFT(非同質化代幣)相結合,為使用者提供更多的數位藝術和收藏品。Sora 可以與 DAO(去中心化自治組織)相結合,為使用者提供更多的協作和治理的方式。Sora 可以與 DeFi(去中心化金融)相結合,為使用者提供更簡單的投資和交易機會。
元宇宙 + Sora
Sora 和元宇宙的相融合,將為使用者帶來更加豐富和自由的虛擬體驗,也將為元宇宙的發展和創新提供更多的可能性和動力。以下是一些可能的場景:
1. 在元宇宙中,使用者可以使用 Sora 來建立自己的虛擬世界,無論是現實中的地點、歷史中的事件、還是幻想中的故事,只要用文字描述,Sora 就可以生成對應的視訊場景,讓使用者感受到身臨其境的效果。
2. 在元宇宙中,使用者可以使用 Sora 來擴展套件和優化自己的虛擬形象,無論是服裝、配飾、髮型、膚色、表情等,只要用文字描述,Sora 就可以生成對應的視訊效果,讓使用者可以隨心所欲地改變自己的外觀和風格。
3. 在元宇宙中,使用者可以使用 Sora 來學習和娛樂,無論是知識、技能、興趣、愛好等,只要用文字描述,Sora 就可以生成對應的視訊教程、遊戲、演示、表演等,讓使用者可以輕鬆而有趣地獲取資訊和享受樂趣。
寫在最後
簡單而言,Sora 是一種人工智慧模型,它可以根據使用者輸入的文字指令生成逼真和富有想像力的視訊場景。
自 Sora 的誕生引起了業界和社會的廣泛關注和討論。Sora 被認為是通用人工智慧(AGI)實現的重要步驟,也是視訊領域的一次變革,為各行各業提供了高效、低成本、高品質的視訊生成服務。
未來,Sora 的視訊生成技術將與區塊鏈技術相結合,為 Web3 帶來更多的內容的多樣性和品質,也為元宇宙帶來更多的形式的創新和變化。
此外,Sora 還可以與元宇宙中的虛擬世界、虛擬形象、虛擬學習和娛樂等相結合,為使用者帶來更加豐富和自由的虛擬體驗,也為元宇宙的發展和創新提供更多的可能性和動力。
總之,Sora 的未來還有很多的挑戰和機會,需要我們不斷的研究和探索。
📍相關報導📍
AI概念幣夯!市值加總破120億鎂,Sora熱潮下$LPT飆漲150%