OpenAI的Sora崛起:它帶來了什麼意義和投資前景?
在2月15日,OpenAI發表了一個具有開創性的公告,宣布推出了迄今為止最強大的文本到視頻模型Sora。Sora能夠根據文本提示生成詳細的視頻,擴展現有的視頻敘事,甚至可以從靜態圖像中創建場景。雖然AI生成的視頻不是什麼新鮮事物,但Sora的公開展示展示了視頻質量、持續時間等方面的重大進步,引起了業界的轟動。
Sora的推出被譽為AIGC的里程碑事件,導致OpenAI估值飆升,並在上游計算能力至下游應用之間展示了投資機會,影響著媒體、娛樂、遊戲、廣告等各個行業。
Sora相比以前的AI視頻生成工具有何特點?
在Sora首次亮相之前,已經有很多視頻生成工具,如Runway Gen2和Pika。然而,Sora在幾個方面顯著優於其他平台:
1. 視頻長度和清晰度: Sora可以輸出長達1080P的高清視頻,長度可達60秒,這是其他競爭對手僅能輸出十到二十秒視頻長度的顯著改進。此外,視頻生成效果非常連貫。
2. 彈性的視頻尺寸和格式: Sora的模型可以採樣寬屏1920x1080視頻,豎屏1080x1920視頻,以及中間任何尺寸的視頻(其他模型只有固定尺寸)。Sora還支持創意的視頻擴展,向前向後,以及多視頻連接。
3. 同時具備多視角拍攝的單個視頻: Sora在一個生成的視頻中可以創建多個鏡頭,即使主體暫時離開視野,也可以準確保持角色和視覺風格的一致性。
4. 真實世界物理建模能力: Sora不僅理解用戶的提示,還了解這些事物在現實世界中的存在。
根據OpenAI的說法,「我們正在教導人工智能理解並模擬運動中的物理世界,目標是訓練能幫助人們解決需要真實世界互動的問題的模型。」
在人工智能最新發展中,哪些行業板塊將受到影響,有哪些投資機會正在出現?
儘管目前的模型還存在一些弱點,例如難以準確模擬複雜場景的物理原理,Sora的問世無疑標誌著人工智能在視頻技術領域的一次突破,開創了人工智能遊戲科技的新時代。
除OpenAI外,其他科技巨頭最近在人工智能領域取得了新的突破:
Google推出了Gemini 1.5 Pro,支援長達100萬標記的上下文長度,並顯著提高了性能;Meta推出了V-JEPA,一款人工智能視頻模型,旨在通過預測視頻中缺失或遮蔽的部分來有效增強人工智能對世界的理解。
$英偉達 (NVDA.US)$ 還推出了一個名為Chat with RTX的本地聊天機器人應用程序。此外,根據公開的財務報告,諸如美國愛文思控股等巨頭的資本支出指南 $谷歌-A (GOOGL.US)$, $亞馬遜 (AMZN.US)$, $微軟 (MSFT.US)$, and $Meta Platforms (META.US)$ 在人工智能領域的發展持續增長,證實了該行業的繁榮。
隨著大模型競爭的加速和多模態人工智能技術的不斷突破,一系列相關領域也將發生深刻變革。
1. 預計加快人工智能應用場景
Sora的出現意味著視頻生成領域的競爭日益激烈,將大大加快多模態人工智能和人工智能應用場景的發展。Sora背後的新興能力為需要現實世界建模的行業(如自動駕駛、設計、廣告(電子商務)、教育、醫療保健和網絡安全等)提供了明確的方向,人工智能應用場景將不斷擴大。那些在應用端最早布局人工智能的公司預計將從行業格局的變化中受益。
2. 計算能力需求進一步增加
Sora將加速多模態領域主要參與者的投資,預計將推動訓練和推理方面的計算能力需求增加,從而使人工智能芯片巨頭(如英偉達)受益。 $英偉達 (NVDA.US)$ 和 $美國超微公司 (AMD.US)$ 由於對人工智能的需求激增,愛文思控股將B100的原計劃發布日期提前至2024年第2季度,據說該款產品的性能是當前型號H200的兩倍。
3. 傳統娛樂和電影行業的地震
Sora的出現意味著視頻生成的門檻和成本顯著降低,這將對視頻製作、傳統廣告、電影和短視頻等行業帶來重大變革。相比傳統的影視製作,Sora的製作流程更簡單,投資成本更低,且產生更快、更有創造力的成果。在Sora發布後,從事多媒體製作軟體開發的公司,例如 $Adobe (ADBE.US)$,在上週五,股價下跌了7.41%,而 $Shutterstock (SSTK.US)$是圖片庫供應商,提供圖片、音樂和編輯工具,股價跌幅超過5.44%。
根據美國電影行業領先雜誌《好萊塢報導》,"雖然類似的人工智能視頻工具已經存在,但OpenAI的系統代表了該技術的飛速發展,有潛力削弱大量勞動力。這預示著在娛樂行業應對人工智能時將進一步普及。"
資料來源:OpenAI,彭博社,好萊塢報導
由美國Moomoo的Irene
免責聲明:此内容由Moomoo Technologies Inc.提供,僅用於信息交流和教育目的。
更多信息
評論
登錄發表評論