財聯社1月7日訊(編輯 周子意)據報道,谷歌正在組建一個新的團隊,專注於開發可以模擬物理世界的人工智能模型。
該團隊的負責人是蒂姆·布魯克斯(TIM Brooks),他原先是OpenAI視頻生成器Sora的聯合負責人之一,後於2024年10月離開OpenAI,跳槽至谷歌的人工智能研究實驗室谷歌DeepMind。
根據Brooks週一(1月6日)在社交媒體X上的最新發帖,他領導的這個新團隊隸屬於DeepMind,將致力於開發可以模擬物理世界的人工智能模型。
Brooks寫道,「DeepMind有雄心勃勃的計劃,要製造大規模的生成模型來模擬世界。我正在招聘一個新的團隊來完成這個任務。」
根據描述,Brooks的新團隊將着眼於開發「實時交互生成」工具,並研究如何將他們的模型與現有的多模式模型(如Gemini)集成。
新的團隊還將與谷歌現有的Gemini、Veo和Genie團隊合作,並以後者團隊的工作爲基礎,將模型擴展到「最高水平的計算」。
據了解,Gemini是谷歌的旗艦AI模型系列,用於分析圖像和生成文本等任務;Veo是谷歌的視頻生成模型;至於Genie,它是谷歌的基礎世界模型,爲用戶提供了前所未有的交互體驗,支持用戶藉助文本、合成圖像、照片乃至草圖等方式,創造出可玩性強的交互式環境和可控的虛擬世界。
去年12月,谷歌還推出了升級版的Genie 2,能夠模擬出動作可控、極具可玩性的逼真3D虛擬世界。
世界模型
Brooks發佈的工作描述是這樣寫的:「我們認爲,在視頻和多模態數據上擴展人工智能訓練是實現通用人工智能(AGI,指能夠完成人類能完成的任何任務的人工智能)的關鍵途徑。世界模型將爲許多領域提供動力,比如視覺推理和模擬、具體化代理的規劃以及實時互動娛樂。」
「世界模型」是目前技術流派中難度最高的一種,其特點在於讓機器能夠像人類一樣對真實世界有一個全面而準確的認知。
目前,許多初創公司和大型科技公司都在追逐世界模型,包括有影響力的人工智能研究員李飛飛的World Labs、以色列新貴Decart和初創公司Odyssey等。他們認爲,世界模型有一天可以用來創建互動媒體,如視頻遊戲和電影,並運行逼真的模擬,如機器人訓練環境。
不過,世界模型的發展似乎對一些創意人士並不友好。
著名雜誌《連線》最近的一項調查發現,像動視暴雪(Activision Blizzard)這樣的遊戲工作室,已經解僱了大量員工,而他們正在利用人工智能來提高生產率,並彌補人員流失。美國動畫協會在2024年委託進行的一項研究估計,到2026年,美國將有超過10萬個電影、電視和動畫工作崗位被人工智能取代。
相較於被取代,合作似乎是一種更友好的方式。一些新興的世界模特領域的初創公司,比如Odyssey,已經承諾與有創意的專業人士合作。這是否會成爲谷歌的做法,仍有待觀察。
另外,對於世界模型而言,版權問題懸而未決。一些世界模型是根據視頻遊戲播放的片段進行訓練的,這可能會使開發這些模型的公司在視頻未經許可的情況下成爲訴訟的目標。
而擁有Youtube的谷歌聲稱,根據平台的服務條款,它有權基於YouTube視頻訓練自己的模型。但該公司並未透露將爲培訓採購哪些具體視頻。