2024 年第 7 週全息/虛擬實境/AR 行業發展動態周報告(二月十二日至十八日)
特斯拉首席執行官埃隆·馬斯克在平台 X 上的一篇文章中表示,特斯拉的視頻生成技術是世界上最好的,甚至超過 OpenAI 的 Sora。
前一天,馬斯克暗示特斯拉一年前掌握了類似 OpenAI 的視頻生成技術。One X 用戶發表:」OpenAI 的索拉與特斯拉的 FSD v12 有什麼關係?馬斯克回答說:「特斯拉已經能夠生成具有準確物理的真實視頻大約一年。這並不特別有趣,因為所有的訓練數據都來自汽車,所以它看起來像 Tesla 視頻,儘管是一個動態生成的(而不是內存)的世界。」
馬斯克後來分享了特斯拉一年前創建的幾個自動駕駛視頻,為回應用戶的評論說:「特斯拉視頻生產超越 OpenAI 的在於它預測非常準確的物理場景。這對自動駕駛至關重要。」
2 月 16 日早晨,OpenAI 發布了最新的「文盛視頻」模型索拉,以及由索拉生成的多個視頻。與當前主流的「文盛視頻」行業的第二版相比,索拉可以一次生成一分鐘的視頻。
Sora 的發布再次吸引了整個市場的關注。有些人認為 Sora 的創新模型架構為大型模型的開發開了一條新道路,有些人認為 Sora 的推出已大大提升了一般 AI 的到來,有些市場參與者說,Sora 的受歡迎與 OpenAI 的卓越營銷緊密聯繫起來。可預測的是,Sora 的出現無疑將促進人工智能,帶領新一輪行業變化。
蘋果表示,蘋果 Vision Pro 擁有 1,000 多個應用程序和超過 150 萬個 iPad 應用程序,這些應用程序與 Vision Pro 兼容並能在設備上運行。當 Vision Pro 發布時,蘋果表示,耳機擁有 600 多個應用程序,因此在 Vision Pro 推出以來的幾週內,應用程序數量增加了 400 多個。
目前,Vision Pro 和 VisionOS 正處於早期階段,由於該產品僅在美國提供,因此許多流行的應用程序可能在全球市場上推出之前才能更新 VisionOS。
據 Business Insider 報導,公司正在爭奪 Nvidia 的有限 GPU 供應用於訓練和構建 AI 產品的 GPU,而 AI 行業正在蓬勃發展。現在,這家芯片巨頭正在使用自己的 AI 系統來加快芯片生產,顯然是為了跟上需求。
英維亞已經開發了一個名為 ChipNemo 的 AI 系統,旨在加快其 GPU 的生產速度。設計 GPU 通常需要大量人力。Nvidia 表示,通常需要近 1,000 人才能構建一個芯片,每個人都需要了解設計過程中的不同部分如何共同運作。
馬克·古爾曼:蘋果視覺專業版可能需要四代才能達到「理想形式」
Mark Gurman 在文章中,他指出,蘋果耳機開發團隊中的一些人認為,可能需要連續四代設備才能實現蘋果 Vision Pro 耳機的「理想形式」。許多 Vision Pro 用戶認為耳機本身太大,無法長期使用,使得一代產品的縮小化成為改進的重要基石。如果蘋果團隊能夠在四代內解決這些問題,古爾曼認為 Vision Pro 最終將取代 iPad。
最近,Meta CTO Andrew Bosworth 在其社交平台上直播時談到了眼睛跟踪技術。2022 年任務專業版具有眼睛追蹤功能,全新耳機 Quest 3 消除了這種功能。(相比之下,Vision Pro 將其視為核心功能之一,該設備集成了四個眼睛跟踪模塊,用於互動,視覺渲染等。)
博斯沃思提到,眼睛跟踪是它「繼續推向前並返回的事情之一。」同樣,扎克伯格最近表示,Meta 將恢復眼睛跟踪,但尚未確定未來哪些耳機將使用該技術。
超越傳統視覺地平線,WiMi 全息雲(納斯達克:WIMI)開發新的 AR 產品
隨著當今技術的迅速發展,全息顯示技術始終處於未來身臨其境體驗的前線。隨著科技的不斷發展,虛擬現實和增強現實技術已從科幻電影的概念轉移到現實生活。然而,在安裝全息顯示器的領域,存在了一系列技術瓶頸,包括觀看不適,對焦調整不方便,以及設備複雜性。
在這種情況下,WiMi Hologram Cloud 專注於解決全息耳機顯示的技術瓶頸,挑戰傳統顯示模式,提高整體用戶體驗。在產品中採用全息眼追蹤系統、學生可調光學系統和實時 FOV 數位控制,我們開發了 WIMI HoloAR 鏡頭,涉及光學工程、計算機視覺、人電腦互動等多個領域的深度合作。
WiMi 全息雲 Holoar 鏡頭的技術不僅廣泛應用於個別消費市場,提供更沉浸式、個性化的虛擬現實體驗,還在醫療保健、教育和工業等專業領域。借助全息眼睛追蹤對焦系統,用戶無需擔心對焦調整,享受更自然的觀看體驗。光學結構系統具有可調節光學和眼睛距離,確保每個用戶可以根據個人的眼睛特性調整設備,以提高佩戴舒適度。
輝煌實驗室新的「框架」多模式 AI 眼鏡,售價 349 美元
AI 眼鏡開發人員 Brilliant Labs 宣布推出具有集成多模式 AI 助理的「框架」眼鏡。輝煌實驗室表示,Frame 的功能是由一個名為「Noa」的 AI 助理增強了。據說 Noa 受到一個集成的多模式生成人工智能系統支持,可以同時運行多個 AI 模型,能夠進行現實世界的視覺處理,新穎圖像生成以及實時語音識別和翻譯。
免責聲明:社區由Moomoo Technologies Inc.提供,僅用於教育目的。
更多信息4