12月3日,在中國電信「2024數字科技生態大會」期間,首屆「TeleAI 開發者大會」在廣州舉辦。會上,TeleAI發佈視頻生成大模型、視覺大模型產用一體化平台、具身智能、智傳網等一系列創新技術、產品及科研成果,併發布開發者產業聯盟計劃。中國電信總經理梁寶俊出席並致辭,CTO、首席科學家、人工智能研究院(TeleAI)院長李學龍作主旨演講。
梁寶俊表示,隨着信息技術的迅猛發展,人工智能已成爲新一輪科技革命和產業變革的重要力量,主要國家和地區紛紛入局競爭。黨的二十屆三中全會吹響了以進一步全面深化改革、開闢中國式現代化廣闊前景的時代號角。人工智能作爲驅動新質生產力的重要引擎,成爲推進中國式現代化的先鋒力量。中國電信牢記使命擔當,全面深化改革,強化科技自主創新和技術攻關,率先佈局人工智能戰略發展,積極推進「AI+」行動。中國電信將攜中電信人工智能公司和TeleAI研究院,持續突破人工智能的技術攻關、持續爲各類客戶提供更加智能的產品方案、持續向開發者提供更優的生態環境和研發平台。
本次發佈的視頻生成大模型打造了「VAST(Video As Storyboard from Text)二階段視頻生成技術」,通過文本描述精準勾勒出包含視頻構圖、主體目標位置及人物姿態等關鍵信息的「故事板」(Storyboard),進而生成對應的視頻內容。
據介紹,得益於 VAST 的創新能力,視頻生成大模型可以保證單個或多個主體人物在各視頻片段中的外觀一致性,實現對複雜動作和交互式動作的精確控制,並讓角色和目標物體的運動符合物理規律。基於此,通過語義、語音、文生圖、文生視頻等全棧大模型能力打通短劇及影視製作的各個環節,覆蓋文字腳本撰寫、分鏡腳本繪製、視頻拍攝及剪輯、配音及音效合成等全流程,實現降本增效。目前,TeleAI 視頻生成大模型在權威視頻生成評測榜單VBench中排名第一。
視覺大模型現已升級至TeleSearch 2.0-基於知識的視圖萬物布控,實現動態知識掛載和行業事件認知,並驅動複雜邏輯理解。TeleSearch 2.0目標打破模態間的信息孤島,支持上百個專業知識文檔掛載,在理解文檔內容的基礎上,可根據複雜長語句精準檢索圖片和視頻,從而完成跨模態複雜語義準確理解及超萬種目標精準檢索。它實現了對傳統檢索類目的指數級提升,以及對十億級目標檢索的秒級響應。
依託TeleSearch 2.0,中國電信構建了視覺大模型產用一體化平台,通過算法冷啓動回流數據,擺脫了傳統模型對大量數據的依賴,實現0訓練數據直接推理,顯著降低算法應用的准入門檻。同時,平台還支持小樣本訓練,僅需100個樣本數據就能訓練出高精度模型,實現模型生產的全自動化過程。目前,該平台已成功應用於多省應急項目,沉澱了20餘個應急全流程感知場景,提升對災害研判與應急響應的核心能力。
隨着本次視頻生成大模型和視覺大模型的發佈,星辰大模型系列進一步完成了其全模態能力的構建。
大會期間,TeleAI 還宣佈與華爲、中興、亞信科技等在內的19家合作伙伴發佈中國電信人工智能開發者產業聯盟計劃,旨在聚合各方力量,加快推動人工智能產業發展,提升技術能力與應用水平,併爲全球開發者賦能。
此外,在本次數字科技生態大會的線下展臺,TeleAI 還展示了一系列在具身智能方向的創新成果,包括可以用於生活服務的人形機器人、面向商場及展會場景的星小辰服務機器人、爲視障人士提供導盲服務的智能機器狗,及整合了一系列大模型能力的AI智能眼鏡。展出了星辰軟件工廠、星辰慧記、星辰智能體產品、中國電信家庭小管家、星辰大模型一體機等一系列智能產品。(中國日報社廣東記者站 李文芳)