share_log

海天瑞声(688787.SH):算法团队联合清华大学语音与音频技术实验室充分利用公司海量高质量语音数据集储备

海天瑞聲(688787.SH):算法團隊聯合清華大學語音與音頻技術實驗室充分利用公司海量高質量語音數據集儲備

格隆匯 ·  09/09 03:33

格隆匯9月9日丨海天瑞聲(688787.SH)在投資者互動平台表示,公司是專業的人工智能訓練數據服務提供商,目前正在圍繞AIGC/大模型數據服務領域進行投入建設。一方面,公司持續加大大模型數據方向的研發投入,增厚大模型領域的數據儲備,截至2024年6月30日,己完成並持續建設包括「大語言模型中文對話預訓練數據集」、「語音大模型(聲音復刻、歌曲)微調數據集」、「語音大模型(多語種)預訓練及微調數據集」、「視覺大模型(圖像-文本)預訓練及微調數據集」、「視覺大模型(視頻-文本)預訓練及微調數據集」等在內的多領域大模型數據集。與此同時,爲更好理解大模型技術方向,2024年上半年,公司通過前瞻性研究,探索大模型數據的規模化生產方式,全面助力公司大模型業務的擴張。公司己和清華大學聯合啓動多語種語音大模型研發計劃,該項目將基於最新的語音大模型框架技術,自研多語種數據清洗技術,訓練多個不同規模的語音大模型,有效提升多語種語音數據處理的效率和準確性。公司的算法團隊聯合清華大學語音與音頻技術實驗室充分利用公司海量高質量語音數據集儲備(超過200個語種/方言,近30萬小時自有知識產權的語音數據集),充分發揮各自所長,促進大模型技術在數據生產領域橫屏查看的更深層次的應用。

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論