share_log

奇富科技智能语音模型川渝方言识别准确率提升超35%

奇富科技智能語音模型川渝方言識別準確率提升超35%

TechWeb ·  05/31 02:56

【TechWeb】5月31日消息,奇富科技智能營銷及貸後提醒業務場景中,每天都能接到大量帶方言口音的電話,客戶口音的多樣性直接影響到語音識別的準確率和業務的流暢度。爲此,奇富科技宣佈“QI語精靈”方言識別技術再度升級,成功將業內首個全自研Qifusion框架集成到業務場景中,不僅彌合方言識別對自身業務的影響,而且在業內知名的Kespeech 開源方言數據集性能對比測試中,字錯率刷新模型最低值,達到國內頂尖水平。

圖:Kespeech 開源方言數據集性能對比

據悉,QI語精靈是奇富科技全自研智能語音模型,此次升級依託自身豐富的貸後提醒及方言數據樣本,不僅延續了對國內八種主流地區方言的覆蓋,包括東北官話、膠遼官話、北京官話、冀魯官話、中原官話、江淮官話、蘭銀官話和西南官話,還特別針對四川、重慶、山東、河南、貴州等用戶分佈較多的地區方言的識別能力進行了強化,平均識別準確率相對提升了25%,川渝地區方言識別準確率相對提升超35%。同時,融合方言信息提取模塊,它能夠自動識別不同口音,並在時間維度上對文字進行解碼修正,將方言口音的語音識別誤差率降低了30%以上,整體語音識別字錯率降低了16%以上,顯著提升了用戶體驗。

在模型結構上,QI語精靈依託全自研的Qifusion結構,突破傳統方言識別模型受限於地區先驗條件,需預先知曉方言種類才能準確識別的侷限,無需方言種類的先驗條件,便能直接進行精準的識別和轉譯。並創新採用了多任務學習方法,在複雜的通話環境下實現了超過93%的語音識別綜合準確率。此外,意圖識別功能同樣表現出色,準確率超過95%,能夠迅速而準確地識別用戶需求並做出響應。

在業務應用上,基於QI語精靈提出的預訓練方言信息模塊及增量業務數據訓練策略的結合,能大幅提升智能營銷、貸後提醒、風險控制業務應用場景識別準確率。在智能電銷及貸後客戶溝通服務中,QI語精靈能將大量的語音轉寫成文字,無論是標準的普通話還是方言口音都能精準捕捉並轉寫,大幅減輕客服人員的工作壓力。同時,能快速且準確地解析用戶需求並作出響應,爲用戶提供精準高效的服務體驗。

據介紹QI語精靈技術在實際應用中展現出的顯著成效得益於奇富科技在人工智能語音領域的持續研究與開發積累。《Eden-TTS:一種簡單高效的非自回歸“端到端可微分”神經網絡的語音合成架構》、《基於多粒度Transformer的多模態情緒識別》和《基於SE模塊和多尺度特徵學習的語音情感識別》等多篇論文被ICASSP和 INTERSPEECH兩大頂級語音領域的國際學術會議連續收錄。

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論