視通科技
天道啟科
維海德
當前位置:中國數字視聽網首頁 > 視頻會議 > 動態 > 正文
快速搜索:

騰訊云發布音視頻等領域語音識別模型

2020年05月12日 15:15  來源:中國數字視聽網  字體【   

 【數字視聽網訊】上周,騰訊云正式發布金融、音視頻等多個領域專屬語音識別模型。最新發布的模型不僅識別準確率得到大幅提升,同時也增加了對粵語、韓語的支持,后面會陸續開放對上海話等方言以及日語、泰語、印尼語等國外語言的支持。

正式發布金融行業專屬模型,字準率業界領先

據了解,語音識別在金融行業應用場景廣泛,但是實際場景下,很多用戶都是使用方言在和外呼、客服機器人交流,加上金融領域有著大量的專有句式和詞匯,市場上目前通用的語音識別模型存在識別不準的情況。

基于這些的痛點,騰訊云AI團隊與微信智聆聯合打造了金融行業專屬語音識別模型,這個模型的推出不僅能夠有效解決上述難題,還在識別的準確率上得到大幅提升。目前該模型已經在金融領域的智能外呼、智能客服、電話錄音質檢等多個場景落地。經客戶實測,字準率在業界處于領先水平。

率先打造音視頻專屬語音識別模型,準確率提升10%

隨著互聯網直播浪潮的興起,如何利用智能語音技術快速識別用戶的音視頻內容、進行精準推薦和不健康內容過濾,已經成為各大直播和內容分享平臺在日益激烈的市場競爭中的核心競爭力。但由于音視頻背景環境復雜且屬于半遠場,需要有大量數據積累才能實現準確識別。

憑借自身在音視頻領域數據的大量積累,騰訊云在業界率先推出了音視頻領域專屬語音識別模型,目前已在多家音視頻領域直播平臺和電商直播平臺應用,經客戶實測,識別準確率提升近10%。

語種豐富度進一步提升,騰訊云語音識別加速落地

為滿足不同客戶群體需求,騰訊云語音識別今年在語種豐富度上持續發力,聯合微信智聆、騰訊國際業務語音技術實驗室、騰訊民漢翻譯等多個人工智能實驗室,在原有常見語種基礎上,開放了韓語、粵語的識別能力,后面會陸續開放對上海話等方言以及日語、泰語、印尼語等國外語言的語音識別能力。經過長期的打磨訓練和效果調優,目前騰訊云語音識別各語種已廣泛應用于會議記錄轉寫、視頻字幕、電話錄音質檢等業務場景。

實際上,騰訊云憑借多年在智能語音領域的耕耘,已經收獲眾多權威機構的認可。在Gartner今年首次正式發布的《Magic Quadrant for Cloud AI Developer Services》研究報告中,騰訊云成為中國唯一入選Gartner云AI開發者服務魔力象限的云廠商。

騰訊云AI語音產品負責人表示:“騰訊云AI語音團隊未來仍將繼續打磨技術,提供業界最具性價比的智能語音產品,推動智能語音在產業互聯網的廣泛落地。用更前沿的技術、更極致的產品體驗,幫助合作伙伴和客戶打造高效的專屬解決方案,助力各行各業的數字化和智能化轉型。”

來源:訊云時代

(編輯:hxl)

中國數字視聽網微信公眾平臺:
搜索“數字視聽網”或掃描下面的二維碼,關注官方微信平臺,開啟視聽行業新聞資訊新旅程!
明基
MAXHUB
快捷
產品關注排行
"掃一掃"關注我
a天堂中文在线88