《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 阿里云通義千問開源兩款語音基座模型

阿里云通義千問開源兩款語音基座模型

識別效果優于 OpenAI Whisper
2024-07-09
來源:IT之家

7 月 9 日消息,阿里云通義千問開源了兩款語音基座模型 SenseVoice(用于語音識別)和 CosyVoice(用于語音生成)。

0.jpg

SenseVoice 專注于高精度多語言語音識別、情感辨識和音頻事件檢測,有以下特點:

多語言識別:采用超過 40 萬小時數據訓練,支持超過 50 種語言,識別效果上優于 Whisper 模型

富文本識別:具備優秀的情感識別,能夠在測試數據上達到和超過目前最佳情感識別模型的效果;支持聲音事件檢測能力,支持音樂、掌聲、笑聲、哭聲、咳嗽、噴嚏等多種常見人機交互事件進行檢測

高效推理: SenseVoice-Small 模型采用非自回歸端到端框架,推理延遲極低,10s 音頻推理僅耗時 70ms,15 倍優于 Whisper-Large

微調定制:具備便捷的微調腳本與策略,方便用戶根據業務場景修復長尾樣本問題

服務部署:具有完整的服務部署鏈路,支持多并發請求,支持的客戶端語言有 python、c++、html、java 與 c#等

與開源情感識別模型進行對比,SenseVoice-Large 模型可以在幾乎所有數據上都達到了最佳效果,而 SenseVoice-Small 模型同樣可以在多數數據集上取得超越其他開源模型的效果。

0.jpg

CosyVoice 模型同樣支持多語言、音色和情感控制,該模型在多語言語音、零樣本語音生成、跨語言語音克隆和指令跟隨等功能方面表現出色。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 日本精品中文字幕有码 | 欧美综合精品一区二区三区 | 亚洲国产精品视频 | 在线观看成年视频 | 亚洲美女视频网站 | 美女视频永久黄网站在线观看 | 免费福利在线看黄网站 | 欧美videosex性欧美成人 | 亚洲一区欧美二区 | 日韩精品在线观看免费 | 性欧美巨大的视频 | 国产精品久久成人影院 | 久久er热视频在这里精品 | 精品一区二区三区免费观看 | 亚洲国产日韩欧美高清片a 亚洲国产日韩欧美在线 | 欧美在线一区视频 | 在线日韩三级 | 欧美亚洲免费久久久 | 在线观看91精品国产入口 | 手机福利在线 | 九九精品激情在线视频 | 国产免费一级高清淫曰本片 | 精品在线免费视频 | 日本久久免费 | 成人爽爽大片在线观看 | 亚洲综合91社区精品福利 | 色视频一区二区三区 | 亚洲精品一二三区-久久 | 国产精品免费视频一区一 | 国产第一夜 | 黄色三级免费网站 | 国产视频一二三 | 综合亚洲欧美日韩一区二区 | 久久久久久久免费 | 久久久久免费精品国产 | 日本一级在线播放线观看视频 | 69视频成人 | 中国精品视频一区二区三区 | 亚洲精品国产经典一区二区 | 欧美日韩色黄大片在线视频 | 国产亚洲欧美成人久久片 |