去除背景噪声 阿里通义实验室开源语音处理技术ClearerVoice-Studio

阿里巴巴达摩院的通义实验室近期宣布开源一项名为ClearerVoice-Studio的语音处理技术,旨在提升语音质量和可懂度。随着语音技术的广泛应用,语音质量受到越来越多人的关注,尤其是在环境噪声、混响和设备拾音等情况下,语音处理技术的需求日益迫切。

ClearerVoice-Studio集成了语音增强、语音分离和音视频说话人提取等功能,通过融合复数域深度学习算法,大幅提升了语音降噪和分离的性能。该技术能够最大限度地消除背景噪声,保留语音清晰度,同时保持语音失真最小化。

202310311416147098_0

ClearerVoice-Studio的核心模型与算法包括在2022年IEEE/INTER Speech DNS Challenge中获得整体第二的FRCRN模型,以及在语音分离任务中表现卓越的MossFormer系列模型。基于MossFormer2的48kHz语音增强模型在有效抑制噪声的同时,大幅降低了语音失真。

阿里巴巴通义实验室希望通过ClearerVoice-Studio平台,为开发者、研究者和企业提供强大的语音处理工具,助力创新应用落地。用户可以通过在线体验Demo,准备一段包含噪声的语音文件,上传至指定页面,一键处理后在线试听或下载处理结果,即刻获得清晰的音质和卓越的降噪效果。

GitHub 仓库:https://github.com/modelscope/ClearerVoice-Studio

在线体验 Demo:https://huggingface.co/spaces/alibabasglab/ClearVoice

原创文章,作者:狐呼网,如若转载,请注明出处:https://www.ihuho.com/4961.html

(0)
上一篇 2024年12月8日 下午3:35
下一篇 2024年12月8日 下午3:37

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

公众号
公众号
新媒体群
新媒体群
联系邮箱

1284674160@qq.com

分享本页
返回顶部
新媒体之家(狐呼网)免费入驻互联网领域个人自媒体,企业自媒体,媒体网站等。入驻合作可以联系:m1284674160