科大讯飞语音合成技术全新升级-新华网
新华网 > 安徽 > 正文
2025 06/28 16:05:19
来源:科大讯飞

科大讯飞语音合成技术全新升级

字体:

  6月26日,科大讯飞语音合成技术全新升级,“一句话声音复刻”与“超拟人合成”两大核心能力实现突破。

  讯飞星火APP的“一句话声音复刻”功能自2024年4月上线以来,备受用户和行业认可。此次讯飞技术突破的关键,除了星火语音大模型底座的持续迭代,还构建了一套三阶段层次化语音建模框架。在音色解耦表征能力的基础上,科大讯飞对于声音复刻场景进行两项关键技术的尝试与突破:音色编码增强和强化学习。

  讯飞的超拟人合成技术此次进阶的重点是赋予AI声音以“上下文情商”。科大讯飞开发了基于上下文感知的语音生成系统。该系统融合历史文本及对应音频特征,通过跨模态编码器分析上下文,让AI声音能像真人一般敏锐响应情绪转变和话题转换。

  科大讯飞研究院院长刘聪表示:“我们希望声音能成为承载情感与个性的新维度,赋能更多场景行业,催生更多可能。属于AI声音的多元化、情感化时代,正加速成为现实。”

【纠错】 【责任编辑:周雨濛】