首页 >> 科技 >

豆包App灰度发布全新语音模式,抢先GPT-4o实现歌唱与角色扮演功能

2025-01-21 09:01:14 来源:网易 用户:孙妹宝 

豆包App在2025年1月20日发布了最新的“端到端”语音大模型,并基于此更新了实时语音通话功能。此次更新将语音识别、理解和生成整合到一个模型中,大幅提升了对话的流畅度和情感表达。豆包新增的“灵魂歌手”和“百变大咖”模式,使其能在语音交互中唱歌和模仿各种角色,甚至包括明星、书中和影视中的角色,这一能力超越了GPT-4o。此外,豆包的情绪感知和表达也变得更加强大,能够根据对话情境切换语气,提供更自然的交互体验。此次更新标志着豆包在拟人化赛道上取得了重要进展,有望将AI的应用场景从专业领域扩展到情感陪伴、心理咨询等更广泛的领域。

另一方面,传统的ASR+LLM+TTS级联方案在语音交互的自然度上存在局限,而端到端方案逐渐成为主流。豆包此次的技术升级,正是从多个多模态模型合作的级联方案,转变为端到端的模型方案,从而在降低延时、提升自然度和情感表达等方面取得了显著效果。这一变化不仅提升了用户体验,也为AI语音交互的落地开辟了更广阔的市场空间。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章
版权与免责声明:
①凡本网注明"来源:驾联网"的所有作品,均由本网编辑搜集整理,并加入大量个人点评、观点、配图等内容,版权均属于驾联网,未经本网许可,禁止转载,违反者本网将追究相关法律责任。
②本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
③如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,我们将在您联系我们之后24小时内予以删除,否则视为放弃相关权利。