西安地铁25日起全线网恢复常态化运营
为配合春运工作,根据当前疫情防控形势,结合客流快速增长的特点,自1月25日起,西安地铁全线网恢复...
2025-02-25 15:35:33
来源:今日热点网
近日,字节跳动的豆包语音大模型在小说演播场景取得突破,无需对话旁白、情感、角色等额外标签,也能实现高表现力、高自然度、高语义理解的小说演播效果,声音合成质量媲美真人。
据了解,市面上的语音模型想要媲美一流主播细腻的演播效果,要做好旁白和角色的区分演绎、角色情感的精确表达、不同角色的区分度等。传统的小说TTS合成链路,需要提前给内容打标签。豆包语音模型基于Seed-TTS架构优化,则可以端到端直接合成出具有韵律、情感等细节的声音。
图:传统语音模型和豆包语音模型合成链路的区别
Seed-TTS是字节跳动于2024年6月发布的语音生成基座模型。为提升语音表现力和长文本的理解能力,豆包语音模型团队在Seed-TTS的数据、特征、上下文等结构上做了改进。比如数据上,音频做章节级别处理,保证了长文下的语音一致性和连贯性;语音韵律和准确性上,融合原始文本和前端信息,保证语气词、副语言、强调、弱读等内容自然流畅;额外加入的上下文理解能力,使得模型能够感知更大范围的语义信息,旁白和角色音表现更精准到位。
优化后的豆包语音模型,能端到端演绎更多元的情感,在人物不同情绪上表现自然,而且可实现连续多轮对话,保证角色区分鲜明。
豆包语音模型团队以王明军、李满超两位配音圈大咖的声音为基础,采用新技术合成的有声书,已上线番茄小说,受到用户的广泛欢迎。(作者:陈玖)
标签:
为配合春运工作,根据当前疫情防控形势,结合客流快速增长的特点,自1月25日起,西安地铁全线网恢复...
科技日报记者 张佳星 策划 刘莉 有没有想过,如果有了新冠特效药,你会选择打针还是吃药? ...
民政部日前印发了《关于进一步加强寒假春节期间孤儿、事实无人抚养儿童、农村留守儿童关爱服务工作...
中新网上海1月25日电 (周卓傲)1月22日下午4点30左右,上海地铁15号线祁安路站一名老年女乘客下车时...
记者从河南高速了解到,受大雾影响,截至2022年1月25日8:20河南共30条高速禁止车辆上站: 1、因...
马上评|多写3字赔近3万,离职报告的坑该填上了 一场离职,有人“赚了”,有人“赔了”。最近,...
2022年1月24日19时,山东济宁梁山县疾病预防控制中心接到济宁市疾病预防控制中心推送的北京市大兴区...
根据河南省许昌市疫情防控指挥部(2022年6号)通告,即日(1月25日)起,有序恢复正常生产生活秩序。 ...
科技日报记者& 8194;张梦然 据最新一期英国《自然·通讯》报道,美国密歇根大学开发出一种半导...
科技日报记者& 8194;刘霞 据物理学家组织网近日报道,美国麻省理工学院的科学家借助机器学习算...
记者从河南省禹州市疫情防控指挥部获悉,根据国务院关于应对新冠肺炎疫情分区分级防控工作要求,结...
1月25日,辽宁省金秋医院按照上级部门协查通知,根据国家和省、市疫情防控要求,该医院严格落实相关...