因为《创新中国》是全球第一部全篇采用人工智能配音的纪录片,也是科大讯飞利用了智能语音和人工智能技术,让已逝的著名配音艺术家李易老师的声音重现荧幕,完成了整部纪录片的配音。
下面就来详细地说一下整个事情的经过,这次尝试从何而来?又是如何进行的呢?
首先介绍一下李易老师,“用事实说话,焦点访谈”——这句大家耳熟能详的声音,正出自于已故的著名配音演员李易老师之口。不仅在《环游地球八十天》、《肖申克的救赎》、《刺杀肯尼迪》等知名影视作品中担任配音,他更是为《再说长江》、《大明宫》、《美丽中国》、《地球脉动》等多部纪录片献声,业内享誉度极高。因此,李易老师也一直是《创新中国》纪录片总导演史岩心中最好的选择。
后来在《创新中国》拍摄过程中,科大讯飞的智能语音和人工智能技术也成为镜头捕捉的对象。是否能用人工智能让李易老师的声音再现?总导演史岩的一个灵光乍现,有了这次尝试的开始。
那么人工智能配音是如何进行的呢?关键是语音合成技术。作为亚太地区最大的智能语音与人工智能上市公司,科大讯飞在领域内深耕多年,拥有国际领先的核心技术水平;在国际语音合成大赛上更是连续十二年获得全球第一的佳绩。科大讯飞的技术团队与央视纪录频道、专业配音团队通过多次讨论后,确认了这项工作的可行性;并且在已故著名配音演员李易家人的授权和支持下,通过选取搜集以往配音纪录片的可用声音素材、处理和调优,科大讯飞完成了李易老师的音库。
根据提供的《创新中国》纪录片文稿,科大讯飞利用音库首先初步合成了一个小样。听到小样中流出那熟悉的声音,《创新中国》的配音负责人、李易老师的学生感慨不已,直呼语音合成的效果让他“老是想掉眼泪”。
虽然初步合成效果受到了肯定与赞许,但为了更好还原配音中的种种细节,让科技的呈现更有温度,科大讯飞的技术团队在仔细比对前几版合成内容后,对字与字之间的黏连度、语句的节奏变化、个别词语的重音强调和合成后的噪音等问题,进一步实现了算法层面的针对性优化,改善了发音、韵律、重度和音质等方面的效果。在此基础上,摄制团队通过剪辑优化合成配音与纪录片的融合,精益求精,力求使纪录片呈现出最好的效果。
在1月18日《创新中国》首映式的现场,李瑞英、朱军、沙桐、邹悦等央视著名主持人与播音员齐聚,见证了科技重现斯人之声的重要瞬间,这也让他们惊讶不已。除了对语音合成配音的高还原赞不绝口,李瑞英认为,感受力是播音员的一大特质,而这段语音合成鲜明地体现了李易老师的个人特点,这项技术可以将更多的好声音保留在荧幕上;朱军则表示高科技留住声音,是一件让人感觉踏实的事。参与首映式的科大讯飞高级副总裁江涛也表示,语音合成技术已经运用在多个领域当中,例如导航软件中不同的合成提示音;但用于长纪录片的配音尚属首次,这也是科大讯飞在用科技向艺术的致敬。