今年9月11日是一代评书大师单田芳先生逝世三周年纪念日。三年前,无数人感叹世上再无“下回分解”,而如今,他的“声音”在喜马拉雅再次响起,“书接上回”重现江湖。
“听众朋友们,你们好。从今儿个,由我为大家播讲悬疑小说,《江湖消亡史:北平暗夜》。这个故事发生在民国十几年的北京城里.......”
近日,在北京单田芳艺术传播有限责任公司授权下,喜马拉雅用语音合成 (TTS: Text-to-speech)技术完美还原单田芳先生的声音,并首次将单田芳先生的AI合成音应用于六部风格各异的书籍,用单式评书腔调,全新演绎听众耳熟能详的经典之作。单田芳先生之子单瑞林评价,“听到TTS声音,心魂间猛然一阵,仿佛父亲又回到这个世界。”
单田芳先生是我国著名评书艺术表演大师,也是国家级非物质文化遗产传承人。喜马拉雅和北京单田芳艺术传播有限责任公司的合作由来已久,喜马拉雅已上架80余张单田芳先生评书专辑,包括超5000条声音。而这些专辑在喜马拉雅也一直深受用户喜爱,多张评书专辑长期位列喜马相声评书热播榜前列,例如,《乱世枭雄》在喜马拉雅的播放量高达23.6亿,《白眉大侠》播放量高达19.7亿。
据悉,相较一般的合成音频,评书中有很多场景描写和不同的情绪表达,尤其单田芳先生善以声音塑造角色,他的评书中韵律起伏变化非常之大。其中还有很多口语化发音,和普通话的发音大不相同。比如,“这个”中的“这”字,普通话发音“zhè”,但在评书中通常读为“zhèi”。如果仅靠当前主流的 TTS 框架模型做提取和合成,合成评书最终的整体感情和情绪都会很平淡,没有了原作的跌宕起伏。
为了解决这一难题,喜马拉雅智能语音实验室自主设计了单独的韵律提取模块,并将其融入到 HiTTS 技术框架中。这就意味着,不管单田芳先生评书中的韵律多么丰富和多变,都能提取并完全复刻出来,让单老的AI合成音仿佛本尊再现。另外一方面,针对单老评书中区别于标准普通话的发音,团队还开创性地设计了口音模块并对这些特殊发音进行了标注,使得单老AI合成音能够原汁原味还原出老味道。
就这样,原汁原味的单田芳“声音”复现了。
喜马拉雅智能语音实验室的卢恒博士表示,喜马拉雅自研的TTS前端文本处理分析模块已经能够高精度、全自动地对文本进行多音字识别、韵律预测和风格分类,并已开发出可以实现多情感、多风格、多语种声音的TTS技术模型,不仅可以演绎不同情绪的文字,还可以自动区分旁白、对白,并支持英文,极大地丰富了TTS能表达的情感和韵律。喜马拉雅已申请了三项TTS语音合成相关专利,其中就包括可以使没有任何英文原始数据的TTS声音能够说英文的技术框架,比如喜马拉雅技术已经可以实现用单田芳先生“声音”讲英文。
文/北京青年报记者 温婧
编辑/田野