致敬單田芳,喜馬拉雅用AI語音讓已故大師聲音重現(xiàn)

2021-09-11 15:11:10來源:威易網(wǎng)作者:

     今年9月11日是一代評書大師單田芳先生逝世三周年忌日。三年前,無數(shù)人感嘆世上再無“下回分解”,而如今,他的“聲音”在喜馬拉雅再次響起,“書接上回”重現(xiàn)江湖。

       “聽眾朋友們,你們好。從今兒個,由我為大家播講懸疑小說,《江湖消亡史:北平暗夜》。這個故事發(fā)生在民國十幾年的北京城里.......”

      今年9月11日是一代評書大師單田芳先生逝世三周年忌日。三年前,無數(shù)人感嘆世上再無“下回分解”,而如今,他的“聲音”在喜馬拉雅再次響起,“書接上回”重現(xiàn)江湖。
 
      近日,在北京單田芳藝術(shù)傳播有限責(zé)任公司授權(quán)下,喜馬拉雅用語音合成 (TS: Text-to-speech)技術(shù)完美還原單田芳先生的聲音,并首次將單田芳先生的AI合成音應(yīng)用于六部風(fēng)格各異的書籍,用單式評書腔調(diào),全新演繹聽眾耳熟能詳?shù)慕?jīng)典之作。單田芳先生之子單瑞林評價,“聽到TTS聲音,心魂間猛然一陣,仿佛父親又回到這個世界。”
 
\
 
      書接上回
 
      單田芳先生是我國著名評書藝術(shù)表演大師,也是國家級非物質(zhì)文化遺產(chǎn)傳承人。他從藝半個多世紀以來,共錄制、播出了《隋唐演義》、《三俠五義》、《亂世梟雄》、《白眉大俠》等100余部共計超過12000余集廣播、電視評書作品,在全國500多家電臺、電視臺都播出過,節(jié)目時間約6000余小時,整理編著17套28種傳統(tǒng)評書文字書稿。
 
      單田芳評書已然成為中國傳統(tǒng)文化的一個重要符號。他的書迷遍布大江南北,上至老人,下至孩童,無不喜歡他的評書。在民間甚至有著“凡有井水處,皆聽單田芳”的說法,即使在今天,如果你坐上一輛北方的出租車,司機可能還在聽他的評書節(jié)目。
 
      本次推出的“單田芳聲音 AI 重現(xiàn)系列專輯”中,既有直擊淚點、奇人異事道盡人生悲歡的武俠小說——趙晨光的《江湖消亡史:北平暗夜》;也有傳達時代脈動的紀實文學(xué)——陳廷一的《毛氏三兄弟:三兄弟與共和國奠基》;還有時下流行、故事情節(jié)曲折奇特的推理小說——紫金陳的《無證之罪》;更有延續(xù)單老生前未完成的的評書經(jīng)典——宮白羽的《十二金錢鏢》……
 
     喜馬拉雅和北京單田芳藝術(shù)傳播有限責(zé)任公司的合作由來已久,喜馬拉雅已上架80余張單田芳先生評書專輯,包括超5000條聲音。而這些專輯在喜馬拉雅也一直深受用戶喜愛,多張評書專輯長期位列喜馬相聲評書熱播榜前列,例如,《亂世梟雄》在喜馬拉雅的播放量高達23.6億,《白眉大俠》播放量高達19.7億。
 
     為致敬單老,傳承文化,喜馬拉雅還開啟了“書接上回——新評書傳承計劃”,希望借此能讓越來越多的評書愛好者和青年評書演員,參與到新評書的創(chuàng)造中,豐富和傳承評書這份非物質(zhì)文化遺產(chǎn) 。
 
\
 
      完美復(fù)現(xiàn)
 
     時隔三年,能夠再次聽到那標(biāo)志性的“云遮月”嗓音,得益于喜馬拉雅智能語音實驗室對單田芳先生聲音的潛心探索和研發(fā)。為了能最大程度保留單老那蒼勁、沙啞的獨特嗓音以及情感充沛的評書腔調(diào),喜馬拉雅智能語音實驗室下了不少功夫。
 
      喜馬拉雅智能語音實驗室長期專注于語音合成、識別、語音信號處理、編解碼以及智能音效的研究和開發(fā),是喜馬拉雅的核心部門。
 
      為了重現(xiàn)單老的聲音,向傳統(tǒng)藝術(shù)致敬,喜馬拉雅的智能語音實驗室不僅完美復(fù)現(xiàn)了單老蒼勁、沙啞的“云遮月”式獨特嗓音,就連他那情感充沛、起伏跌宕的腔調(diào)也一并保留了下來。當(dāng)那個與單田芳先生本人聲音極其相似、近乎于本尊的AI合成音自然流暢地說起評書時,昔日那位僅憑一張嘴就讓人欲罷不能的說書人似乎又重新回到了我們身邊。
 
       喜馬拉雅還請來專業(yè)音效師為每一部“單式新作”都添加了配樂和音效,讓聽眾通過耳朵就能獲得身臨其境的沉浸式體驗。高級音效設(shè)計師的加持,使單老口中的世界變得更加立體和生動了。
 
      相較一般的合成音頻,評書中有很多場景描寫和不同的情緒表達,尤其單田芳先生善以聲音塑造角色,他的評書中韻律起伏變化非常之大。其中還有很多口語化發(fā)音,和普通話的發(fā)音大不相同。比如,“這個”中的“這”字,普通話發(fā)音“zhè”,但在評書中通常讀為“zhèi”。如果僅靠當(dāng)前主流的 TTS 框架模型做提取和合成,合成評書最終的整體感情和情緒都會很平淡,沒有了原作的跌宕起伏。
 
      為了解決這一難題,喜馬拉雅智能語音實驗室自主設(shè)計了單獨的韻律提取模塊,并將其融入到 HiTTS 技術(shù)框架中。這就意味著,不管單田芳先生評書中的韻律多么豐富和多變,都能提取并完全復(fù)刻出來,讓單老的AI合成音仿佛本尊再現(xiàn)。另外一方面,針對單老評書中區(qū)別于標(biāo)準普通話的發(fā)音,團隊還開創(chuàng)性地設(shè)計了口音模塊并對這些特殊發(fā)音進行了標(biāo)注,使得單老AI合成音能夠原汁原味還原出老味道。
就這樣,原汁原味的單田芳“聲音”復(fù)現(xiàn)了。
 
\
 
      聲音想象
 
      單田芳“聲音”的完美復(fù)現(xiàn)并非偶然。喜馬拉雅已在TTS領(lǐng)域潛心鉆研多年,TTS技術(shù)將助力喜馬拉雅在現(xiàn)有的“UGC + PGC + PUGC”內(nèi)容生態(tài)之外,進一步拓展AIGC的可能性。
 
     喜馬拉雅智能語音實驗室的盧恒博士表示,針對小說的TTS系統(tǒng)和音色選取是喜馬拉雅TTS的亮點與特色。用真實自然的TTS音色演繹有聲小說是非常難的,不同于普通的文字轉(zhuǎn)語音,用TTS音色演繹小說需要學(xué)習(xí)小說中的抑揚頓挫、情感表達、上下文關(guān)系,區(qū)分旁白和對白,并最終將作品完美演繹出來。“喜馬拉雅在這方面有著天然的優(yōu)勢。在音頻賽道耕耘多年后,喜馬拉雅已經(jīng)聚集了海量有聲書內(nèi)容和眾多優(yōu)秀主播。喜馬拉雅智能語音實驗室嘗試用各式的聲音來表達不同的情感、題材和頻道,因而就有了更大的試驗和發(fā)揮空間。”
 
       盧恒博士介紹,喜馬拉雅自研的TTS前端文本處理分析模塊已經(jīng)能夠高精度、全自動地對文本進行多音字識別、韻律預(yù)測和風(fēng)格分類,并已開發(fā)出可以實現(xiàn)多情感、多風(fēng)格、多語種聲音的TTS技術(shù)模型,不僅可以演繹不同情緒的文字,還可以自動區(qū)分旁白、對白,并支持英文,極大地豐富了TTS能表達的情感和韻律。喜馬拉雅已申請了三項TTS語音合成相關(guān)專利,其中就包括可以使沒有任何英文原始數(shù)據(jù)的TTS聲音能夠說英文的技術(shù)框架,比如喜馬拉雅技術(shù)已經(jīng)可以實現(xiàn)用單田芳先生“聲音”講英文。
 
 
       目前,喜馬拉雅已經(jīng)將TTS用于多種內(nèi)容的制作中,助力創(chuàng)作者布局音頻,轉(zhuǎn)型升級。如,喜馬拉雅聯(lián)合新京報推出的《鯨快訊》專輯,連續(xù)多周位列喜馬拉雅新聞類專輯新品榜第一位。對于用戶來說,TTS技術(shù)的應(yīng)用,會給他們帶來更豐富的好內(nèi)容。喜馬拉雅將不斷打開對于聲音的想象,讓技術(shù)加持聲音、讓聲音服務(wù)生活。
 
關(guān)鍵詞:喜馬拉雅