配音合成 確定不再關注此人嗎你喜歡的網絡小說,一直沒有轉換成讀物?
再見了,我的一萬元配音設備你好,耳朵經濟的先驅——聲咖啡
一點財經 3 月 29 日 16:59 關注 確定不再關注此人?
你最喜歡的網絡小說還沒轉成有聲讀物?
我們先來看兩組數據:第六屆中國網絡文學論壇曾公布一組數據。2020年,全國網絡文學網站550多家,作家1750萬,網絡小說2500萬部;% 的音頻閱讀用戶希望提高音頻質量,分別比“減少 廣告 推送”和“豐富類別和內容”高 6.9% 和 8.5%。
也就是說,以現在的有聲閱讀產品形式,聽感還沒有過去,怎么才能增加產量呢?
現在在線閱讀平臺上有兩種聽力模式。一種是基于機器的,直接將文本從AI轉換為語音;另一個是基于人的,由 配音 演員錄制。前者可以改造所有小說,但缺乏情感,不夠生動,聽感有待提高;后者情感豐富,體驗更好,但成本高,數量有限。
那么,有沒有辦法將機器和人類的優勢結合起來,實現數量和質量的結合,最終達到省時、省錢、省事的目的呢?
近日,騰訊音視頻創作平臺盛卡發布了AI有聲小說配音功能。機器的低成本高效率與“人聲”的豐富情感和高品質在AI下融合,成為首個AI有聲小說制作平臺配音。
技術聲優時代即將到來。
1.效率趨勢
這兩天,李念(化名)在閑魚上整理了專業的錄音設備。
2018年大三時,他開始在沒有繁重的課業負擔的情況下開始在線創作。一方面在晉江平臺發布網絡作品,另一方面錄制相關的有聲小說。在言情小說圈,也算是小有名氣了。
一開始,他的精力集中在寫作上,后來又投入資金把宿舍改造成錄音房間。很快,李念就意識到了問題所在。麥克風、耳機、功放、監聽音箱……設備也不是全都到位,一共花了一萬多塊錢。他平時創作用的電腦,加上鼠標、機械鍵盤、外接曲面屏顯示器,一共不到8000元。
“錄制有聲小說的投入產出比很低。” 只是稍微貴了一點,李念忍了下來,但配音需要大量的練習和反復試驗,逐漸蠶食了他的寫作時間。能賺錢的人沒有時間,沒時間繼續賺錢的人。在這樣的困境中掙扎了四年,他還是放棄了。
配音門檻確實很高。在傳統的錄音場景中,配音人員是關鍵因素,錄音設備是必要條件。將兩種外部資源整合在一起后,人物分析、內容錄制、后期剪輯等全制作周期才能產出優質產品。工作。解決這些問題對于專業人士來說也是一個挑戰,更何況像李念這樣的“外人”。
而像李念這樣的內容創作者是有聲小說的重要來源之一。錄音昂貴的設備門檻高,制作周期長,讓無數參與者“停下來”,直接導致有聲小說的產出效率低下。在以配音員工為中心的生產模式下,增加產量的方法就是找更多的人,談何容易?
如果這么多人都找不到,這些問題能否通過技術手段在網絡空間虛擬化功能來解決?
此前,一些公司使用基于AI的TTS技術將文字文案轉換為語音文案,如科大訊飛、配音Wa、配音會員欄等應用,緩解了語音文字對<@的影響。配音 在一定程度上。@配音 成員的依賴降低了生產成本。但是,段落切分和主角識別的問題仍然需要大量的人力。
目前,騰訊在總結所有問題后給出了進一步的解決方案。
“技術手段確實提高了效率。” 接觸“音咖”后,李念體驗了各種功能?;诤笈_自動補全“AI配音”,他還可以手動調整停頓、語速和短語連續性配音合成,讓朗讀更加流暢自然,情緒更加飽滿。
借助這些功能,AI配音不再是過去字面上的“流水賬”,而是可以明確主線、區分角色、合理表達情緒的定制化流程。這為有聲讀物擺脫對人的高度依賴,告別輸出問題提供了很大的想象空間。
如此一來,在有聲書領域,有聲網咖正在卷起一股科技引領的效率化趨勢。
2.“729”已成為國家標準
只要有效率,所有問題都能解決嗎?不一定,這在廣播劇《三體》中得到了充分體現。
原著成功后,喜馬拉雅開始策劃制作廣播劇。一經推出,便受到不少原著愛好者的追捧。統計數據顯示,截至2021年年中,六季廣播劇《三體》播放量超過7070萬次,專輯訂閱人數超過227萬人。
《三體》廣播劇的成功,離不開原著的精彩故事,更離不開精心的幕后制作。制作人邀請了729聲音工作室參與制作。專業配音演員對劇情、人物、情感有著非常深刻的理解,并擁有高水準的演繹技巧,這是吸引用戶的關鍵。
然而,專業的背后,是整部劇的高昂制作成本和漫長的制作周期。幾千萬的投入,幾年的錄音,自然決定了音響產品的產量不會太高。優質的產品需要專業的配音人員打造,在較長時期內是不可替代的。
“聲音是一種觸覺,它幫助我們開辟了一個更性感的文學維度。” 正如北京大學中文系教授邵彥軍所說,用戶需要的不僅僅是“聲音填滿破碎的片時間”,更需要更高品質的聆聽體驗。
對于這個問題,語音咖啡也給出了解決方案。它采用跨說話者風格遷移技術形成多情感、多方言配音說話者音色模型配音合成,使用分層 VAE(自動、變分編碼器)信息對 語音 中的韻律進行編碼,將音色和節奏信息,賦予聲音一個字符。
目前聲卡可以模擬幾十個小說配音成員,擁有豐富、磁性、溫柔、親切、成熟等不同的音質,會講東北話、陜西話、四川話等方言,天津方言等。表達喜、怒、悲、驚、懼、厭惡6種情緒。
熱門資訊