隨著科技的發展,人聲克隆也是一個爭議的熱點。因為我們知道,克隆是一件需要嚴肅對待的事情。當初我們克隆出了第一只小羊,克隆人類的討論也隨之而起。甚至有人擔心,如果克隆出了聲音,那么詐騙集團有可能會有所利用,保護隱私也就變得更為的重要。那么,當下是否有克隆聲音的軟件呢?同時,科技的發展可以做到克隆聲音了嗎?今天,小編為大家整理了一些關于ai人聲克隆軟件的內容,一起看看吧!
隨著科技的發展,人聲克隆也是一個爭議的熱點。因為我們知道,克隆是一件需要嚴肅對待的事情。當初我們克隆出了第一只小羊,克隆人類的討論也隨之而起。甚至有人擔心,如果克隆出了聲音,那么詐騙集團有可能會有所利用,保護隱私也就變得更為的重要。那么,當下是否有克隆聲音的軟件呢?同時,科技的發展可以做到克隆聲音了嗎?今天,小編為大家整理了一些關于ai人聲克隆軟件的內容,一起看看吧!
一、ai人聲克隆軟件
初音
軟件使抄用了Yamaha的VOCALOID2語音合成引擎,把初音未來人類的聲音錄音并合成為酷似真正的歌聲。
只需輸入音調、歌詞則可發出聲音,亦可以調整震音、音速等的“感情參數”,最多能夠16人合唱,亦支援即時演奏、對應ReWire。制作完成后會以WAV格式輸出,但軟件本身只可做出歌唱部分,伴奏音聲需要使用其他音樂軟件合成。歌詞輸入能辨認平假名、片假zhidao名和羅馬字,但不能辨認は、へ作為助詞和う、い作為長音時會分別轉為わ、え、お、え的發音,亦不能對應促音、漢字,需要自行修改。
二、ai克隆聲音
僅需3.7秒的音頻,中國科技巨頭百度開發的一種新的AI算法就可以克隆出一種非常可信的虛假聲音。就像機器學習軟件的迅速發展一樣,這種軟件可以使虛擬視頻的制作民主化,這項研究表明為什么越來越難相信互聯網上的任何媒體。
這家科技巨頭的研究人員在Deep Voice發布了他們的最新進展,Deep Voice是一個為聲音克隆開發的系統。一年前,該技術需要大約30分鐘的音頻來創建新的假音頻片段。現在,只需幾秒鐘的培訓材料,它可以創造出更好的結果。
百度近日宣布,百度開發的新 AI 算法Deep Voice可以通過3.7秒鐘的錄音樣本數據就能完美的克隆出一個人的聲音。
Deep Voice是百度AI研究院一個由深度神經網絡構建的高質量語音轉(TTS )系統。該系統不僅提高的模擬的時間,百度還優化了它出錯的概率。甚至還在一個單GPU服務器上,把推斷規模提高到到每天1000萬次以上。
自適應說話人編碼方法在訓練、克隆和音頻生成中的應用。
Deep Voice最早是在2017年的年初發布了第一版,初版的系統就能模擬初簡短的句子,而且說起話來幾乎無法區分和真人的區別。但是該系統一次只能模擬一個人的聲音,而且需要好幾個小時的學習才能克隆成功。但是最新發布的成功已經縮短到3.7秒,并且能將女性聲音轉變成男性,英式聲音變成美式。
模擬器編碼器結構
百度研究院的研究人員在預印本網站 arxiv 上的發表了其 Deep Voice 系統的最新進展《Neural Voice Cloning with a Few Samples》。除了利用少量樣本克隆聲音外,系統還能將女性聲音轉變成男性,英式聲音變成美式。百度研究人員表示,這項研究可應用于人機交互的個性化方面。
三、克隆人聲語音系統
科技日報北京5月3日電 (記者聶翠蓉)據《科學美國人》雜志網站2日報道,加拿大新創公司琴鳥(Lyrebird)發布了新款人工智能(AI)語音系統,其能通過分析講話錄音和對應文本以及兩者之間的關聯,在1分鐘內模仿人類“講話”,比如,模仿特朗普、奧巴馬和希拉里三個人的聲音展開一段對話。
讓聲音聽起來更自然,是計算機程序在將文字轉換成語音過程中面臨的核心挑戰,即使目前最好的語音助手,如蘋果公司的Siri和亞馬遜公司的Alexa,一發聲給人的第一感覺仍然是,“哇!這是計算機。”背后原因在于這些語音助手系統的工作原理:根據預錄的聲音文檔整理出詞匯,再通過另一個新的音頻文檔將這些詞匯拼湊在一起發聲。
而琴鳥公司的AI使用了一種全新的語音合成系統,能在“傾聽”過程中“掌握”每個人說話時字母、音位和單詞的發音特點,通過推理并模仿這個人聲音中的情感和語調,“說”出全新的語句。
新系統使用模仿人腦思維的算法創建出一種人工神經網絡,能利用深度學習技術將所聽到的轉換成語音,并僅靠任何人1分鐘講話內容,就能完全模仿這個人說話。其市場前景非常廣闊,可用來改進個人人工智能助手、音頻書籍以及殘疾人語音系統等。
開發該系統的蒙特利爾大學學習算法實驗室博士后亞歷山大·布瑞比森表示,在學會并模仿了幾個人的聲音后,再模仿任何一個新對象的語音就會變得更快,因此新語音系統不需太多信息,1分鐘足以捕獲某個人聲音的核心特點。
但美國卡內基梅隆大學語言技術研究所教授迪莫·鮑曼表示,琴鳥的語音系統和真正的人聲之間還有差距。“我仔細聽過琴鳥系統的發聲,其帶有背景噪音,以及微弱的機器人特征。而且,它還不能模仿人們在講話中的呼吸和唇部運動,因此仍然能聽出其計算機語音特征。”鮑曼說。他認為,語音系統真正令人信服地復制人聲,還需再等幾年。
以上就是小編為大家整理的關于ai克隆聲音的相關內容了,不知道大家是否有所收獲呢!其實,當下,人聲克隆的探索空間還是比較大的,不過比較成熟的是模擬人聲聲音生成器,感興趣的小伙伴也可以了解一下喲!期待在不久之后,我們能夠使用到更多的科技軟件,讓媒體行業向前邁步。
該內容為非商業目的的轉載分享,不代表本站觀點,本文版權屬其著作權人所有。若侵犯了您的正當權益,請立即聯系我們刪除。
閃電配音
免費試音
幫我推薦
價格計算
在線下單
開具發票
不招主播
全網全品類皆可配 頂配好聲音
關注【客服微信】
聽最新案例,新客禮包等你拿!
提交成功
試音顧問將在工作日半小時內聯系您,請準備試音文稿或參考音頻加速匹配
你也可以注冊,可自助下單挑選主播,在線接單配音。(7 X 24小時主播接單)