從歌詞中生成音符序列可能聽起來像是科幻小說的內容,但人工智能可能會把這變成普遍的現實。日前,在 Arxiv.org 上發表的一篇論文中,來自東京國立信息學研究所的研究人員描述了一種能夠從已學習音節和音符關系產生“歌詞調節”旋律的機器學習系統。
“來自歌詞的旋律生成一直是人工智能和音樂領域的一個具有挑戰性的研究問題,它能夠學習和發現有趣的歌詞和伴奏旋律之間的潛在關系。”該論文的共同作者寫道,“隨著現有歌詞和旋律數據集的發展以及AI,歌詞和旋律之間的音樂知識挖掘逐漸成為可能。”
正如研究人員解釋的那樣,音符有兩個音樂屬性:音高和持續時間。音高是聲音的感知屬性,其在頻率相關音階上通過高度或低度來組織音樂;而持續時間表示音調或音調被發聲的時間長度。
研究人員的AI系統使用對齊數據與長短期記憶(LSTM)網絡結。LSTM網絡是一種能夠學習長期依賴性的遞歸神經網絡,經過訓練,可以在音節和單詞級別學習聯合嵌入數學表示來捕捉歌詞的突出結構,隨著時間的推移就能學會在給出歌詞的同時預測旋律,同時考慮到歌詞和旋律之間的關系。
為了訓練它,該團隊編制了又12,197個MIDI文件組成的數據集,每個文件都配有歌詞和旋律對齊。在將語料庫分成訓練、驗證和測試并將它們嵌入模型之后,研究者進行了一系列測試以確定它預測的旋律與歌詞、MIDI、音符持續時間和休息持續時間順序對齊的程度。他們報告稱,他們所用的人工智能系統不僅“在各個方面”都超越了基線模型,而且與人類音樂的分布非常接近。
研究人員寫道:“音樂和人工智能中歌詞的旋律生成仍然未得到很好的探索。利用深度學習技術制作旋律是一個非常有趣的研究領域,旨在了解和輔助人類的音樂創作活動。”
如果該研究未來能夠有所進展,人工智能可能很快就會成為音樂家們的寶貴工具。今年7月,總部位于蒙特利爾的創業公司Landr籌集2600萬美元用于開發分析音樂風格的產品,以創建定制的音頻處理器,而今年早些時候,OpenAI和谷歌推出了利用音樂生成算法的在線創作工具。最近,索尼的研究人員研究了特定條件下的kick-drum軌道生成的機器學習模型。讓AI從事作曲甚至更廣泛的音樂工作,似乎很快就不屬于天方夜譚。
責任編輯:肖舒
特別聲明:本網登載內容出于更直觀傳遞信息之目的。該內容版權歸原作者所有,并不代表本網贊同其觀點和對其真實性負責。如該內容涉及任何第三方合法權利,請及時與ts@hxnews.com聯系或者請點擊右側投訴按鈕,我們會及時反饋并處理完畢。
- 微軟麻將AI來了!第一波人類高手已經被打爆2019-08-29
- 北斗高精度定位機器人指導練車,蒙眼也過科目二2019-08-28
- 微軟亞馬遜研發AI致命武器 或危及全球安全2019-08-23
- 最新科技前沿 頻道推薦
-
蔚來汽車將推出零首付購車,大幅提升優惠力度2019-09-02
- 進入圖片頻道最新圖文
- 進入視頻頻道最新視頻
- 一周熱點新聞


已有0人發表了評論