AI 下棋已經不稀奇了,Google 的這個 AI 成了一名“作曲家”
一個封閉的教室,充斥着雜亂的噪音,在教室前面的屏幕上,全都是一行行復雜的代碼,每枱筆記本電腦的揚聲器都發出嗶嗶的刺耳聲。
這些聲音讓人不禁想起了老式的音樂合成器,但這些聲音跟復古可沒有太大關係。
這些旋律、音調是由一個強大的神經網絡創造的,專家們希望通過這個神經網絡向音樂家們提供一些先進的、前端的作曲工具。他們甚至希望有一天,這些作曲工具能夠自己創作出音樂來。
這個教室是由兩個Google工程師Adam Roberts和Colin Raffel負責的,他們在迅速擴張的“Google大腦”人工智能實驗室裏從事着Magenta項目的研究。去年5月,Magenta項目在杜倫“Moogfest科技音樂節”上首度公開亮相。Magenta項目專注於機器理解、生成音樂能力的訓練,以及創造能夠進一步完善和補充人類創造力的工具。現在,距離Magenta公開已經近一年了,Roberts和Raffel再次回到Moogfest,介紹Magenta的使用方法及其運行方式,以便工程師和音樂家們對Magenta進行操作。Roberts和Raffel同時希望工程師和音樂家們能為這個開源項目貢獻更多代碼,並提出建設性的建議。
Roberts表示:“Magenta項目的目的是連接外部世界,特別是音樂創作者。從某種意義上來説,每個人多多少少都有一些藝術細胞,但是我們不會把自己當成藝術家,我們可能成為研究者和軟件工程師。”
一個與眾不同的旋鈕
這個研討會是Magenta工程師今年在“Moogfest科技音樂節”舉辦的數場活動中的一場,它主要是研究Magenta項目中MIDI音樂序列生成器的API。在為期四天的音樂科技節中,他們舉辦了幾場研討會,並向公眾展示了Magenta的最新播放界面的唱片樣本,比如基於網絡的NSynth“神經合成器”,這個合成器利用了神經網絡把現有的聲音混合,進而生成一個全新的聲音。
Roberts解釋説:“有了合成器,就意味着有了旋鈕和振盪器,我們就能夠通過合併聲音來創造一個新的聲音。這是一個完全不同的旋鈕”。
Magenta團隊在“Moogfest科技音樂節”上的頻繁亮相,不僅僅出於他們對科技和音樂的狂熱。這也是他們發展戰略中的關鍵一步。作為一個開源項目(代碼基礎可以在Github被檢索到的項目),Magenta需要軟件開發者對其代碼進行操作測試,然後針對其接入界面的設計提出建設性意見,從而推動這個項目不斷髮展和完善。“Moogfest科技音樂節”十分重視音樂與科技的融合,這一點吸引了大批Magenta的目標受眾。通過舉辦公眾研討會,Magenta希望有更多人安裝和使用他們的工具包,這樣他們才能根據用户的操作反饋不斷完善其功能。
這一類活動的開展有助於Google工程師改進項目。正如Roberts所説的,Magenta的用户界面並不是完美的,仍有很多地方需要打磨、改進。“我們必須承認,Magenta工具包現在還不是一個能讓所有用户任意操作的完美工具,它還有許多地方需要完善,用户自身也需要了解工具包的所有指令和使用方法。”
通過這樣的研討會,Roberts和Raffel在安裝Magenta所需工具包的過程中,對編碼器進行了一次測試。大部分的測試工作都是在命令行中的原始代碼中進行的,也經過了一些應用程序的操作,比如PureData。Magenta創建了像NSynth App這樣的用户接口界面,除此之外,Magenta編碼員還正在努力建立一個連接GoogleAI設施與音樂創作工具(如Ableton Live和Logic Pro)的橋樑。Magenta團隊的工作,在“學術研究模式”(他們的四篇研究性論文剛剛取得下一年“國際機器學習大會”的認可,這是一項不小的創舉。)和“建設模式”之間取得了平衡。因此,用户接口界面還需要一段時間打磨、完善。
看創新工作者使用人工智能
當所有人都開始安裝Magenta工具包、使用這個軟件時,Roberts和Raffel就會得到一些非常有價值的東西——建設性的意見和反饋。研討會的與會者都處於不同的技術能力水平上,他們能夠快速地識別出Magenta的使用缺陷。這些都是建設性的意見,是Google工程師從Github和其他網上社區都無法得到的意見。他們還能第一時間觀察到用户是如何使用代碼和接口的,有時候還能發現一些非常特別的使用方式。
“Moogfest音樂科技節”期間,Google工程師Colin Raffel在一次Magenta研討會上。[圖片來自:John Paul Titlow]
Roberts表示:“當你在創造某樣東西時,你心裏會產生一個關於這個東西利用方式的明確想法。所有音樂方面的發明的的發明者,對於他們的發明最初都有一個明確的目的,但是後來富有創造力的人們會超越發明者最初的想法,用一些不同的方式來利用這些發明。”
從去年5月份向公眾公開到現在,Magenta項目已經成長了很多。但是在宏偉的人工智能背景下,它還處於“嬰兒期”。Magenta可以自動生成一些新的聲音和短小的旋律,不過對於歌曲的更大結構的了解還不夠深入。這正是Magenta團隊在接下來將要着手解決的問題之一,團隊打算通過把學術性研究和創造性工具結合起來,進而解決這一問題。
“我認為這是一個非常有價值的挑戰——你能完全理解這個長期音樂結構嗎?就算你能夠理解這個音樂結構,那麼你能給人們提供一個操作這個音樂結構參數的工具嗎?”Roberts追問道。
假設一種情況,這個工具可能是“車庫樂隊”或Ableton的一個插件或按鈕,它能讓作曲家利用人工智能自動生成一些旋律,從而為他們的歌曲提供一些旋律結構的選擇。另一種情況可能是,一個經過良好訓練的神經網絡能夠創作出永不間斷的“可生音樂”——這一想法已經由音樂家Brian Eno通過“淺技術性”方式探究過了。類似這樣的預言和前景可能會讓藝術家們感到心寒,因為他們的存在可能會變得沒有意義了。但是Roberts和他的同事們堅持表示,他們的目的是創造一些能夠完善和補充人類創造力的工具,這些工具絕不會取代人類創造力。
機器的音樂創作之路還很長
GoogleMagenta團隊的領導Doug Eck表示:“我並不期望有一天人們會坐在扶手椅上聽着電腦創作的交響樂,但在將來人工智能一定會模仿和學習音樂演奏的社會性及協作性。”
Eck補充説:“如果你是一個音樂家,你需要與其他音樂家共同演奏一首曲子。你有一些能夠發揮其他音樂家作用的工具,但這並不代表你想要聽這個工具自己輸出的音樂。”
人工智能的發展節奏非常訊速,但即使如此,我們可能還需要幾年才能打造出音樂家的“插接式”合奏機器人。在這期間,Magenta項目要做的還有很多。Roberts承認,針對新手,他們會構建更加直觀的界面,編寫更清晰的、易於操作的代碼。他們還將繼續他們的音樂科技節巡迴展,甚至把Magenta工具帶到六月份巴塞羅那的“聲納音樂節”上。
因此,他們也迫切地需要更多的數據,單靠這些研討會和唱片樣本是沒有辦法完成底層機器學習模型的訓練的,至少不能直接對模型進行訓練。所以説,Magenta需要更多關於音樂的原始數據。Roberts提出的關於訓練機器,讓機器理解和創作更長的歌曲結構的想法,需要大量書面的音樂史知識。Google早期的人工智能藝術實驗,比如“ Deep Dream圖像生成器”的完成是相對容易的,因為網上有大量的圖像數據可供使用。而音樂不同,它是一個比二維圖片複雜得多的媒體形式,因此找到有意義的、並且機器可讀的數據非常困難。
參與大會和音樂科技節的另一個好處是,你能夠從中獲取潛在的數據源。在“Moogfest科技音樂節”上,有些人是創建了MIDI數據庫的,還有些人找到了編譯和播放音樂相關數據的有效方法。Roberts指出,研究者們都絞盡腦汁,希望找到人與Google的“人工音樂大腦”合作的方法。
Roberts表示:“這種類型的交流和談話能讓我們獲得更多的數據,但這必定是一個內部和外部的協助項目,所以,這樣的交流非常必要的。”
注:本文由「圖普科技」編譯,您可以關注微信公眾號tuputech,體驗基於深度學習的「圖像識別」應用。
資料來源:36Kr
這些聲音讓人不禁想起了老式的音樂合成器,但這些聲音跟復古可沒有太大關係。
這些旋律、音調是由一個強大的神經網絡創造的,專家們希望通過這個神經網絡向音樂家們提供一些先進的、前端的作曲工具。他們甚至希望有一天,這些作曲工具能夠自己創作出音樂來。
這個教室是由兩個Google工程師Adam Roberts和Colin Raffel負責的,他們在迅速擴張的“Google大腦”人工智能實驗室裏從事着Magenta項目的研究。去年5月,Magenta項目在杜倫“Moogfest科技音樂節”上首度公開亮相。Magenta項目專注於機器理解、生成音樂能力的訓練,以及創造能夠進一步完善和補充人類創造力的工具。現在,距離Magenta公開已經近一年了,Roberts和Raffel再次回到Moogfest,介紹Magenta的使用方法及其運行方式,以便工程師和音樂家們對Magenta進行操作。Roberts和Raffel同時希望工程師和音樂家們能為這個開源項目貢獻更多代碼,並提出建設性的建議。
Roberts表示:“Magenta項目的目的是連接外部世界,特別是音樂創作者。從某種意義上來説,每個人多多少少都有一些藝術細胞,但是我們不會把自己當成藝術家,我們可能成為研究者和軟件工程師。”
一個與眾不同的旋鈕
這個研討會是Magenta工程師今年在“Moogfest科技音樂節”舉辦的數場活動中的一場,它主要是研究Magenta項目中MIDI音樂序列生成器的API。在為期四天的音樂科技節中,他們舉辦了幾場研討會,並向公眾展示了Magenta的最新播放界面的唱片樣本,比如基於網絡的NSynth“神經合成器”,這個合成器利用了神經網絡把現有的聲音混合,進而生成一個全新的聲音。
Roberts解釋説:“有了合成器,就意味着有了旋鈕和振盪器,我們就能夠通過合併聲音來創造一個新的聲音。這是一個完全不同的旋鈕”。
Magenta團隊在“Moogfest科技音樂節”上的頻繁亮相,不僅僅出於他們對科技和音樂的狂熱。這也是他們發展戰略中的關鍵一步。作為一個開源項目(代碼基礎可以在Github被檢索到的項目),Magenta需要軟件開發者對其代碼進行操作測試,然後針對其接入界面的設計提出建設性意見,從而推動這個項目不斷髮展和完善。“Moogfest科技音樂節”十分重視音樂與科技的融合,這一點吸引了大批Magenta的目標受眾。通過舉辦公眾研討會,Magenta希望有更多人安裝和使用他們的工具包,這樣他們才能根據用户的操作反饋不斷完善其功能。
這一類活動的開展有助於Google工程師改進項目。正如Roberts所説的,Magenta的用户界面並不是完美的,仍有很多地方需要打磨、改進。“我們必須承認,Magenta工具包現在還不是一個能讓所有用户任意操作的完美工具,它還有許多地方需要完善,用户自身也需要了解工具包的所有指令和使用方法。”
通過這樣的研討會,Roberts和Raffel在安裝Magenta所需工具包的過程中,對編碼器進行了一次測試。大部分的測試工作都是在命令行中的原始代碼中進行的,也經過了一些應用程序的操作,比如PureData。Magenta創建了像NSynth App這樣的用户接口界面,除此之外,Magenta編碼員還正在努力建立一個連接GoogleAI設施與音樂創作工具(如Ableton Live和Logic Pro)的橋樑。Magenta團隊的工作,在“學術研究模式”(他們的四篇研究性論文剛剛取得下一年“國際機器學習大會”的認可,這是一項不小的創舉。)和“建設模式”之間取得了平衡。因此,用户接口界面還需要一段時間打磨、完善。
看創新工作者使用人工智能
當所有人都開始安裝Magenta工具包、使用這個軟件時,Roberts和Raffel就會得到一些非常有價值的東西——建設性的意見和反饋。研討會的與會者都處於不同的技術能力水平上,他們能夠快速地識別出Magenta的使用缺陷。這些都是建設性的意見,是Google工程師從Github和其他網上社區都無法得到的意見。他們還能第一時間觀察到用户是如何使用代碼和接口的,有時候還能發現一些非常特別的使用方式。
“Moogfest音樂科技節”期間,Google工程師Colin Raffel在一次Magenta研討會上。[圖片來自:John Paul Titlow]
Roberts表示:“當你在創造某樣東西時,你心裏會產生一個關於這個東西利用方式的明確想法。所有音樂方面的發明的的發明者,對於他們的發明最初都有一個明確的目的,但是後來富有創造力的人們會超越發明者最初的想法,用一些不同的方式來利用這些發明。”
從去年5月份向公眾公開到現在,Magenta項目已經成長了很多。但是在宏偉的人工智能背景下,它還處於“嬰兒期”。Magenta可以自動生成一些新的聲音和短小的旋律,不過對於歌曲的更大結構的了解還不夠深入。這正是Magenta團隊在接下來將要着手解決的問題之一,團隊打算通過把學術性研究和創造性工具結合起來,進而解決這一問題。
“我認為這是一個非常有價值的挑戰——你能完全理解這個長期音樂結構嗎?就算你能夠理解這個音樂結構,那麼你能給人們提供一個操作這個音樂結構參數的工具嗎?”Roberts追問道。
假設一種情況,這個工具可能是“車庫樂隊”或Ableton的一個插件或按鈕,它能讓作曲家利用人工智能自動生成一些旋律,從而為他們的歌曲提供一些旋律結構的選擇。另一種情況可能是,一個經過良好訓練的神經網絡能夠創作出永不間斷的“可生音樂”——這一想法已經由音樂家Brian Eno通過“淺技術性”方式探究過了。類似這樣的預言和前景可能會讓藝術家們感到心寒,因為他們的存在可能會變得沒有意義了。但是Roberts和他的同事們堅持表示,他們的目的是創造一些能夠完善和補充人類創造力的工具,這些工具絕不會取代人類創造力。
機器的音樂創作之路還很長
GoogleMagenta團隊的領導Doug Eck表示:“我並不期望有一天人們會坐在扶手椅上聽着電腦創作的交響樂,但在將來人工智能一定會模仿和學習音樂演奏的社會性及協作性。”
Eck補充説:“如果你是一個音樂家,你需要與其他音樂家共同演奏一首曲子。你有一些能夠發揮其他音樂家作用的工具,但這並不代表你想要聽這個工具自己輸出的音樂。”
人工智能的發展節奏非常訊速,但即使如此,我們可能還需要幾年才能打造出音樂家的“插接式”合奏機器人。在這期間,Magenta項目要做的還有很多。Roberts承認,針對新手,他們會構建更加直觀的界面,編寫更清晰的、易於操作的代碼。他們還將繼續他們的音樂科技節巡迴展,甚至把Magenta工具帶到六月份巴塞羅那的“聲納音樂節”上。
因此,他們也迫切地需要更多的數據,單靠這些研討會和唱片樣本是沒有辦法完成底層機器學習模型的訓練的,至少不能直接對模型進行訓練。所以説,Magenta需要更多關於音樂的原始數據。Roberts提出的關於訓練機器,讓機器理解和創作更長的歌曲結構的想法,需要大量書面的音樂史知識。Google早期的人工智能藝術實驗,比如“ Deep Dream圖像生成器”的完成是相對容易的,因為網上有大量的圖像數據可供使用。而音樂不同,它是一個比二維圖片複雜得多的媒體形式,因此找到有意義的、並且機器可讀的數據非常困難。
參與大會和音樂科技節的另一個好處是,你能夠從中獲取潛在的數據源。在“Moogfest科技音樂節”上,有些人是創建了MIDI數據庫的,還有些人找到了編譯和播放音樂相關數據的有效方法。Roberts指出,研究者們都絞盡腦汁,希望找到人與Google的“人工音樂大腦”合作的方法。
Roberts表示:“這種類型的交流和談話能讓我們獲得更多的數據,但這必定是一個內部和外部的協助項目,所以,這樣的交流非常必要的。”
注:本文由「圖普科技」編譯,您可以關注微信公眾號tuputech,體驗基於深度學習的「圖像識別」應用。
資料來源:36Kr