AI+音樂(lè)|對(duì)話 Suno CEO:破圈的音樂(lè)生成產(chǎn)品是如何誕生的?

1 評(píng)論 5418 瀏覽 9 收藏 17 分鐘

最近,Suno 隨著 V3 的發(fā)布迎來(lái)了破圈,那么這款音樂(lè)生成產(chǎn)品,是如何誕生的?這篇文章里,作者對(duì) Suno 誕生的背景、Suno 的創(chuàng)作方式等方面做了解讀,我們不妨來(lái)看一下。

最近,音樂(lè)生成產(chǎn)品 Suno 隨著 V3 的發(fā)布迎來(lái)了破圈。這款產(chǎn)品的第一次發(fā)布是在去年 12 月 20 日,在第一時(shí)間體驗(yàn)了產(chǎn)品之后我們看到音樂(lè)創(chuàng)作和消費(fèi)有望隨著創(chuàng)作門檻的極大降低而成為消費(fèi)級(jí)產(chǎn)品的內(nèi)容形態(tài),于是我們發(fā)表了第一篇 Suno 的研究文章。

近日我們進(jìn)一步整理了 Suno CEO:Mikey Shulman 的最新訪談和滾石雜志的報(bào)道,關(guān)于 Suno 誕生的背景、音樂(lè)創(chuàng)作的方式與消費(fèi)的可能性。

Sense 思考:

我們嘗試基于文章內(nèi)容,提出更多發(fā)散性的推演和深思,歡迎交流。

Suno AI通過(guò)結(jié)合人工智能技術(shù)與音樂(lè)創(chuàng)作,為用戶提供了一個(gè)全新的音樂(lè)創(chuàng)作平臺(tái)。這種技術(shù)的應(yīng)用不僅降低了音樂(lè)制作的門檻,還為音樂(lè)愛(ài)好者和專業(yè)人士提供了新的創(chuàng)作工具,從而推動(dòng)了音樂(lè)創(chuàng)作的民主化。

Suno AI 可以作為一個(gè)教育工具,幫助學(xué)習(xí)者理解音樂(lè)結(jié)構(gòu)和創(chuàng)作過(guò)程。通過(guò)實(shí)踐操作,學(xué)習(xí)者可以更快地掌握音樂(lè)創(chuàng)作的技巧,這可能會(huì)改變傳統(tǒng)的音樂(lè)教育模式。

Suno AI 等工具的出現(xiàn)可能會(huì)改變音樂(lè)產(chǎn)業(yè)的運(yùn)作方式。從音樂(lè)制作到分發(fā),AI 技術(shù)的應(yīng)用可能會(huì)導(dǎo)致新的商業(yè)模式和服務(wù)的出現(xiàn),從而影響音樂(lè)創(chuàng)作者、發(fā)行商和消費(fèi)者的互動(dòng)。

AI Native 產(chǎn)品分析——Suno

1.產(chǎn)品:Suno

2. 創(chuàng)立時(shí)間:2022 年

3. 創(chuàng)始團(tuán)隊(duì)

Mikey Shulman:擔(dān)任首席執(zhí)行官,他曾擔(dān)任Kensho的機(jī)器學(xué)習(xí)主管,麻省理工學(xué)院斯隆管理學(xué)院的講師,哥倫比亞大學(xué)應(yīng)用物理專業(yè)的學(xué)士學(xué)位和哈佛大學(xué)物理學(xué)專業(yè)的博士學(xué)位;

Camachoeorg Kucsko:Kensho Technologies的首席構(gòu)架師,在哈佛大學(xué)畢業(yè)后加入Suno團(tuán)隊(duì)。

4. 產(chǎn)品簡(jiǎn)介:

Suno AI是一款由麻省理工團(tuán)隊(duì)開(kāi)發(fā)的強(qiáng)大人工智能音樂(lè)生成器。用戶可以通過(guò)簡(jiǎn)單的文本提示進(jìn)行創(chuàng)作,生成多種音樂(lè)風(fēng)格的高質(zhì)量音樂(lè)和語(yǔ)音。

5. 融資情況

2023年:Suno.ai進(jìn)行了種子輪融資,融資金額達(dá)到140萬(wàn)美元;

一、創(chuàng)始人背景與音樂(lè)之路

Suno,一款開(kāi)創(chuàng)性的AI音樂(lè)創(chuàng)作工具,在迅速增長(zhǎng)的人工智能音樂(lè)生成器領(lǐng)域中脫穎而出。與主要關(guān)注器樂(lè)作品的傳統(tǒng)工具不同,Suno的獨(dú)特之處在于它能夠創(chuàng)作包含歌詞和人聲的完整歌曲。這一獨(dú)特技能讓Suno與Google的MusicFX以及Meta的AudioGen等競(jìng)爭(zhēng)者顯著區(qū)別開(kāi)來(lái)。

Suno由一支專門從事AI和機(jī)器學(xué)習(xí)的專家團(tuán)隊(duì)創(chuàng)立,他們之前在Kensho Technologies工作過(guò),Suno旨在使音樂(lè)創(chuàng)作民主化。包括擁有哈佛物理學(xué)博士學(xué)位的Mikey Shulman在內(nèi)的創(chuàng)始人都是音樂(lè)家,他們將Suno視為解決音樂(lè)聽(tīng)眾與創(chuàng)作者之間數(shù)量不平衡的工具。他們的愿景是讓全球十億人能夠使用Suno發(fā)揮自己潛在的音樂(lè)才能,提供一個(gè)大家都可以簡(jiǎn)單使用的歌曲創(chuàng)作平臺(tái)。

Mikey Schulman是Suno的CEO聯(lián)合創(chuàng)始人之一,在一次訪談中Schulman回顧了自己的音樂(lè)之路。

他從學(xué)習(xí)了多種樂(lè)器,并在高中和大學(xué)期間在紐約的一些小型俱樂(lè)部里演奏貝斯。盡管演出并不總是那么成功,但與人們一起制作音樂(lè)的過(guò)程充滿了樂(lè)趣。

Mikey:“音樂(lè)一直是我生活中很重要的一部分。我從小學(xué)習(xí)小提琴和吉他,大學(xué)時(shí)組建了一支樂(lè)隊(duì)?!?/p>

后來(lái),Mikey在哈佛大學(xué)學(xué)習(xí)物理,但他的職業(yè)生涯最終轉(zhuǎn)向了人工智能和機(jī)器學(xué)習(xí)領(lǐng)域。

Mikey:“雖然我學(xué)的是物理,但音樂(lè)始終是我的激情所在,我錄過(guò)一張EP。作為業(yè)余音樂(lè)人,錄音棚工作比現(xiàn)場(chǎng)演出要枯燥得多。我記得有一次錄音時(shí)因?yàn)椴恍⌒膹囊巫由匣聛?lái),導(dǎo)致一個(gè)很棒的錄音報(bào)廢,不得不重新錄。這種事在現(xiàn)場(chǎng)演出時(shí)絕對(duì)不會(huì)發(fā)生?!?/p>

Mikey研究生畢業(yè)后,就在Kensho Technologies工作,該公司后來(lái)被S&P Global收購(gòu)。

Mikey:“我在讀研究生的最后一年,剛好認(rèn)識(shí)了 Keno 的一些人,其中一位 Martin 現(xiàn)在是我的聯(lián)合創(chuàng)始人。一次午餐時(shí)他們問(wèn)我什么時(shí)候去面試,我說(shuō)我是學(xué)生,隨時(shí)都行。結(jié)果他們說(shuō)那現(xiàn)在就去吧,我就跟著上樓面試了。雖然面得很糟糕,但他們還是決定給我一個(gè)機(jī)會(huì)?!?/p>

在Kensho,Mikey和他的團(tuán)隊(duì)成員開(kāi)始探索音頻AI的可能性。Mikey和他的團(tuán)隊(duì)在Kensho進(jìn)行的一項(xiàng)關(guān)于語(yǔ)音轉(zhuǎn)寫的項(xiàng)目,讓他們對(duì)音頻AI產(chǎn)生了濃厚的興趣。盡管這個(gè)項(xiàng)目專注于財(cái)經(jīng)領(lǐng)域,但他們認(rèn)識(shí)到音頻AI在更廣泛的音樂(lè)創(chuàng)作領(lǐng)域內(nèi)的潛力。

Mikey:“Keno 主要是利用 NLP 和機(jī)器學(xué)習(xí)處理大量金融文檔,2018年被標(biāo)普全球收購(gòu)。收購(gòu)后我們獲得了大量的金融文檔數(shù)據(jù),簡(jiǎn)直是夢(mèng)想成真。我們還做了一個(gè)語(yǔ)音項(xiàng)目,就是將上市公司的財(cái)報(bào)電話會(huì)議實(shí)時(shí)轉(zhuǎn)錄成文字。這是 Keno 第一次涉足音頻 AI 領(lǐng)域。我們發(fā)現(xiàn),如果擁有幾十年積累的高質(zhì)量轉(zhuǎn)錄數(shù)據(jù),再加上機(jī)器學(xué)習(xí)算法,就可以大幅提升準(zhǔn)確率,遠(yuǎn)超市面上的語(yǔ)音轉(zhuǎn)文字服務(wù)。”

Mikey和他的合作伙伴意識(shí)到,在金融服務(wù)公司追求音頻AI可能并不合適。他們認(rèn)為有更大的機(jī)會(huì)在音樂(lè)創(chuàng)作方面利用AI技術(shù)。Mikey特別指出,盡管最初他們沒(méi)有確定產(chǎn)品的具體形式,但他們知道這個(gè)方向充滿了機(jī)遇和挑戰(zhàn)。

Mikey:“Keno 主要還是做文本方面的項(xiàng)目。這個(gè)音頻項(xiàng)目是在被收購(gòu)一年后開(kāi)始做的。雖然金融領(lǐng)域確實(shí)有很多音頻方面值得探索的地方,但我認(rèn)為音頻 AI 在金融之外有更廣闊的應(yīng)用空間。另外金融行業(yè)出于風(fēng)險(xiǎn)考慮,在創(chuàng)新方面會(huì)相對(duì)保守一些。文本領(lǐng)域有太多有趣的項(xiàng)目值得投入,很難分散精力去做音頻?!?/p>

Suno團(tuán)隊(duì)早期的一個(gè)重要里程碑是發(fā)布了一個(gè)名為”Bark”的開(kāi)源文本到語(yǔ)音項(xiàng)目。這個(gè)項(xiàng)目受到了社區(qū)的廣泛關(guān)注,他們發(fā)現(xiàn)人們最感興趣的是音樂(lè)生成,而不僅僅是文本到語(yǔ)音。他們發(fā)現(xiàn),盡管人們?cè)噲D使用Bark生成音樂(lè),但這并不是訓(xùn)練該模型的初衷。但正是這一點(diǎn)激勵(lì)了他們更進(jìn)一步發(fā)展Suno,專注于音樂(lè)生成。

Mikey:“我們仔細(xì)評(píng)估了音頻領(lǐng)域的各種機(jī)會(huì),發(fā)現(xiàn)大部分人并不喜歡處理音頻數(shù)據(jù),可能這就是我們的特別之處,我們是真的很喜歡音頻(笑)。我們一開(kāi)始就決定要走 foundation model 的路線,因?yàn)閺拈L(zhǎng)遠(yuǎn)來(lái)看,這是最有前途的方向,雖然當(dāng)時(shí)業(yè)界幾乎沒(méi)有用 transformer 做音頻的先例。說(shuō)實(shí)話,剛離開(kāi) Keno 時(shí),我們還沒(méi)完全確定是要做語(yǔ)音還是音樂(lè)。畢竟我們?cè)谡Z(yǔ)音領(lǐng)域有更多經(jīng)驗(yàn),也有不少人勸我們說(shuō)語(yǔ)音市場(chǎng)更大,不要去做音樂(lè)。

但有兩件事改變了我們的想法:

1.作為音樂(lè)愛(ài)好者,我們還是忍不住要去嘗試音樂(lè);

2.我們開(kāi)源了一個(gè)叫 bark 的語(yǔ)音模型后,在 GitHub 上獲得了很多關(guān)注。通過(guò)一個(gè)調(diào)查表單,我們發(fā)現(xiàn)用戶最感興趣的領(lǐng)域其實(shí)是音樂(lè),而不是語(yǔ)音?!?/p>

Mikey希望讓Suno重新定義音樂(lè)的創(chuàng)作和消費(fèi)體驗(yàn),無(wú)論你是音樂(lè)專業(yè)人士,還是從未嘗試過(guò)創(chuàng)作的普通用戶,Sunno都希望成為你表達(dá)內(nèi)心情感、講述生活故事的全新方式。

Mikey:“我們的目標(biāo)就是讓每個(gè)人都能將腦海中的音樂(lè)靈感,通過(guò)簡(jiǎn)單易用的工具,轉(zhuǎn)化為實(shí)際的音樂(lè)作品。無(wú)論你是音樂(lè)專業(yè)人士,還是從未嘗試過(guò)創(chuàng)作的普通用戶,Suno都希望成為你表達(dá)內(nèi)心情感、講述生活故事的全新方式。未來(lái),我們還計(jì)劃探索更多有趣的人機(jī)交互方式。比如也許你可以哼唱一段旋律,模型就能以此為靈感,生成一首完整的歌曲;又或者你可以上傳一些圖片或視頻,講述你的生活片段,模型就能據(jù)此創(chuàng)作出與之相匹配的背景音樂(lè)。我們希望充分利用AI的能力,激發(fā)人們的創(chuàng)造力,讓音樂(lè)創(chuàng)作成為一種全新的生活方式。當(dāng)然,我們也深知音樂(lè)行業(yè)對(duì)知識(shí)產(chǎn)權(quán)的重視。Sunno致力于以合法合規(guī)的方式發(fā)展音樂(lè)AI。我們訓(xùn)練模型時(shí)只使用了無(wú)版權(quán)問(wèn)題的音樂(lè)數(shù)據(jù)。生成的歌曲也經(jīng)過(guò)了仔細(xì)地過(guò)濾,確保不會(huì)侵犯任何藝術(shù)家的權(quán)益。用戶創(chuàng)作的歌曲,其版權(quán)將完全由用戶自己所有。我們的目標(biāo)是成為連接音樂(lè)人和AI的橋梁,讓雙方都能從這項(xiàng)技術(shù)中受益,而不是相互取代?!?/p>

二、Suno的創(chuàng)作方式

Suno的獨(dú)特之處在于它不僅生成音樂(lè)的旋律和伴奏,還能創(chuàng)作歌詞和人聲。這意味著它可以產(chǎn)生完整的歌曲,包括所有必要的音樂(lè)元素。它的音樂(lè)元素甚至包含了不同種語(yǔ)言,甚至是方言,粵語(yǔ),四川話的音樂(lè)都可以生成。

使用Suno的時(shí)候,用戶可以選擇兩種模式。

  1. 基礎(chǔ)模式:用戶提供一個(gè)AI風(fēng)格的文本提示,并可以選擇讓歌曲保持純樂(lè)器,無(wú)歌詞的演奏。
  2. 自定義模式:用戶可以使用自己的歌詞,設(shè)置多種流派風(fēng)格的音樂(lè),并給主動(dòng)給歌曲命名。

用戶使用Suno的創(chuàng)作流程很簡(jiǎn)單,當(dāng)用戶使用Suno時(shí),用戶首先選擇生成模式(基礎(chǔ)或自定義),然后輸入相關(guān)的提示信息,如歌曲的主題、風(fēng)格或特定的歌詞。Suno利用這些輸入生成一首完整的歌曲,并提供音軌供用戶試聽(tīng),同時(shí)提供歌詞和代表歌曲主題的圖片。

Suno以端到端的方式生成歌曲,意味著歌曲的人聲、樂(lè)器和其他所有部分都是一次性生成的,并且使Suno能夠創(chuàng)建歌詞和人聲的決定大大增加了模型訓(xùn)練的復(fù)雜性。這需要Suno的創(chuàng)始團(tuán)隊(duì)投入大量的努力,以確保模型能理解和生成人類的歌聲和歌詞。

在Suno最新的版本v3中引入了更多自然 sounding 和較少 auto-tune 樣式的人聲,以及為用戶提供對(duì)創(chuàng)作過(guò)程更細(xì)致控制的新功能。例如,用戶可以鎖定他們喜歡的歌曲部分并重新生成不符合預(yù)期的部分。

三、Suno的創(chuàng)作意義

Suno提供了一條讓人們可以用文本探索音樂(lè)的道路,讓任何人都可以享受制作音樂(lè)的樂(lè)趣,無(wú)論創(chuàng)作者是否有音樂(lè)背景。Suno希望賦能更多人將內(nèi)心的旋律轉(zhuǎn)化為現(xiàn)實(shí),讓音樂(lè)創(chuàng)作不再局限于專業(yè)音樂(lè)人。

Suno不僅關(guān)注于如何以新的方式創(chuàng)作音樂(lè),也致力于探索如何以新的方式體驗(yàn)和分享音樂(lè)。Suno的出現(xiàn)可能預(yù)示著音樂(lè)消費(fèi)和分享方式的變革,其中音樂(lè)不再僅僅是被動(dòng)消費(fèi)的對(duì)象,而是可以根據(jù)聽(tīng)眾的具體情感和需求動(dòng)態(tài)生成的體驗(yàn)。

Suno通過(guò)使音樂(lè)創(chuàng)作更加普及和個(gè)性化,有可能改變?nèi)藗兣c音樂(lè)的關(guān)系,促進(jìn)音樂(lè)作為一種表達(dá)和溝通方式的發(fā)展。這種自然語(yǔ)言創(chuàng)造音樂(lè)的分享方式將會(huì)產(chǎn)生一種新的社交模式——音樂(lè)社交。

音樂(lè)社交不僅僅是關(guān)于分享音樂(lè)本身,它還是一種新的互動(dòng)方式,讓人們可以通過(guò)音樂(lè)來(lái)連接和理解彼此。在這個(gè)平臺(tái)上,用戶不僅可以發(fā)布自己的音樂(lè)作品,還可以發(fā)現(xiàn)來(lái)自世界各地的創(chuàng)作者和他們的作品,從而激發(fā)新的靈感和創(chuàng)意。這種跨文化的交流和合作將推動(dòng)音樂(lè)的創(chuàng)新,使其成為一種真正全球化的語(yǔ)言。

隨著Suno社區(qū)的不斷壯大,我們也將看到更多基于音樂(lè)的社交活動(dòng)和事件的出現(xiàn)。從在線音樂(lè)會(huì)到創(chuàng)作工作坊,Suno為用戶提供了一個(gè)平臺(tái),讓他們可以共同參與和享受音樂(lè)的樂(lè)趣。這不僅加深了社區(qū)成員之間的聯(lián)系,也為音樂(lè)愛(ài)好者帶來(lái)了全新的體驗(yàn)和機(jī)會(huì)。

參考材料:

https://www.tomsguide.com/ai/i-tried-the-radio-quality-suno-ai-music-generator-heres-how-it-sounds

https://www.rollingstone.com/music/music-features/suno-ai-chatgpt-for-music-1234982307/

https://gosummarize.com/youtube/@lightspeedvp/mikey-shulman-suno-and-the-sound-of-ai-music

編譯:Evan;編輯:Vela

來(lái)源公眾號(hào):深思SenseAI;關(guān)注全球 AI 前沿,走進(jìn)科技創(chuàng)業(yè)公司,提供產(chǎn)業(yè)多維深思。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @深思SenseAI 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. Suno所開(kāi)創(chuàng)的音樂(lè)創(chuàng)作與分享模式是一場(chǎng)深刻的變革,它讓音樂(lè)變得更加親民、更加多元、更加具有創(chuàng)新性。我為能夠見(jiàn)證和參與這一變革而感到興奮和自豪。

    來(lái)自廣東 回復(fù)