AI繪畫工具M(jìn)idjourney:和Discord互相成就
提到文生圖,很多人都會想到植根于根植于Discord社區(qū)的Midjourney,本篇文章就基于作者的使用體驗(yàn)+思考,并結(jié)合了Discord來對Midjourney進(jìn)行探討,感興趣的朋友一起來看看吧。
如果要說現(xiàn)在最火的文生圖,不得不說到Midjourney,它根植于Discord社區(qū),也因此我們聊的時(shí)候會結(jié)合Discord對它進(jìn)行展開探討。
坦率說,當(dāng)下國內(nèi)并沒有看到一篇真正琢磨Midjourney的文章,更多是媒體報(bào)道,在這里Super拋磚引玉,基于少量的使用體驗(yàn)+思考,希望能和大家一起撥開迷霧,找到對的方向。
一、 簡述Midjourney
1. Midjourney是什么?
Midjourney is an independent research lab exploring new mediums of thought and expanding the imaginative powers of the human species.
We are a small self-funded team focused on design, human infrastructure, and AI. We have 11 full-time staff and an incredible set of advisors.
Midjourney是一個獨(dú)立的研究實(shí)驗(yàn)室,探索新的思維媒介,擴(kuò)大人類物種的想象力。
專注于設(shè)計(jì)、人力基礎(chǔ)設(shè)施和人工智能。
這是它們官網(wǎng)的介紹,我們現(xiàn)在可見的是文本生成圖片的產(chǎn)品,未來產(chǎn)品形態(tài)還是可能會出現(xiàn)變化的。
首頁里的第一個按鈕“Join in the beta”,直接會跳轉(zhuǎn)到它們在Discord上的頻道:
截至目前已經(jīng)有381萬用戶加入它們的Discord頻道。
大部分工作Midjourney都通過Discord來完成,比如最核心的bot:
用戶主要通過Discord的bot機(jī)制,通過提交Prompt(提示詞),獲得圖片。
Midjourney也通過bot機(jī)制來完成一些其他工作,比如:
- 將用戶生成的圖片同步到官網(wǎng)的個人中心;
- 通過官網(wǎng)收取訂閱費(fèi),再對用戶授予使用次數(shù);
后面會簡單闡述下Discord,方便大家更好地理解Midjourney和Discord是如何共生的。
2. 創(chuàng)始人David Holz
David Holz:我的名字是David Holz,是個連續(xù)創(chuàng)業(yè)者。簡短來說,我的經(jīng)歷是:我在高中的時(shí)候做過設(shè)計(jì)生意,大學(xué)學(xué)的是物理和數(shù)學(xué),我在NASA和Max Planck工作的時(shí)候攻讀了流體力學(xué)博士學(xué)位。
有一次我不知所措,把所有的事情都放在一邊。所以我搬到了舊金山,在2011年左右創(chuàng)辦了一家名為Leap Motion的科技公司。我們銷售那些可以在手上做動態(tài)捕捉的設(shè)備,創(chuàng)造了很多手勢界面空間。
我創(chuàng)立了Leap Motion并且經(jīng)營了12年,(但)最終,我希望尋找一個不同的環(huán)境而不是一家風(fēng)投支持的大公司,我離開并創(chuàng)辦了Midjourney。
現(xiàn)在,它的規(guī)模還很小,我們只有10個人,沒有投資者,而且我們也不是以財(cái)務(wù)回報(bào)為動機(jī)的。我們沒有壓力銷售什么東西也不用成為上市公司,只是為了未來十年能夠有一個家,可以從事很多比較有意義的、酷的項(xiàng)目,希望不僅是對我,還對世界有意義,并且享受樂趣。
【注意,當(dāng)前資本很熱的情況下確實(shí)并未看到Midjourney融資的新聞,并且我猜測付費(fèi)率應(yīng)該能過5%(早期全球范圍內(nèi)幾乎獨(dú)此一份),也會帶來一個月200萬美元以上的收入,個人覺得沒有必要拿融資?!?/p>
他對于Midjourney的理解大體是這樣的:
“Midjourney不光是想象力的引擎,往未來邁一步,如果不是一次拍攝幾張照片,而是一次拍攝幾萬張照片,面對這一切,我會感覺自己就像是小孩看著水池的深處,知道自己不會游泳,卻能感覺到水池的深度。
AI就是水,人們把它看成老虎,這是錯的。水也有危險(xiǎn),但水也是文明的驅(qū)動力,如果人類能知道如何與水共處,會過得更好。
Midjourney是一股新的水源。”
這一段有點(diǎn)韻味,建議翻到文末看一下TheVerge采訪的原文感受一下。
3. Midjourney欲向何方?
We’re working on a lot of different projects. It’s going to be a wide and diverse research lab. But there are themes: things like reflection, imagination, and coordination. And what we’re starting to become well known for is this image creation stuff.
And we don’t think it’s really about art or making deepfakes, but — how do we expand the imaginative powers of the human species? And what does that mean? What does it mean when computers are better at visual imagination than 99 percent of humans?
That doesn’t mean we will stop imagining. Cars are faster than humans, but that doesn’t mean we stopped walking. When we’re moving huge amounts of stuff over huge distances, we need engines, whether that’s airplanes or boats or cars.
And we see this technology as an engine for the imagination. So it’s a very positive and humanistic thing.
Midjourney在做很多不同的項(xiàng)目,但是創(chuàng)造圖像這個工作讓他們出名了。
我覺得他們肯定會在這個有著強(qiáng)烈需求的方向上繼續(xù)拓展,包括可以看到他們也在招聘相關(guān)的人才來擴(kuò)展:
但相信有了足夠的資金后,他們還是會在“things like reflection, imagination, and coordination”方向上探索種種可能性。
二、Discord造就Midjourney
“A lot of people ask us, why don’t you just make an iOS app that makes you a picture?” Midjourney’s founder, David Holz, told The Verge in an interview. “But people want to make things together, and if you do that on iOS, you have to make your own social network. And that’s pretty hard. So if you want your own social experience, Discord is really great.”
為什么是Discord?創(chuàng)始人Holz在回答為什么不做個iOS App的時(shí)候,說到,如果我們想做一個自己的社交網(wǎng)絡(luò),非常難,但我們想讓大家一起創(chuàng)造,從這點(diǎn)來說,Discord非常棒的實(shí)現(xiàn)介質(zhì)。
這種選擇很好的幫助了Midjourney快速成長,在繼續(xù)展開前,我們最好先理解一下Discord是什么?
1. Discord是什么?
Discord是2015年上線的,最初主打游戲語音連麥,基于Voip技術(shù),由于多端支持(特別是支持網(wǎng)頁端)、免費(fèi)、上手門檻低,然后語音清晰、延時(shí)低、連接穩(wěn)定這些特點(diǎn),逐步獲得用戶的認(rèn)可。
疫情之后,由于Discord的社區(qū)功能,從游戲領(lǐng)域破圈,比如,他成了歐洲大量高校的線上教學(xué)工具:
圖源知乎
我們可以理解,Discord的本質(zhì)是一個社區(qū),語音只是他的主打功能之一。
Discord的兩位創(chuàng)始人表示:“Discord與大多數(shù)在線社交工具完全不同,它沒有游戲化系統(tǒng),沒有追隨者人數(shù),沒有算法推薦。它就是創(chuàng)造了一個地方,讓你感覺就像你的朋友就在身邊,你遇到他們并與他們交談、閑聊?!?/p>
你可以非常便捷的創(chuàng)建服務(wù)器,在服務(wù)器上設(shè)立不同的頻道,可以理解為頻道是不同的主題房間。
另外一個很關(guān)鍵的點(diǎn)是,Discord有Bot,你可以把它理解為機(jī)器人,或者插件,允許第三方在Discord提供的接口下獨(dú)自開發(fā)。
這極大的擴(kuò)展了社區(qū)的功能,也增加了用戶的粘性,并且支持開放邀請Bot加入頻道的功能(Midjourney也支持了邀請功能)。
Midjourney通過在Discord上創(chuàng)建了自己的服務(wù)器,并創(chuàng)建了大量的頻道,以及開發(fā)了自己的機(jī)器人,來向用戶提供服務(wù)。
2. 如何在Discord里使用Midjourney?
我們進(jìn)一步,簡單來和大家分享一下如何在Discord里使用Midjourney,這樣一些無法訪問的朋友可以更好地理解:
首先還是要注冊一個賬號,然后進(jìn)入新手的newbie頻道就可以快速生成圖片:
在newbie頻道,“/”可以掉出所有的命令:
當(dāng)你輸入/imagine +提示詞,再回車后,就相當(dāng)于把Prompt提交給了bot,接著會進(jìn)入生成過程:
會有個從模糊到清晰的圖像生成過程和進(jìn)度給到你,
完成后會讓你從4張圖中選擇,注意此時(shí)還沒有結(jié)束,你可以從4張圖中選擇一張來U(Upscale,放大像素并提升細(xì)節(jié)),或者V(Variation,基于所選圖片來延伸變形),1~4代表著左上到右下的4張照片。
比如我點(diǎn)擊了V4之后,bot又進(jìn)入了一次新的圖片生成過程:
這里面,我覺得第二張黑色的太陽不錯,
點(diǎn)了U2:
然后就生成了最終的圖,當(dāng)然你還可以做變形、用網(wǎng)頁打開原圖,以及給出你的反饋,是驚喜還是失望,等操作。
我點(diǎn)擊了Upscale to Max,把清晰度拉滿,最后生成了:
以上就是生成圖片的過程。
每個新用戶會有一些免費(fèi)點(diǎn)數(shù),使用完后,Bot會提示你,該交錢啦:
這一部分在后面的商業(yè)模式部分會再展開,現(xiàn)在先跳過去,我們下面來聊聊本節(jié)標(biāo)題,為什么是Discord造就Midjourney?
3. 為什么是Discord造就了Midjourney呢?
首先,Discord是一個共創(chuàng)的土壤。
Inside the community, you have a million people making images, and they’re all riffing off each other, and by default,everybody can see everybody else’s images. You have to pay extra to pull out the community — and usually, if you do that, it means you’re some type of commercial user.
So everyone’s ripping off each other, and there’s all these new aesthetics. It’s almost like aesthetic accelerationism. And they’re all bubbling up and swirling round, and they’re not AI aesthetics. They’re new, interesting, human aesthetics that I think will spill out into the world.
Holz說,個體的想象力是有限的,但我們發(fā)現(xiàn)把人們放到一起,大家就會想象力爆棚,所以我們需要創(chuàng)造一個Midjourney的社交,它就是基礎(chǔ)設(shè)施:Discord。
在社區(qū)里,大家都在互相模仿,相當(dāng)于提供了一個共創(chuàng)的土壤。
如果用戶愿意付出額外費(fèi)用脫離社區(qū)自己玩,也恰恰說明他們是特殊的商業(yè)客戶。
我們來看看Discord可以做什么:
公告區(qū),創(chuàng)始人Holz發(fā)布了一個公告,請付費(fèi)會員對新的V4算法產(chǎn)出的圖片質(zhì)量做一個評分,發(fā)動群眾,相當(dāng)于最后系統(tǒng)會借鑒用戶評分去調(diào)整模型的生成傾向。
不同的主題頻道,可以把喜好不同的付費(fèi)用戶分流到不同的頻道內(nèi),幫助用戶之間更好的形成共創(chuàng)。
其次,Discord有廣泛的用戶基礎(chǔ)。
在今年7月底,負(fù)責(zé)Discord社區(qū)運(yùn)營的高級經(jīng)理戴(Mindy Day)表示,Discord月活超過1.5億。
廣泛的用戶認(rèn)知也大幅降低了導(dǎo)流轉(zhuǎn)化的成本。
包括前面說的Discord支持多端訪問,Super自己都是直接用網(wǎng)頁版本訪問Midjourney頻道,也很流暢,這種體驗(yàn)的優(yōu)秀也保證了用戶的使用感受。
最后,Discord的Bot機(jī)制可以幫助Midjourney很好地完成服務(wù)。
剛才我們介紹過了Bot機(jī)制,這里再做個簡單的總結(jié):
- 用戶給Bot發(fā)送Prompt;
- Bot監(jiān)測用戶的付費(fèi)情況(以及圖片生成額度情況);
- 如果有限額,Midjourney在后端直接生成圖片并通過Bot返給用戶;
- 如果無限額,提示用戶付費(fèi)。
由于Discord的這些因素,Midjourney可以持續(xù)的快速增長,只需要維護(hù)好Bot,以及后端服務(wù)即可,大量的降低了其他部分工作量,可以用極少量的員工支持大規(guī)模的用戶。
4. 基于Discord的Midjourney由于什么爆火?
《Théatre D’opéra Spatial》
8月底,美國科羅拉多州博覽會的美術(shù)大賽公布了獲獎結(jié)果,一幅名為《太空歌劇院(Théatre D’opéra Spatial)》的作品在“數(shù)字藝術(shù)”類別中摘得了桂冠。
這幅圖無論是主題、光影、人物、色彩在專業(yè)人士眼中都算得上是上乘之作,然后被爆料是作者使用AI生成的(其實(shí)是Ai生成后精修的),被人質(zhì)疑合法性、公平性,并和藝術(shù)可能會消亡掛上鉤。
這引起了軒然大波,當(dāng)然,Midjourney就是這個新聞背后的AI……事實(shí)上也帶來了海量的用戶。
根據(jù)報(bào)道,Midjourney在8月底應(yīng)該只有30萬左右用戶,到了9月底就達(dá)到了150萬+,說明8月底這次美術(shù)大賽事件對他們用戶增長帶來的巨大增長。
再加上前面說的用戶使用門檻最低(只需要加入Discord,輸入Prompt),簡單、效果好、超級牛逼的冷啟動,使得它破圈了,再加上本身基于Discord建立的社區(qū)不斷地鼓勵用戶共創(chuàng)、增加了粘性,這個增長回路使得Midjourney不斷地爆發(fā):
得益于Discord的社區(qū)調(diào)性、Bot機(jī)制實(shí)現(xiàn)的共創(chuàng)效果、以及Midjourney生成的高質(zhì)量圖片抓人的眼球,進(jìn)而帶來的用戶傳播自增長,這幾個部分共同構(gòu)成了Midjourney的持續(xù)增長。
到今天看到的數(shù)據(jù)用戶總數(shù)已經(jīng)破380萬。
當(dāng)然我們也要知道,主動退出Discord的用戶畢竟是少數(shù),380萬可以算是一個累計(jì)用戶數(shù)(虛榮指標(biāo)),不過最近登錄Discord,我也發(fā)現(xiàn)基本能看到的在線用戶數(shù)都在30萬左右,在某種程度上來說,這個用戶活躍度還是很高的。
另一個角度,Midjourney和Discord互相成就,Midjourney也是Discord上用戶數(shù)量最多的服務(wù)器。
三、Midjourney商業(yè)模式
對于新用戶,Midjourney給了一個25點(diǎn)的免費(fèi)額度,用完后則需要購買。
購買有兩檔套餐,標(biāo)準(zhǔn)用戶套餐是:
10美元的月度會員支持生成200張圖,大概就是一張圖3毛錢?;蛘?0美元就不限制使用量。
訂閱會員才能進(jìn)入會員畫廊,妥妥的會員權(quán)益呀。
What is the member gallery?The gallery is a place where paid members can explore images being made on the platform as well as visual dictionaries of words and styles. The gallery also acts as a central place to organize your own images, collect favorites, and more.
對于普通會員來說,默認(rèn)你的圖和Prompt是會被公開的,如果你不想公開,就得買一個50美元/月的隱私通道
另外就是合作伙伴計(jì)劃,如果你想在超過100萬美元年收入的公司使用圖片來商用,那就得買這個,一年600美刀。
這么看起來,Midjourney在收費(fèi)策略上還是很大膽的,少量的免費(fèi)額度讓你體驗(yàn),一旦用完,就必須買,不然沒得玩。
售賣的策略是訂閱制,而不是國內(nèi)通常的按使用量付費(fèi)。
這個模式的成立Super估計(jì)得益于幾點(diǎn):
- 高出圖質(zhì)量;
- 優(yōu)秀的共創(chuàng)氛圍;
- 媒體的渲染和優(yōu)秀的用戶自傳播;
- 超低使用門檻;
- 先發(fā)紅利;
- 全球市場;
- 海外用戶對于付費(fèi)和訂閱制的接受;
Midjourney的商業(yè)模式可以再簡單展開聊聊,我們借用產(chǎn)品力三角形來做個描述:
產(chǎn)品力三角形
使用價(jià)值:Midjourney可以快速的簡單的生成高質(zhì)量的圖,并且提供了圖片層面的選擇和變化。
附加值:社區(qū)對于Midjourney來說是一個挺高的附加值,這實(shí)際上構(gòu)成了附加值。又由于Midjourney先發(fā),門檻低,大量的用戶可以快速便捷的生成圖片,再拿到社交網(wǎng)絡(luò)Show,也是附加值的一種:炫耀。
價(jià)格:這個價(jià)格實(shí)際上在國外也不算高,訂閱制大家也普遍的能接受。
所以整體來看,Midjourney的三條邊拉的都還是挺好的,唯一的問題就是隨著時(shí)間的推移,使用價(jià)值和附加值能不能持續(xù)下去存疑。
包括競品增多之后,價(jià)格也可能會不再有足夠的競爭力。
值得觀察。
四、Midjourney給我們的啟發(fā)
結(jié)合國內(nèi)幾款文生圖的產(chǎn)品一起來看一看:
1. 媒體紅利和先發(fā)優(yōu)勢很重要
競品很多,如何在正確的渠道用正確的方式宣傳,決定了可以獲得多少用戶和流量。
那在對應(yīng)的渠道里,用什么方式,如何導(dǎo)流,就很有講究了。很多團(tuán)隊(duì)更多是技術(shù)基因,在于借勢這一塊就會存在天然的缺陷。
2. 社區(qū)是促活和提高用戶粘性的關(guān)鍵
接著,流量來了,如何留住,變成留量也很重要。
因?yàn)槿绻麊渭冎皇且粋€工具,完全沒有前景,因?yàn)榇蠹叶际腔赟D開源做的少量差異化,構(gòu)不成競爭優(yōu)勢,隨著入場玩家逐漸增加,就會面臨用戶流失和獲客困難的挑戰(zhàn)。
Midjourney直接把用戶導(dǎo)入到社區(qū)化的Discord內(nèi)是很關(guān)鍵的一步。
國內(nèi)通常使用的策略是微信群,這也面臨很多限制,最大的限制是單個群人數(shù)又很低的上限,無法直接把上萬的用戶裝進(jìn)來。
同時(shí)微信群內(nèi)也不能很好的支持機(jī)器人。
對于群的運(yùn)營機(jī)制如果沒有找到好的策略,會導(dǎo)致要么很消耗運(yùn)營精力,要么效果很差慢慢變成死群。
有些小程序會把用戶生成的圖放出來,畫廊或者藝術(shù)展的瀑布流方式呈現(xiàn),但很多時(shí)候Prompt也不公開,其次是沒有分類,實(shí)時(shí)性也很欠缺。促進(jìn)用戶生產(chǎn)內(nèi)容的效果很有限。
3. 大膽的付費(fèi)策略
Midjourney不提供免費(fèi)排隊(duì)通道,上來就直接付費(fèi)。當(dāng)然這個和競品稀少有很大關(guān)系。
國內(nèi)要么是按使用量付費(fèi),要么是幾乎免費(fèi),大家還是處在一個先獲取用戶,再獲得融資的toVC策略。
坦白講,這是一種自作聰明的做法,即使現(xiàn)在資本對于AIGC方向很看好,熱錢涌入,但一旦后面風(fēng)口過了,即使你拿了大筆的錢,一樣會死的非???。
背后的邏輯很簡單,完全沒有健康的商業(yè)模式,并且用戶免費(fèi)習(xí)慣了,轉(zhuǎn)到付費(fèi)的情況也會非常的低。
最近可以看到一些拿了融資的、想拿融資的,各種PR,Super看了是皺眉頭,用近乎免費(fèi)的策略換取用戶,再拿用戶數(shù)去要融資,這是非常不健康的。
且行且珍惜吧。
作者:Super黃,公眾號:Super黃的念想,專注于深度產(chǎn)品拆解+商業(yè)分析。
本文由 @Super黃 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
請問上面生成的圖片可以商用嘛