AI 如何顛覆社交互動(dòng)??jī)晌?Snap 工程師做了這款表情包產(chǎn)品

0 評(píng)論 1204 瀏覽 4 收藏 16 分鐘

生成式 AI 技術(shù)正引領(lǐng)一場(chǎng)社交媒體自我表達(dá)的革命。從 Remini 的黏土濾鏡到 Easel 的表情包,圖像生成領(lǐng)域的創(chuàng)新產(chǎn)品不斷涌現(xiàn)。生成式技術(shù)、社交媒體與自拍照的結(jié)合,為用戶(hù)提供了前所未有的個(gè)性化和創(chuàng)意表達(dá)空間。

Sense 思考:

我們嘗試基于文章內(nèi)容,提出更多發(fā)散性的推演和深思,歡迎交流。

個(gè)人天生就有尋求和表達(dá)真實(shí)自我的傾向,而社交媒體 App 提供了一個(gè)舞臺(tái),讓人們通過(guò)圖像進(jìn)行自我意識(shí)形態(tài)的表達(dá)。

在傳統(tǒng)濾鏡時(shí)代,圖像的表義能力是被攝像頭所限制的。而生成式 AI 的出現(xiàn),讓用戶(hù)的表達(dá)力從「現(xiàn)實(shí)增強(qiáng)」升級(jí)為了「想象增強(qiáng)」,并催生出更多新形式的內(nèi)容和全新的內(nèi)容載體。

妙鴨、Remini 和 Easel 只是圖像社交革命的前菜,讓我們拭目以待。

AI Native 產(chǎn)品分析——Easel

1. 產(chǎn)品:Easel

2. 產(chǎn)品上線時(shí)間:2023 年 12 月 8 日

3.創(chuàng)始團(tuán)隊(duì):

Rajan Vaish:CEO,聯(lián)合創(chuàng)始人。前 Snap 高級(jí)研究工程師。

Sven Kratz:聯(lián)合創(chuàng)始人。前 Snap 高級(jí)研究工程師。

4. 產(chǎn)品簡(jiǎn)介:

Easel 是一款圖像社交產(chǎn)品,它巧妙地利用自拍表情包作為切入點(diǎn),利用生成式 AI 技術(shù),為用戶(hù)提供了將自拍轉(zhuǎn)化為有趣、個(gè)性化的表情包的功能。Easel 目前只能用于 iOS 平臺(tái),需要與 iMessage 一起配合使用。

5. 融資情況:

265 萬(wàn)美元天使輪融資。投資者包括 Unusual Ventures、f7 Ventures 和 Corazon Capital 以及各種天使投資者(包括斯坦福大學(xué)的幾位教授)。

一、、從 Remini 的爆火講起

社交媒體上的人像照,早已成為流行的風(fēng)向標(biāo)。從 iPhone 4 引領(lǐng)的前置攝像頭革命,到移動(dòng)互聯(lián)網(wǎng)創(chuàng)業(yè)公司們利用光學(xué)傳感器、手機(jī)算力和圖像算法的“黃金三角”組合,社交網(wǎng)絡(luò)的每一次變革都伴隨著人像照的流行文化更迭。

從 Instagram 的照片濾鏡,到 SnapChat 的 AR 濾鏡,再到去年爆火的妙鴨相機(jī),每一次技術(shù)的躍進(jìn)都為人像照賦予了新的生命。

(圖片來(lái)自網(wǎng)絡(luò))

在 2024 年的五一勞動(dòng)節(jié)期間,一款名為 Remini 的 App 異軍突起,迅速風(fēng)靡小紅書(shū)、抖音等社交媒體。這種濾鏡將用戶(hù)的形象轉(zhuǎn)化為粗糙、笨拙的黏土動(dòng)畫(huà)片風(fēng)格,與主流的美顏文化形成鮮明對(duì)比。這種「蠢萌」的黏土風(fēng)格,為用戶(hù)帶來(lái)了一種自嘲式的幽默感和心理慰藉。

(圖片來(lái)自網(wǎng)絡(luò))

在 Remini 于內(nèi)網(wǎng)大熱的同時(shí),另一家美國(guó)西海岸的初創(chuàng)公司正在探索另一條商業(yè)化道路。它們將圖像生成與自拍表情包加以結(jié)合,基于 Apple 平臺(tái)推出了 Easel,這是一款可在 iMessage 上通過(guò)圖像生成即時(shí)制作表情包的 App。

(圖片來(lái)自 Easel 官網(wǎng))

二、Easel + iMessage = 下一個(gè) SnapChat?

Easel,這款由 Snap 兩名前員工創(chuàng)立的 App,似乎正在醞釀一場(chǎng)新的社交革命。其聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Rajan Vaish,曾在 Snap 任職五年,親眼見(jiàn)證了人臉濾鏡如何掀起流行文化的巨浪。而今,Rajan 意欲借助生成式 AI 再度掀起新一輪的流行文化熱潮。

他選取了表情包這一高頻用圖場(chǎng)景作為突破點(diǎn)。與妙鴨相機(jī)的體驗(yàn)相仿,當(dāng)用戶(hù)首次使用 Easel 時(shí),它會(huì)抓拍數(shù)秒鐘的用戶(hù)面部照片,以構(gòu)建一個(gè)定制化的個(gè)人形象模型——不出所料,其背后運(yùn)用的正是 Stable Diffusion 的開(kāi)源生態(tài)的技術(shù)。

Easel 的創(chuàng)新之處在于,它將表情包與敘事相結(jié)合,使得圖像不僅僅停留在「美照」層面,更是用戶(hù)溝通、表達(dá)和情感傳遞的媒介。

在 Easel 的玩法中,用戶(hù)可以通過(guò)簡(jiǎn)單的場(chǎng)景描述詞,為 @ 的人生成包含其形象的場(chǎng)景畫(huà)面。這不僅激發(fā)了用戶(hù)的創(chuàng)作欲望,也促進(jìn)了社交互動(dòng)的裂變。當(dāng)對(duì)方看到這張圖后,很可能會(huì)產(chǎn)生回應(yīng)的動(dòng)機(jī),進(jìn)而下載 Easel App 并使用「Remix」功能進(jìn)行二次創(chuàng)作,形成病毒式的互動(dòng)循環(huán)。

(圖片來(lái)自 Easel 官網(wǎng))

為了降低創(chuàng)作門(mén)檻,Easel 也準(zhǔn)許用戶(hù)將生成的圖像發(fā)布到應(yīng)用內(nèi)的社區(qū)中,如此一來(lái),特定的節(jié)日或事件或許會(huì)引發(fā)特定的內(nèi)容主題,從而提升用戶(hù)的參與熱度。

在 App Store 上,Easel 獲得了 5.0 的滿(mǎn)分好評(píng),盡管僅有 21 個(gè)用戶(hù)參與了評(píng)分。其中一條評(píng)論興奮地寫(xiě)道“歡迎來(lái)到社交媒體的未來(lái)”,并表示自己已經(jīng)生成了 500 張圖來(lái)與所愛(ài)的人分享。

(圖片來(lái)自 Easel 的 App Store 主頁(yè))

那么,問(wèn)題來(lái)了,Easel + iMessage 會(huì)成為下一個(gè) SnapChat 嗎?

三、社交媒體與自我表達(dá)的心理學(xué)

社交媒體已經(jīng)成為現(xiàn)代人表達(dá)自我、展示個(gè)性的重要平臺(tái)。在這個(gè)過(guò)程中,「自我決定理論」(Self-Determination Theory,SDT)為我們提供了一個(gè)深入理解社交媒體自我表達(dá)心理的視角。

該理論指出,人類(lèi)天生具有追求和表達(dá)真實(shí)自我的內(nèi)在動(dòng)機(jī),而當(dāng)個(gè)體的基本心理需求——自主性(Autonomy)、能力性(Competence)、和關(guān)聯(lián)性(Relatedness)——得到滿(mǎn)足時(shí),這種動(dòng)機(jī)將得到加強(qiáng)。社交媒體應(yīng)用程序正是通過(guò)提供一個(gè)展示和交流的舞臺(tái),來(lái)滿(mǎn)足這些基本心理需求,而人像照則成為用戶(hù)自我表達(dá)的重要載體。

在傳統(tǒng)濾鏡時(shí)期,圖像的表意能力被攝像頭所局限。用戶(hù)僅能通過(guò)濾鏡、AR 人臉貼紙等方式來(lái)實(shí)現(xiàn)「現(xiàn)實(shí)增強(qiáng)式」的自我表達(dá)。然而即便如此,上一輪以人臉關(guān)鍵點(diǎn)為核心的 AI 技術(shù)浪潮依然催生出了如抖音、美圖、FaceU 等現(xiàn)象級(jí)產(chǎn)品。

而生成式 AI 的出現(xiàn),為用戶(hù)的自我表達(dá)安上了想象的翅膀,圖像的「表意能力」得到進(jìn)一步釋放。用戶(hù)的表達(dá)力從「現(xiàn)實(shí)增強(qiáng)」升級(jí)為了「想象增強(qiáng)」——用戶(hù)能夠利用文字來(lái)描述其最為天馬行空的場(chǎng)景想象,再讓擴(kuò)散模型將其繪制出來(lái)?,F(xiàn)實(shí)的次元壁被打破,用戶(hù)首次看到了自己在吉卜力漫畫(huà)、皮克斯動(dòng)畫(huà)、水彩、素描,甚至是文藝復(fù)興時(shí)代的油畫(huà)大師筆下的模樣。

(圖片來(lái)自本文作者的小紅書(shū)主頁(yè))

與上一代以「美顏」為代表的應(yīng)用相比,生成式 AI 圖像生成應(yīng)用具有更強(qiáng)的內(nèi)容屬性、更多的互動(dòng)玩法和更廣的美學(xué)風(fēng)格。這不僅能夠滿(mǎn)足用戶(hù)對(duì)于美的追求,更能夠激發(fā)用戶(hù)的創(chuàng)造力和想象力,讓他們能夠更加自由地表達(dá)自我。

四、技術(shù)與需求的雙向奔赴

生成式AI在商業(yè)領(lǐng)域成功落地的關(guān)鍵之一在于消弭幻覺(jué)、提高可控性。這條技術(shù)優(yōu)化路徑不僅適用于大型語(yǔ)言模型(LLM),也同樣適用于擴(kuò)散模型(Diffusion Model)?;仡檲D像生成技術(shù)的發(fā)展歷程,早期模型由于可控性較差,其應(yīng)用場(chǎng)景主要局限于「文生圖」形式。這導(dǎo)致市場(chǎng)上的產(chǎn)品同質(zhì)化嚴(yán)重,用戶(hù)難以對(duì)圖像生成過(guò)程進(jìn)行有效控制。

然而,伴隨 Lora、ControlNet、IPAdapter、InstantID,乃至最新的 PuLID 等一系列新技術(shù)的出現(xiàn),被生成的圖像有機(jī)會(huì)和用戶(hù)給定的參考圖,尤其是 IP(個(gè)人形象)構(gòu)建語(yǔ)義關(guān)聯(lián),使得圖像在生成的同時(shí)能夠保留人物的高維度面部特征,進(jìn)而更進(jìn)一步強(qiáng)化了用戶(hù)表達(dá)自我的能力。

歷史再一次表明,在圖像產(chǎn)品領(lǐng)域,技術(shù)和需求的雙向奔赴,往往首先會(huì)在人像照的應(yīng)用場(chǎng)景得以實(shí)現(xiàn)。圖像生成類(lèi)的產(chǎn)品開(kāi)始逐漸加入面部控制能力,催生出換臉、保 ID 生圖等新的玩法。這里面也包含了筆者上一次創(chuàng)業(yè)所做的 Stylar.ai 這款產(chǎn)品。

然而,由于大模型的技術(shù)特性,目前的圖像生成還很難做到「百發(fā)百中」,用戶(hù)往往需要在幾張、幾十張的生成結(jié)果中才能挑中他所滿(mǎn)意的那一張。這是因?yàn)樵趫D像生成領(lǐng)域仍然有很多可控性問(wèn)題有待解決,而可控性勢(shì)必帶來(lái)交互體驗(yàn)上的復(fù)雜性。

作為 C 端消費(fèi)級(jí)產(chǎn)品來(lái)說(shuō),如何平衡技術(shù)、商業(yè)和用戶(hù)體驗(yàn),仍然是一個(gè)很考驗(yàn)產(chǎn)品智慧的問(wèn)題。

Easel 很巧妙地采取了「自拍表情包」這個(gè)視角,一方面它的傳播限制在少數(shù)親密關(guān)系鏈的對(duì)話場(chǎng)景中,另一方面它的表義性大于美顏性,因此從一定程度上做到了「揚(yáng)長(zhǎng)避短」,具有更大的技術(shù)容錯(cuò)空間。

五、生成式 AI 與圖像社交的未來(lái)

隨著大型模型技術(shù)的不斷進(jìn)步,我們正處于一個(gè)快速演變的時(shí)代,每天都有新的研究論文和技術(shù)突破涌現(xiàn)。在這樣的背景下,我們可以預(yù)見(jiàn),將會(huì)有更多類(lèi)似Remini和Easel這樣的創(chuàng)新產(chǎn)品和流行應(yīng)用不斷涌現(xiàn),為圖像社交領(lǐng)域帶來(lái)新的活力。

作為深度參與這一變革的觀察者,筆者認(rèn)為以下幾個(gè)技術(shù)趨勢(shì)值得特別關(guān)注,它們有潛力催生出顛覆性的新產(chǎn)品:

1. 移動(dòng)端端側(cè)的實(shí)時(shí)計(jì)算技術(shù)

隨著模型壓縮技術(shù)的發(fā)展和端側(cè) NPU 芯片的成熟,加之新一代 iPhone 的推出,移動(dòng)端市場(chǎng)將迎來(lái)新的機(jī)遇。端上計(jì)算將重塑圖像生成產(chǎn)品的市場(chǎng)格局,推動(dòng)更多以?shī)蕵?lè)為導(dǎo)向而非僅僅定位于效率工具的圖像社交產(chǎn)品問(wèn)世,同時(shí)提升類(lèi)似 Easel 這樣的應(yīng)用的用戶(hù)體驗(yàn)。

2. 文字生成與自動(dòng)排版技術(shù)

文字生成能為圖像賦予表意能力,自動(dòng)排版則可為圖像增添平面設(shè)計(jì)能力。這兩者的結(jié)合將推動(dòng)圖像生成產(chǎn)品超越單一素材生成的局限,向更全面的商業(yè)級(jí)應(yīng)用發(fā)展,催生出海報(bào)設(shè)計(jì)、漫畫(huà)創(chuàng)作、廣告制作等垂直領(lǐng)域的應(yīng)用。

3. 數(shù)字人與角色動(dòng)態(tài)驅(qū)動(dòng)技術(shù)

隨著虛擬人技術(shù)的不斷進(jìn)步,圖像和個(gè)人IP形象將被賦予更加豐富的情感、智慧和表達(dá)力。這種技術(shù)不僅可以應(yīng)用于短視頻和直播,還將促進(jìn)全新的陌生人社交場(chǎng)景的誕生。

4. 新的圖像格式和內(nèi)容裂變

傳統(tǒng)的位圖格式以像素作為存儲(chǔ)單元,但生成式圖像包含了大量的「元信息」,這些元信息如同圖像的DNA,將引領(lǐng)新的圖像格式和內(nèi)容裂變玩法。在這個(gè)過(guò)程中,每一個(gè)創(chuàng)作者都將作為版權(quán)鏈條的一部分被記錄下來(lái),這將促進(jìn)創(chuàng)作生態(tài)的健康發(fā)展。

5. 空間計(jì)算與 3D 生成

眾多創(chuàng)業(yè)公司如Luma AI、Spline、Genmo 等正在積極探索 3D 內(nèi)容生成的解決方案。隨著 Vision Pro 等設(shè)備的普及,將為 3D 內(nèi)容生成提供更多的訓(xùn)練數(shù)據(jù)和商業(yè)化場(chǎng)景。3D 內(nèi)容非常契合生成式 AI 所擅長(zhǎng)的虛構(gòu)內(nèi)容創(chuàng)作場(chǎng)景。生成式技術(shù)將為虛構(gòu)內(nèi)容創(chuàng)作提供更廣闊的舞臺(tái)。

展望未來(lái),我們將見(jiàn)證一個(gè)更加多元化、個(gè)性化、互動(dòng)式和沉浸式的圖像社交新紀(jì)元。讓我們拭目以待,看看未來(lái)將如何展開(kāi),而我們又將如何在這個(gè)充滿(mǎn)創(chuàng)意和想象的世界中找到自己的位置。

參考材料:

https://techcrunch.com/2024/04/23/with-easel-ex-snap-researchers-are-building-the-next-generation-bitmoji-thanks-to-ai/

https://apps.apple.com/us/app/easel-ai/id6448734086

本文由人人都是產(chǎn)品經(jīng)理作者【深思SenseAI】,微信公眾號(hào):【深思SenseAI】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!