用嘴開發(fā)小程序日志——安心聲音

0 評論 305 瀏覽 0 收藏 11 分鐘

在AI技術(shù)的浪潮中,編程和產(chǎn)品開發(fā)的門檻正在被逐步打破。本文作者通過AI編程技術(shù),從零開始開發(fā)了一個名為“安心聲音”的小程序的全部經(jīng)歷,供大家參考。

年前學(xué)會了AI編程的入門技巧,做了個《定制新年問候表情包》的小網(wǎng)站。當(dāng)時很興奮,但是最終卻沒能發(fā)揮什么作用。

于是我陷入沉思,我覺得我“有了AI編程這個錘子,目前缺一個好的釘子”,還是得找到生活中的“真需求”……

直到最近,我發(fā)現(xiàn)小紅書上有條帖子。是一個獨立開發(fā)者在問大伙需要什么APP的。有個回復(fù)是這么說的,希望有這樣的APP:

獨居女性APP,里面都是男性的聲音,放大音量,讓門外聽到家里有男的,有狗。音頻內(nèi)容有,誰???再敲門?

和我老婆討論了下,這個需求的存在是因為“獨居女性”是一個有一定風(fēng)險的屬性,也時常會發(fā)生一些危險的案件。所以會通過一些措施來偽裝成“非獨居女性”。最簡單的就是各大外賣、快遞平臺的性別改成男的。

以上為DeepSeek找到的案例。

這背后也說明了“獨居女性”存在一定的“風(fēng)險防控”需求,在某些情況下,她們需要盡可能地減少風(fēng)險事件的發(fā)生,保證那些需要“報警”應(yīng)對的情況不會發(fā)生。

那么為什么是用“發(fā)出聲音的”程序來滿足這種需求呢?

大部分“獨居女性安全指南”都指出,可以通過“注意與規(guī)避危險情況”、“偽造非獨居女性的跡象”、“購買安全措施(監(jiān)控類、報警類、防身類)”等方式來盡量避免風(fēng)險。

“注意與規(guī)避危險情況”這種屬于個人行為,目前無法使用程序來解決。(除非發(fā)展出帶有用戶環(huán)節(jié)和行為識別的穿戴設(shè)備,以及基于識別情況進(jìn)行決策的AI能力。)

“購買安全措施(監(jiān)控類、報警類、防身類)”這類方式已有很多成熟的產(chǎn)品,上網(wǎng)就能買到對應(yīng)的內(nèi)容,比如防狼噴霧、報警器……

以上兩個方向用產(chǎn)品功能滿足的可行性不高,只能聚焦于“偽造非獨居女性的跡象”這一點。

在這個方向上,目前只能看到“偽造外賣、快遞平臺信息”、“門口擺放男性鞋子”、“晾曬男性衣物”等手段。這種方式有可能在長期的接觸與對接中露餡,比如一個快遞員經(jīng)常派件,在接觸過程中都發(fā)現(xiàn)對接人只有“女性”,加上這種“獨居女性安全指南”的手段現(xiàn)在大部分人都知道。那么“獨居女性”的標(biāo)簽是有可能被拆穿的。

那么便可以利用聲音在使得這個“偽裝”更可信,通過聲音來模擬存在一個“伴侶”,從而保持“非獨居”的人設(shè)。

由于這個需求的核心功能十分簡單,AI coding能完全hold住,結(jié)合目前AI語音技術(shù)非常成熟,因此這個方向相有可能的。于是我便想用AI編程來實現(xiàn)以下我所設(shè)想的這個小需求。

成品展示

以下是成品展示~

整體上分為兩個頁面,預(yù)設(shè)了6個場景:

  1. 接聽語音:這個場景下會模擬一個男生在與你進(jìn)行微信,并告訴周圍的人,他待會回來接你。適用于夜路回家的情況。
  2. 應(yīng)門聲音:這個場景下會模擬一個男生應(yīng)門,然后讓你去接待。用于告知門外的人,里面是有男生的。同時也交代了“為什么接下來是女的在說話”。
  3. 接收外賣:這個場景下會模擬一個男生應(yīng)門,并告知外賣放在門口即可。
  4. 聚會社交:這個場景下會模擬多人聚會的聲音,告知里面很多人。
  5. 咳嗽聲音:這個場景下會模擬男生咳嗽。
  6. 腳步聲音:這個場景下會模擬沉重腳步聲。

建設(shè)思路

下面就分享下,我在弄這個小程序時候的思路。

產(chǎn)品功能梳理

由于對這個功能還僅僅是本人的設(shè)想,未能得到價值的驗證。所以第一個版本為MVP版本,需要盡量只有核心功能。像是什么“自定義音色”、“自定義語音內(nèi)容”、“自由錄制語音”、“一鍵報警”這些功能都先砍掉。

先提供幾個常見場景,把核心的【場景列表】和【音頻播放】功能做出來。

我這里借用了DeepSeek,讓他幫我梳理功能。雖然他輸出了不少冗余的功能,但是基本上刪刪改改就能繼續(xù)用了。

可行性研究

接著我要進(jìn)行這個功能的可行性研究,這里除了AI編程之外,需要研究的就是語音內(nèi)容了。

在這里的需求是“真實”、“沉穩(wěn)”的聲音。因此需要排除機(jī)械感很重的配音(比如剪映上的配音能力),然后需要排除掉過于優(yōu)美的聲線(比如MiniMax上的各種預(yù)設(shè)音色)。

最后我看到了MiniMax上的聲音克隆。于是我試著找了個朋友的音色錄制了下,發(fā)現(xiàn)還挺自然。

落地建設(shè)

當(dāng)可行性都研究好后,就是開干的過程了。主要分為原型設(shè)計和功能實現(xiàn)兩步,這里都是用AI來替我完成的。

用“嘴”設(shè)計原型

在前面的功能梳理環(huán)節(jié),我已經(jīng)讓DeepSeek幫我生成好了功能的文字描述。我只需要打開Mastergo,把需求輸入進(jìn)去,它就幫我生成了高保真的原型界面。

由于有兩個頁面,所以需要分開兩次輸入。以下為我所選擇的成品。

其實AI的成品還是有不少問題的,我們可以選擇在Mastergo上二次修改,或者在AIcoding環(huán)節(jié),讓AI幫我們?nèi)サ魺o關(guān)的功能。

用“嘴”寫代碼

當(dāng)原型滿意后,我就直接把DeepSeek給我的需求和原型圖,丟給windsurf幫我寫代碼。然后通過微信開發(fā)者工具調(diào)試。

其中有BUG的部分,就直接截圖圈起來,讓AI幫我修改。

hhh,有種PUA賽博程序員的感覺了。

最終經(jīng)過N輪的“用嘴開發(fā)”,這個僅有兩個頁面的功能便完成了。但其實這里也調(diào)試了我?guī)讉€小時,還是會存在指令不到位的情況,當(dāng)然也有我描述不夠詳細(xì)的原因。整體來說,Claude 3.7相比起3.5來說,還是強(qiáng)大了不少的。

小結(jié)

以上便是這個《安心聲音》小程序的實戰(zhàn)小結(jié)了。目前AI coding的發(fā)展速度非??欤恍┖芎唵蔚墓δ芤呀?jīng)能夠由不會代碼的人來實現(xiàn)了。一個考驗“誰更能找到真需求”的時代正在到來。

本文由人人都是產(chǎn)品經(jīng)理作者【檸檬餅干凈又衛(wèi)生】,微信公眾號:【檸檬餅干凈又衛(wèi)生】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!