物流業(yè)務(wù)分析師的機器學(xué)習(xí)神器——Amazon SageMaker Canvas產(chǎn)品測評
編輯導(dǎo)語:日益復(fù)雜的業(yè)務(wù)需求和數(shù)據(jù)分析需求,催化了更智能、更多元化的分析工具的出現(xiàn)。而亞馬遜云科技推出的Amazon SageMaker Canvas,就是這類智能分析工具之一。本篇文章里,作者結(jié)合物流領(lǐng)域的業(yè)務(wù),對這款工具進行了體驗測評,一起來看看吧。
隨著數(shù)字化進程和人工智能的加速普及,企業(yè)人工智能(AI)和機器學(xué)習(xí)(ML)開發(fā)人員嚴重短缺,面對日益興起的數(shù)據(jù)分析需求,亞馬遜云科技推出了讓人興奮的機器學(xué)習(xí)新功能——Amazon SageMaker Canvas。
Amazon SageMaker Canvas進一步降低了機器學(xué)習(xí)使用門檻,運營分析師們掌握無需編碼,即可使用點擊式界面進行更準確的機器學(xué)習(xí)預(yù)測。這允許了任何有興趣學(xué)習(xí)更多關(guān)于ML的人,可以免費嘗試使用這項技術(shù)。
話不多說,下面我以物流垂直細分領(lǐng)域的常見數(shù)據(jù),來體驗下SageMaker Canvas的魅力!
一、分析場景和數(shù)據(jù)準備
1. 分析場景
分析每次的揀配數(shù)量與耗時和質(zhì)量的相關(guān)性,本次從各環(huán)節(jié)規(guī)定時間內(nèi)運送的箱數(shù)、各環(huán)節(jié)耗時、各環(huán)節(jié)箱質(zhì)量狀態(tài)這幾個因子中找出關(guān)聯(lián)。
2. 業(yè)務(wù)場景
模擬物流作業(yè)人員在規(guī)定時間內(nèi)揀配不同數(shù)量的箱子,最終的完成率和質(zhì)量是不一樣的,分析找出單次作業(yè)最佳的揀配箱數(shù)。給業(yè)務(wù)運營同學(xué)在制定運送任務(wù)策略時,有數(shù)據(jù)可參考,做出更合理高效的作業(yè)策略。
分析的結(jié)論是否正確不重要,重要的是模擬出關(guān)聯(lián)+探索不同角度的分析方法+不同工具的使用。
3. 數(shù)據(jù)來源
脫敏和虛擬的倉庫內(nèi)部物流數(shù)據(jù)。
4. 數(shù)據(jù)集定義
某廠倉庫內(nèi)的物流作業(yè)過程,有一段是“下發(fā)要貨任務(wù)——分揀物品——發(fā)運物品——配送物品”,每個過程按要貨箱數(shù)進行運送,每個運送環(huán)節(jié)按一定的時間截取當前的完成率,每次運送的用時情況、每個環(huán)節(jié)物品的質(zhì)量情況,分別記錄為以下內(nèi)容:
二、測評體驗步驟和數(shù)據(jù)分析結(jié)構(gòu)
1. 登陸賬號
注冊和登錄賬號,在控制臺搜索SageMaker,點擊進入SageMaker控制臺。
2. 導(dǎo)入和管理數(shù)據(jù)
在S3里新建儲存桶,導(dǎo)入數(shù)據(jù)。導(dǎo)入格式注意是.csv,文檔內(nèi)不能有中文,剛開始體驗時沒注意格式規(guī)范,導(dǎo)入失敗了幾次。整體體驗還是比較流暢的,第一次登陸和設(shè)置時需要多讀指引文檔和留意頁面提示。
3. 啟動應(yīng)用程序
在SageMaker Domain里,找到Canvas(中文版為:畫布) ,點擊啟動【畫布】。
4. 部署
大概1分鐘,后端應(yīng)用部署完成。
5. 新建模型
在SageMaker Canvas里,點擊【+New Model】。
6. 導(dǎo)入數(shù)據(jù)
導(dǎo)入剛才在?S3里的數(shù)據(jù)。
7. 選擇目標列
本次分析我選了【demand case】為目標列,SageMaker Canvas會自動用適合的模型進行分析。
為什么選【demand case】為目標列呢,因為【demand case】是要貨箱數(shù),所有的物流作業(yè),都基于【demand case】才有后續(xù)的過程、耗時、質(zhì)量的分析。再例如,如果你的分析是廣告投放、市場推廣類的,目標列的可以是營銷漏斗的第一層。
8. 選擇有效字段進行分析
字段【NO.】是序號,與數(shù)據(jù)不相關(guān),不勾選該字段,不然會影響預(yù)測;其他字段相關(guān)性較高,進行保留。
切換圖標和列表樣式,都可以進行有效字段的篩選。
9. 構(gòu)建模型
我們來個簡單的,點擊【Preview model】,可查看模型的預(yù)測準確率。我這個模型準確率算蠻高的,達到了96.154%。
然后點擊相應(yīng)的列,可以查看每列數(shù)對預(yù)測結(jié)果的影響。
點擊【Quick build】可以進行簡易分析,還有標準模式,那個等待用時久一些。
下圖展示了構(gòu)建模型的過程。
10. 模型評估
在使用模型對新數(shù)據(jù)進行預(yù)測前,還可以評估模型的執(zhí)行情況、每列數(shù)據(jù)對預(yù)測結(jié)果產(chǎn)生的影響情況。下圖展示了評估頁面、評估得分以及不同列的影響情況。
還可以通過更改輸入值,來查看預(yù)測值的變化情況。
點擊【Scoring】選項卡,查看模型預(yù)測的相關(guān)可視化結(jié)果和指標。
在箱數(shù)較少時,一次作業(yè)能完成的概率比較大,說明安排此類物流任務(wù)時,一次作業(yè)10箱或更少箱時,作業(yè)人員能比較順手。
此時,運營分析師可以分析原因:可能是不同搬運工具和工具可承載情況的影響;找出可能的策略:增加不同類型的搬運工具、調(diào)整搬運組合可能對效率有正向影響等。
11. 做出預(yù)測
SageMaker Canvas有兩種預(yù)測方案:
- Batch——針對整個數(shù)據(jù)集進行預(yù)測。
- Single——針對指定的單一數(shù)值進行預(yù)測。
我們分別來體驗一下:
1)預(yù)測方案A:選擇Batch進行預(yù)測
對于每一組預(yù)測,SageMaker Canvas返回如下內(nèi)容:
- 預(yù)測得到的值;
- 預(yù)測的值為正確結(jié)果的可能性;
- 指定用于生成預(yù)測所用的數(shù)據(jù)集。
下載所有數(shù)據(jù),可以再次進行二次分析(這也是體驗最棒的模塊):
例如:可能性超過98%的數(shù)據(jù)占到了總數(shù)據(jù)的86%。該數(shù)據(jù)匹配上作業(yè)ID和員工ID,即可分析出員工在不同時間里,不同作業(yè)數(shù)量情況下的作業(yè)效率、準確率的分布趨勢,可以模擬出員工的作業(yè)穩(wěn)定度。
又例如:可能性低于80%的數(shù)據(jù)里,這些數(shù)據(jù)匹配上作業(yè)工具ID,可以分析出員工在不同作業(yè)要求下,他們的工具的使用習(xí)慣分布的預(yù)測。
然后定位到優(yōu)秀員工的工具使用習(xí)慣里,可以推薦出哪些工具更適合多采購,哪些工具可以加強培訓(xùn)等,哪些員工優(yōu)秀的作業(yè)技巧多等。
可能性的數(shù)據(jù)可以匹配很多關(guān)聯(lián)字段進行聯(lián)想思考,為運營帶來更多策略參考。
2)預(yù)測方案B:選擇Single prediction進行預(yù)測
我更改了【distributioncase】的值,查看預(yù)測值相對于平均預(yù)測結(jié)果的變化情況。
點擊【Update】 ,生成預(yù)測數(shù)據(jù)。
更改多個【Value】,預(yù)測值會有變動,可以直觀地結(jié)果發(fā)現(xiàn),處于流程上游的值變動的話,對最終數(shù)據(jù)影響更大(這也符合邏輯)。
綜上,對于運營分析師來說,千頭萬緒的數(shù)據(jù)中,要分析出關(guān)鍵點和趨勢,更推薦選擇Batch,數(shù)據(jù)越多,干貨越多,還有意想不到的內(nèi)容。?
三、總結(jié)一下
Amazon SageMaker Canvas提供了一個可視化的、 點擊式的用戶界面,讓運營分析師可以輕松地生成預(yù)測,無需代碼即可進行機器學(xué)習(xí)預(yù)測,簡單方便好上手。
在數(shù)據(jù)的準備上,可以把結(jié)果字段,例如合格率、完成率、成功率、轉(zhuǎn)化率、用量、耗時等進行整理,不要直接用過程數(shù)據(jù),這樣分析會更直接。
在數(shù)據(jù)分析上,可以與關(guān)聯(lián)ID打通,在跨流程、跨主題的數(shù)據(jù)里,尋找關(guān)聯(lián)點。這也是數(shù)據(jù)分析師提高數(shù)據(jù)敏感度、深入了解業(yè)務(wù)的過程了。
希望以上的體驗分析,能給您帶帶一點點啟發(fā)~
作者:Felice,某廠資深產(chǎn)品經(jīng)理&產(chǎn)品運營
本文由 @ToB Talk 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
找出可能的策略:增加不同類型的搬運工具、調(diào)整搬運組合可能對效率有正向影響等。