產(chǎn)品實(shí)踐分享: Re-Act+SOP,讓Agent穩(wěn)定執(zhí)行 SOP流程(多輪對(duì)話形式),低成本解決復(fù)雜SOP搭建問(wèn)題
TFlow AI作為一款面向B端業(yè)務(wù)場(chǎng)景的Agent平臺(tái),通過(guò)結(jié)合Re-Act推理+行動(dòng)機(jī)制和預(yù)設(shè)的SOP流程,實(shí)現(xiàn)了對(duì)業(yè)務(wù)流程的精確控制和執(zhí)行,為企業(yè)提供了一種既靈活又具有確定性的解決方案。本文將深入探討TFlow AI如何利用大型語(yǔ)言模型實(shí)現(xiàn)復(fù)雜的推理決策任務(wù),并展示其在實(shí)際應(yīng)用中的優(yōu)勢(shì)和挑戰(zhàn)。
實(shí)踐產(chǎn)品TFlow AI 簡(jiǎn)介:是面向B端業(yè)務(wù)場(chǎng)景Agent平臺(tái),能按流程處理任務(wù)(SOP),圍繞目標(biāo)來(lái)進(jìn)行離散推理。能快速搭建Ai客服、AI導(dǎo)購(gòu)等應(yīng)用。
產(chǎn)品允許LLM與環(huán)境進(jìn)行交互,根據(jù)環(huán)境數(shù)據(jù)的反饋不斷的調(diào)整行動(dòng)計(jì)劃/策略。且整個(gè)sop的過(guò)程是由文本來(lái)控制,產(chǎn)品基本參數(shù)如下:
- 使用 文心一言 3.5的模型,未微調(diào)
- 做了邏輯處理的Agent框架
- 單條回復(fù)的消耗不到2K token,價(jià)格不貴
- 歡迎體驗(yàn)。(注:流程只需要用文本流程,不需要work flow)
一、為什么要做
B端業(yè)務(wù)場(chǎng)景的需求:確定性
- 企業(yè)服務(wù)(對(duì)內(nèi)、對(duì)外)通常有相對(duì)明確的SOP流程或者思考步驟,在業(yè)務(wù)處理或者對(duì)外 交互時(shí)期望按照流程來(lái)執(zhí)行任務(wù)。
- 對(duì)外、對(duì)內(nèi)的服務(wù),期望帶來(lái)確定性的體驗(yàn)。
例如當(dāng)用戶退換貨時(shí),思考流程如下:
- A 確定退貨原因
- b 確認(rèn)訂單是否真實(shí)有效
- c 確定是否符合退換貨政策要求
- d 協(xié)助解答退貨操作
在整個(gè)多輪對(duì)話溝通過(guò)程中的要求:
- 按照流程執(zhí)行,需要流程可控,帶來(lái)確定性的結(jié)果。
- 始終聚焦“退換貨”事情上,不要去解答無(wú)關(guān)的事情
二、如何通過(guò)大模型實(shí)現(xiàn)昵?借用Re-Act 為代表 推理+行動(dòng) 機(jī)制
ReAct 代表 一種將推理和行動(dòng)與 語(yǔ)言模型只相結(jié)合的技術(shù),用于解決各種語(yǔ)言推理和決策任務(wù)。它促使語(yǔ)言模型生成語(yǔ)言推理軌跡和行動(dòng),并支持與外部環(huán)境的交互。
Re-act的官方案例示例:
流程說(shuō)明如下:
- 目的:找出Apple Remote最初設(shè)計(jì)用來(lái)交互的程序,即Front Row媒體中心程序
- 思考 1: 我需要搜索“Apple Remote”并找到它最初設(shè)計(jì)用來(lái)交互的程序。
- 行動(dòng) 1: 搜索[Apple Remote]
- 觀察 1: “Apple Remote”是蘋(píng)果公司于2005年10月推出的一款遙控器……用于控制Front Row媒體中心程序。
- 思考 2: Apple Remote最初設(shè)計(jì)用于控制Front Row媒體中心程序。我需要搜索Front Row并找到還有哪些設(shè)備可以控制它。
- 行動(dòng) 2: 搜索[Front Row]
- 觀察 2: 沒(méi)有找到[Front Row]。相似結(jié)果包括:“FrontSeat to Earth”、“Front Row Motorsports”、“Front Row(software)”等。
- 思考 3: 沒(méi)有找到Front Row。我需要搜索“Row (software)”
- 行動(dòng) 3: 搜索 Front Row (software)
- 觀察 3: Front Row是一款已停產(chǎn)的媒體中心軟件……
- 思考 4: Front Row(軟件)可以通過(guò)Apple Remote或鍵盤(pán)功能鍵來(lái)控制。
- 行動(dòng) 4: 輸出 鍵盤(pán)功能鍵。
案例中re-act基于目的“找出Apple Remote最初設(shè)計(jì)的媒體中心程序”,模型自行計(jì)劃、推理、執(zhí)行了四個(gè)步驟。
- 搜索[Apple Remote],知道程序名稱是[Front Row]
- 搜索[Front Row],但是未找到對(duì)應(yīng)的軟件。但是需要搜索 Front Row (software)
- 搜索 Front Row (software),找到了控制方式
- 告知結(jié)果:輸出控制方式鍵
在這個(gè)過(guò)程中,我們有幾個(gè)發(fā)現(xiàn)
- 推理過(guò)程圍繞始終圍繞著目標(biāo)“找出Apple Remote最初設(shè)計(jì)的媒體中心程序”進(jìn)行
- 推理過(guò)程需要頻繁的與外界交互(類似于多輪對(duì)話一樣,搜索收集信息,觀察解決問(wèn)題)
- 推理過(guò)程類似于 執(zhí)行 一個(gè) SOP流程
ReAct 模式的核心是將觀察結(jié)果提供給 LLM,使其能夠更新其上下文窗口。該模型重新評(píng)估信息并根據(jù)這些見(jiàn)解采取行動(dòng)以提高其推理能力。同時(shí)將單個(gè)推理步驟嵌入在對(duì)話的提示。
OK,那是否可以將Re-Act 與企業(yè)的SOP流程結(jié)合,然后讓模型去執(zhí)行標(biāo)準(zhǔn)的SOP流程
三、方案:Re-Act + SOP流程,讓模型來(lái)控制sop流程
如何實(shí)現(xiàn)?對(duì)re-act執(zhí)行過(guò)程進(jìn)行變更
- 1、將推理目標(biāo)(用戶提供)變?yōu)?企業(yè)預(yù)設(shè)目標(biāo),比如”目標(biāo)解決退換貨問(wèn)題、留咨詢問(wèn)題、商品推薦”。非用戶提供的提問(wèn)
- 2、將模型執(zhí)行推理的流程,變更為預(yù)設(shè)的SOP流程;
1. 方案的關(guān)鍵步驟如下
- 定義任務(wù)目標(biāo)::企業(yè) 明確要解決的任務(wù)是什么
- 預(yù)設(shè)推理軌跡(one shot):設(shè)計(jì)一個(gè)推理sop軌跡,描述如何一步一步地進(jìn)行推理和決策、執(zhí)行sop
- 借助 ReAct 的 思考、行動(dòng)和觀察的離散推理能力,與外界進(jìn)行互動(dòng)執(zhí)行sop的流程
2. 使用的優(yōu)勢(shì)
- ReAct 可以幫助語(yǔ)言模型進(jìn)行更復(fù)雜的推理和決策
- 流程sop(one shot) 為模型的行為提供一定解釋性,和可控性
- 可以支持語(yǔ)言模型與外部環(huán)境的交互(即用戶多輪對(duì)話,實(shí)現(xiàn)一個(gè)目標(biāo))
四、落地效果檢驗(yàn)分析
我們以簡(jiǎn)單的TFlow留咨詢場(chǎng)景例(注流程只需要用文本描述,不需要work flow),問(wèn)答效果如下:
1. Re-Act + SOP流程的推理過(guò)程復(fù)盤(pán)
Agent任務(wù)執(zhí)行前提:
1)Agent的目標(biāo):解答用戶疑問(wèn),引導(dǎo)用戶留咨
2)推理過(guò)程示例 (One Shot):
- 理解用戶的疑問(wèn)
- 查詢知識(shí)庫(kù)中產(chǎn)品手冊(cè)、了解對(duì)應(yīng)的解決方法
- 解答用戶的疑問(wèn),并用戶提供姓名、聯(lián)系方式、公司名稱
- 將信息插入 到 CRM系統(tǒng)中
第一輪的推理:
1)用戶輸入:能介紹一下產(chǎn)品嗎?
2)模型處理:
- 觀察:能介紹一下產(chǎn)品嗎?
- 思考:用戶詢問(wèn)了關(guān)于產(chǎn)品的介紹,我需要調(diào)用知識(shí)庫(kù)接口來(lái)查詢并解答。
- 行動(dòng):調(diào)用知識(shí)庫(kù)
第二輪的推理
1)知識(shí)庫(kù)返回:
「同時(shí)相較于第二代客服機(jī)器人,TFlow不只體現(xiàn)在具備情感,使用成本大幅度降低。與市面上常見(jiàn)的14999元/個(gè)、24999元/個(gè)、外加會(huì)話包計(jì)費(fèi)方式的客服機(jī)器人相比,TFlow直接免費(fèi)提供機(jī)器人服務(wù),只按照實(shí)際消耗量收取token費(fèi)用,費(fèi)用多少由需求量說(shuō)了算。小企業(yè)使用一個(gè)月的費(fèi)用可能不超過(guò)50元,就可以享受24小時(shí)無(wú)間斷的客戶服務(wù)。讓大模型真正的實(shí)現(xiàn)降本增效的目標(biāo)」
2)模型處理:
- 觀察:用戶問(wèn)題+知識(shí)庫(kù)的答案
- 思考:根據(jù)知識(shí)庫(kù)提供的信息,我已經(jīng)了解了TFlow產(chǎn)品的介紹?,F(xiàn)在我將簡(jiǎn)潔地回復(fù)用戶,并引導(dǎo)用戶提供姓名、電話號(hào)碼和公司名稱
- 行動(dòng):回復(fù)用戶“TFlow是一款智能客服機(jī)器人,具備情感且使用成本大幅降低。它提供24小時(shí)無(wú)間斷的客戶服務(wù),并可根據(jù)實(shí)際消耗量收取token費(fèi)用。同時(shí),TFlow支持多模態(tài)消息處理,并對(duì)接主流SaaS平臺(tái)。請(qǐng)問(wèn)您方便留下您的姓名、電話號(hào)碼和公司名稱嗎?“
第三輪的推理
1)用戶輸入:曹操
2)模型處理:
- 觀察:曹操
- 思考:用戶已經(jīng)提供了姓名,但還沒(méi)有提供電話號(hào)碼和公司名稱。接下來(lái),我將繼續(xù)引導(dǎo)用戶提供這些信息。
- 行動(dòng):回復(fù)用戶?!案兄x您的回復(fù),曹操先生。為了更好地為您提供服務(wù),請(qǐng)問(wèn)您能留下您的電話號(hào)碼和公司名稱嗎?”
第四輪的推理:
1)用戶輸入:今天天氣怎么樣?
2)模型處理:
- 觀察:今天天氣怎么樣?
- 思考:用戶的問(wèn)題與TFlow產(chǎn)品無(wú)關(guān),因此我不進(jìn)行解答,而是繼續(xù)引導(dǎo)用戶提供電話號(hào)碼和公司名稱。
- 行動(dòng):回復(fù)用戶。“非常抱歉,關(guān)于天氣的問(wèn)題我無(wú)法直接回答。但為了更好地為您提供TFlow產(chǎn)品的服務(wù),請(qǐng)問(wèn)您能留下您的電話號(hào)碼和公司名稱嗎?”
第五輪的推理:
1)用戶輸入:13018920000
2)模型處理:
- 觀察:13018920000
- 思考:用戶已經(jīng)提供了電話號(hào)碼,但還沒(méi)有提供公司名稱。接下來(lái),我將繼續(xù)引導(dǎo)用戶提供公司名稱。
- 行動(dòng):回復(fù)用戶?!案兄x您的回復(fù),曹操先生。為了完善您的信息,請(qǐng)問(wèn)您能告訴我您的公司名稱嗎?”
第六輪的推理
1)用戶輸入:網(wǎng)易云商
2)模型處理:
- 觀察:網(wǎng)易云商
- 思考:用戶已經(jīng)提供了姓名、電話號(hào)碼和公司名稱,現(xiàn)在我將調(diào)用留咨接口將這些信息保存到數(shù)據(jù)庫(kù),并告知用戶留咨成功。
- 行動(dòng):調(diào)用CRM接口
第七輪的推理
1)接口返回:’Operation succeeded’, ‘code’: 200
2)模型處理:
- 觀察:’Operation succeeded’, ‘code’: 200
- 思考:留咨成功,我將告知用戶銷(xiāo)售人員將在24小時(shí)內(nèi)聯(lián)系他。
- 行動(dòng):回復(fù)用戶?!傲糇沙晒?!我們的銷(xiāo)售人員將在24小時(shí)內(nèi)與您聯(lián)系。感謝您的關(guān)注和支持!”
2. 在這個(gè)流程中我們可以看到的結(jié)論
優(yōu)勢(shì)好處:
- 多輪對(duì)話一致性:預(yù)設(shè)目標(biāo)和流程后,整個(gè)多輪對(duì)話的過(guò)程都圍繞著目標(biāo)進(jìn)行,不會(huì)進(jìn)行發(fā)散和跑偏。異常信息或者無(wú)關(guān)信息,被自動(dòng)過(guò)濾
- 推理可解釋性:模型推理的過(guò)程參考SOP的流程,調(diào)整模型的推理,只需要修改流程提示即可。
- 離散引導(dǎo):在re-act 的思考機(jī)制下,可以對(duì)于信息不完整的情況時(shí),具備自動(dòng)引導(dǎo)補(bǔ)充的能力。自動(dòng)調(diào)用CRM的外部工具。自動(dòng)和用戶互動(dòng)引導(dǎo)補(bǔ)充信息
- 靈活性:re-act自動(dòng)制定計(jì)劃,可以根據(jù)外部的信息輸入,自動(dòng)調(diào)整執(zhí)行計(jì)劃或者步驟。
通過(guò)這個(gè)方案即可實(shí)現(xiàn)Agent 控制SOP流程,從而實(shí)現(xiàn)既定目標(biāo)。對(duì)于workflow 具備很強(qiáng)的靈活性。
問(wèn)題:
- 只能執(zhí)行單一的任務(wù)目標(biāo)。
- 任務(wù)流程的描述需要抽象業(yè)務(wù)來(lái)描述。
- 和work flow、歷程畫(huà)布相比,模型存在小概率幻覺(jué)。
本文由 @易俊源 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!