AI機(jī)器人交互設(shè)計模型 (二):五大具體措施
本篇文章是系列文章“機(jī)器人高效能交互模型(被CMU和NASA多次引用)”的第二篇。點擊此處查看系列文章目錄。
人和機(jī)器人交互的首要目的是提升人與機(jī)器人團(tuán)隊協(xié)作完成任務(wù)的效率,基于這個目標(biāo),本文介紹了以下五大措施:
- 區(qū)分自動模式與手動模式
- 讓用戶直接與現(xiàn)實環(huán)境交互
- 讓用戶直接與傳感器信息交互
- 幫助用戶減少記憶成本
- 幫助用戶減少注意力成本
一、區(qū)分自動模式與手動模式
用戶操作機(jī)器人的主要模式有:
- 自動模式 (script control):為了讓機(jī)器人能夠自動運轉(zhuǎn),用戶需要對機(jī)器人的任務(wù)和工作范圍進(jìn)行預(yù)設(shè)和規(guī)劃。此時,用戶需要物理場地里的全局信息(Global)來進(jìn)行整體任務(wù)的規(guī)劃,如園區(qū)地圖,目的地分布等。通常在觸摸屏上進(jìn)行交互來進(jìn)行對機(jī)器人進(jìn)行任務(wù)規(guī)劃。
- 手動模式 (pure teleoperation):手動模式通常只是簡單的遠(yuǎn)程遙控,用戶需要知道機(jī)器人周邊的實時信息來進(jìn)行精準(zhǔn)操作,如周邊障礙物的距離。
值得注意的是:
在機(jī)器人的工作過程中,操作者和機(jī)器人會經(jīng)常有任務(wù)切換。因為對于大部分產(chǎn)品來說,AI技術(shù)還沒有成熟到“足夠替代人類”,所以用戶需要經(jīng)常干涉機(jī)器的工作任務(wù),這時用戶會切換為手動模式。當(dāng)用戶需要將機(jī)器人從自動模式切換成手動模式/遠(yuǎn)程控制模式時,這個交互應(yīng)該是零操作成本的,不猶豫的。系統(tǒng)應(yīng)該根據(jù)用戶的行為,通過恰當(dāng)?shù)乩斫庥脩粢鈭D,幫助用戶不猶豫地進(jìn)行模式切換。以幾個例子為例:
在無人車的自動探索任務(wù)中,當(dāng)機(jī)器人發(fā)現(xiàn)可疑人員,用戶(安防人員)需要切換至人工操作來遠(yuǎn)程駕駛機(jī)器人。用戶只需要撥動遙控感/鍵盤,則系統(tǒng)自動降操作模式切換為手動模式。
在自動駕駛汽車中,當(dāng)汽車進(jìn)入駕駛員認(rèn)為的不安全區(qū)域時,駕駛員需要奪回控制權(quán)。只需要將手握緊方向盤,則允許用戶進(jìn)行手動駕駛。
自動跟隨行李箱,當(dāng)旅行者覺得前方有臺階,箱子無法自行通過,旅行者想要將自動跟隨行李箱切換為普通行李箱。只需要伸手拉住拉桿,則電機(jī)自動取消動力。
當(dāng)模式進(jìn)行了切換時,系統(tǒng)需要提供一個明確的無歧義的交互反饋,告訴用戶關(guān)于模式的切換。這個模式切換的反饋是很重要的,如果機(jī)器人已經(jīng)變?yōu)槭謩幽J?,而用戶確認(rèn)為機(jī)器人仍有自動能力,則很容易發(fā)生事故。
二、直接與現(xiàn)實環(huán)境自然交互
人與AI機(jī)器人的交互應(yīng)該像人與人一樣自然。通常,人與機(jī)器人交互中,自然語言有手勢和語音:
- 語音交互:通過語音對話形式操控機(jī)器人。關(guān)于語音交互和CUI,筆者后續(xù)會有相關(guān)文章進(jìn)行介紹。
- 手勢交互 : 用戶和機(jī)器人處于近距離時,通過定義好的手勢對機(jī)器人進(jìn)行指令控制,如暫停前進(jìn),旋轉(zhuǎn)等。手勢設(shè)計的難點在于要同時降低三個指標(biāo):操作成本、記憶成本、錯誤識別率、計算難度。通常這三個參數(shù)是互相矛盾的:一個特殊的手勢通暢好擺出來,但是用戶卻很難記住反常識的特殊手勢。一個自然的動態(tài)手勢很容易用戶記憶,但是操作起來會顯得傻傻的,在公共場合不舒服。如果想讓用戶在公共場合不尷尬的進(jìn)行手勢操作,就要把手勢設(shè)計的不是很浮夸,也就是很不“顯眼”。但是這就又給計算力帶來了負(fù)擔(dān),增加了模型的訓(xùn)練難度和計算難度。
三、直接與傳感器信息交互
在機(jī)器人交互模型中一個目的是盡可能讓用戶只去關(guān)注物理環(huán)境而非機(jī)器人本身,換句話說就是盡量地讓機(jī)器人在整個交互過程中“透明化“。
自動行走的機(jī)器人通常安裝有眾多傳感器,如:攝像頭,激光雷達(dá),測距雷達(dá)、GPS等。當(dāng)用戶進(jìn)行遠(yuǎn)程控制機(jī)器人時,這些傳感器的數(shù)據(jù)是用戶獲得的關(guān)于機(jī)器人所處環(huán)境的基礎(chǔ)信息,與此同時,好的機(jī)器人系統(tǒng)應(yīng)該允許用戶直接與這些數(shù)據(jù)進(jìn)行交互。因為在操作機(jī)器人的過程中,用戶很難只是通過簡單的搖桿或鍵盤控制機(jī)器人的前進(jìn)方向和角度。因此這種交互形式下,用戶很難將他的操作指令與機(jī)器人在實際物理環(huán)境中的結(jié)果關(guān)聯(lián)起來。(HRI領(lǐng)域一個很出名的說法是“人類操作者不知道機(jī)器人的肩膀在哪里”,講的就是用戶很難真正理解機(jī)器人在真實物理環(huán)境中行動所帶來的結(jié)果)所以如果應(yīng)該盡量讓用戶忽視機(jī)器人的存在,而直接與機(jī)器人所在的物理世界產(chǎn)生交互,則會有效解決此問題:
- 局部視野指點 (Camera):操控機(jī)器人時,在交互界面中直接點擊機(jī)器人視野圖像中的某個物體,或某個位置。機(jī)器人系統(tǒng)計算出用戶所指的點在物理世界中的位置,進(jìn)而自動走到目的地。
- 局部視野審查(Camera): 當(dāng)用戶想要通過機(jī)器人更清楚地查看某個東西時,無需操控機(jī)器人朝該物體前進(jìn),而只需要在屏幕上的機(jī)器人視野中進(jìn)行放大,則機(jī)器人會自動向目的物體運動。相似,當(dāng)用戶想讓視野中看到更多物體的時候,只需要進(jìn)行縮小操作,則機(jī)器人會自動后退,讓用戶獲得一個更全面的視野。
- 全局地圖指點 (GPS) : 用戶為了讓機(jī)器人前進(jìn)至全局地圖中的某個位置,在地圖上進(jìn)行直接選擇。系統(tǒng)計算出用戶所指的點在物理世界中的位置,然后自動走到目的地。
- 直接操作距離 (Sonar) : 用戶通過直接增大超聲波/紅外傳感器數(shù)值,而讓機(jī)器人遠(yuǎn)離障礙物。用戶通過減小超聲波傳感器的數(shù)值,而讓機(jī)器人靠近該物體。
總結(jié)來說就是用戶不應(yīng)該作為傳感器數(shù)據(jù)的融合者,用戶也沒有能力將各種傳感器的數(shù)據(jù)綜合起來去感知機(jī)器人周邊的環(huán)境。用戶唯一需要做的就是表達(dá)他想在物理世界中的意圖,然后機(jī)器人系統(tǒng)自動拆分任務(wù)參數(shù)(距離和角度等)
四、幫助用戶減少記憶成本
當(dāng)用戶同時操作多個機(jī)器人時,很難順利的在不同機(jī)器人之間進(jìn)行切換。面對這種情況,系統(tǒng)需要記錄每個機(jī)器人在過去的經(jīng)歷,包括過去發(fā)生的錄像,所走的路徑,遇到的障礙物信息等。目的是讓用戶無須時刻記憶機(jī)器人的運行狀態(tài),而只關(guān)注機(jī)器人目前的現(xiàn)狀。若用戶想要回放之前機(jī)器人執(zhí)行任務(wù)時遇到的狀況,則只需要回播?;夭サ男畔⒉粌H是攝像頭視頻,也應(yīng)該包括同步的各種傳感器數(shù)據(jù)。讓操作者在回到過去后,仍然能夠理解機(jī)器人所處的物理環(huán)境。
五、幫助用戶減少注意力成本
在用戶操作機(jī)器人的過程中,交互效率的瓶頸是用戶的注意力不夠。用戶可能同時在操作多個機(jī)器人,也可能在與機(jī)器人工作的同時并行完成其它工作任務(wù)。減少機(jī)器人對操作者的關(guān)注需求成為了解決“人-機(jī)團(tuán)隊”完成任務(wù)效率的重要方向(參考《AI機(jī)器人交互設(shè)計模型 (一)評估機(jī)器人交互的七大指標(biāo)》中的“杠桿倍數(shù)”)。通過降低單個機(jī)器人對用戶的注意力的需求,從而提升“杠桿倍數(shù)”,即一個用戶可以同時操作的機(jī)器人個數(shù)。 一些例子:
- 如果用戶沒有注意到距離傳感器上的數(shù)值在一直變小,機(jī)器人很快要撞上某個障礙物,則系統(tǒng)應(yīng)該及時提醒用戶,或標(biāo)亮即將出現(xiàn)事故的傳感器數(shù)據(jù)。
- 當(dāng)用戶同時操作多個多個機(jī)器人時,當(dāng)一個機(jī)器人需要用戶的注意力,則該機(jī)器人應(yīng)該被標(biāo)注出來,為用戶提供線索。相反,如果沒有主動提醒,用戶就必須要時不時的去輪檢機(jī)器人的運行狀態(tài)。
- 當(dāng)機(jī)器人系統(tǒng)中有多個任務(wù)需要用戶去人工操作時,系統(tǒng)應(yīng)該幫助用戶管理注意力。比如幫助用戶判斷哪個任務(wù)是最緊急重要的,從而幫助用戶更高效的管理機(jī)器人去完成工作任務(wù)。
本篇文章是系列文章“機(jī)器人高效能交互模型(被CMU和NASA多次引用)”的第二篇。本系列文章介紹Olsen與Goodrich的經(jīng)典論文“Metrics for Evaluating Human-Robot Interactions” 以及Scholtz 的“Theory an Evaluation of Human Robot Interaction”。筆者畢業(yè)于歐盟創(chuàng)新技術(shù)研究院研究HCI專業(yè),最近在創(chuàng)業(yè)做低速無人車自動駕駛。近期在讀CMU和NASA的文章時,發(fā)現(xiàn)這兩篇論文被多次引用提及。仔細(xì)研究后發(fā)現(xiàn)字字干貨,于是吸收整理后輸出給大家。
相關(guān)閱讀:
AI機(jī)器人交互設(shè)計模型 (一)評估機(jī)器人交互的七大指標(biāo)
作者:石大大,知乎:石大大,微信公眾號:Thirsty
本文由 @石大大 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖由作者提供
- 目前還沒評論,等你發(fā)揮!