日本久久午夜不卡免费，一色屋成人精品视频在线，暖暖免费日本视频，国产色视频一区二区三区，国产三级国产精品国产国在线观看，亚洲精品无码专区在线观看，18精品久久久无码午夜福利，国内精品视频一区国产

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

可用性測(cè)試：任務(wù)評(píng)估模型與計(jì)量方式

cyan_zheng

2017-07-23

4 評(píng)論 15728 瀏覽 92 收藏

15 分鐘

在可用性測(cè)試中，如何去評(píng)估測(cè)試的場(chǎng)景或流程呢？應(yīng)該包含哪些維度？每個(gè)維度要如何測(cè)量？怎樣在不同的任務(wù)間做橫向?qū)Ρ?？本文作者將與你分享，enjoy~

公司的產(chǎn)品最近發(fā)布了一個(gè)版本，上線了比較多的新功能，所以需要針對(duì)這些新功能做一輪可用性測(cè)試。

可用性測(cè)試算是用研的一個(gè)入門級(jí)技能，即使是從業(yè)年限不多的我也已經(jīng)做過多次，基本的方法和流程都比較熟悉了。但是之前做過的可用性測(cè)試有個(gè)缺陷：沒有建立一個(gè)嚴(yán)謹(jǐn)、科學(xué)的任務(wù)評(píng)估模型。在可用性測(cè)試中，如何去評(píng)估測(cè)試的場(chǎng)景或流程呢？應(yīng)該包含哪些維度？每個(gè)維度要如何測(cè)量？怎樣在不同的任務(wù)間做橫向?qū)Ρ龋?/p>

在這次可用性測(cè)試的規(guī)劃階段，我花了些時(shí)間查閱資料，考慮合適的評(píng)估模型和方法。下面介紹最終使用的評(píng)估模型，拋磚引玉，如有更好的經(jīng)驗(yàn)方法希望不吝賜教。

評(píng)估模型

ISO9241中對(duì)“可用性”的定義是：特定用戶在特定的使用場(chǎng)景中，為了達(dá)到特定目標(biāo)而使用某產(chǎn)品時(shí)，所感受到的有效性、效率和滿意度。

也就是說，在定義好了用戶、場(chǎng)景和目標(biāo)的前提下，可用性包含了下面三個(gè)維度：

有效性（Effectiveness）：用戶完成特定目標(biāo)的正確和完整程度。
效率（Efficiency）：用戶完成特定目標(biāo)的效率，與消耗的資源（如時(shí)間）成反比。
滿意度（Satisfaction）：用戶使用產(chǎn)品時(shí)感受到的主觀滿意程度。

良好的可用性必須能夠同時(shí)滿足有效性、效率和滿意度三個(gè)條件；但是這三個(gè)維度也有層次之分，一般來說，有效性問題>效率問題>滿意度問題。

在可用性測(cè)試中，僅僅了解每個(gè)功能的可用性水平還不夠。即使兩個(gè)功能的可用性水平一樣，若一個(gè)是產(chǎn)品的基本功能、一個(gè)是價(jià)值不大的邊緣功能，我們還是需要優(yōu)先去優(yōu)化價(jià)值更高的功能。也就是說，在評(píng)估一個(gè)任務(wù)時(shí)，除了可用性之外我們還需要考慮功能本身的價(jià)值。尤其是在上線了新功能，或者我們對(duì)待測(cè)功能的價(jià)值還不太確信的時(shí)候。

功能的價(jià)值可以簡(jiǎn)單分為兩部分：用戶價(jià)值和商業(yè)價(jià)值。盡管有時(shí)候需要在商業(yè)價(jià)值和用戶價(jià)值之間權(quán)衡，但是作為一個(gè)體驗(yàn)導(dǎo)向的產(chǎn)品，還是應(yīng)該將用戶價(jià)值放在第一位。在用戶價(jià)值之上，若能夠滿足商業(yè)價(jià)值，則是更令人滿意的結(jié)果。

所以，在可用性測(cè)試中，可以用下面這個(gè)模型來對(duì)測(cè)試的任務(wù)進(jìn)行評(píng)估：

測(cè)量方法

在上述模型中，有效性、效率、滿意度都是常見的評(píng)估維度，有一些經(jīng)驗(yàn)方法可以參考；用戶價(jià)值也可以通過用戶評(píng)價(jià)獲得。而商業(yè)價(jià)值則需要根據(jù)產(chǎn)品的實(shí)際情況進(jìn)行評(píng)估，并且這一般是既有的知識(shí)，不需要在可用性測(cè)試過程中收集這個(gè)數(shù)據(jù)。因此在可用性測(cè)試中我們需要收集的數(shù)據(jù)就只包含四個(gè)維度：有效性、效率、滿意度和用戶價(jià)值。

有效性

可以用任務(wù)的完成情況來評(píng)估有效性，這個(gè)數(shù)據(jù)通過觀察用戶的操作過程即可獲得。

任務(wù)完成情況的測(cè)量主要參考NNG的建議，將每個(gè)用戶的操作結(jié)果標(biāo)記為失敗、部分完成或全部完成。

（1）失敗

如果用戶認(rèn)為自己完成不了而放棄了任務(wù)，或者超過了限定時(shí)間仍然無法完成任務(wù)，則標(biāo)記為失敗。

需要對(duì)每個(gè)任務(wù)都設(shè)置一個(gè)限定時(shí)間。要求對(duì)功能非常熟悉的人（相關(guān)的產(chǎn)品、設(shè)計(jì)師都可以）按照任務(wù)提示進(jìn)行操作，記錄完成操作所需的時(shí)間，稱為熟練用時(shí)。如果想要提高熟練用時(shí)的測(cè)量準(zhǔn)確度，可以多找?guī)讉€(gè)熟手操作然后取其用時(shí)平均值。任務(wù)的限定時(shí)間根據(jù)熟練用時(shí)確定，一般是熟練用時(shí)的3-10倍，但是最高也不要超過10分鐘（沒有用戶會(huì)有耐心花10分鐘完成一個(gè)任務(wù)，如果真的需要這么久，說明任務(wù)設(shè)計(jì)得太復(fù)雜了）?？梢愿鶕?jù)任務(wù)的難度確定倍數(shù)，如果任務(wù)對(duì)于小白用戶來說確實(shí)很有難度，那么可以適當(dāng)延長(zhǎng)任務(wù)限時(shí)；如果任務(wù)很簡(jiǎn)單，或者其中包含一些輸入的操作，那么可以適當(dāng)減少任務(wù)限時(shí)（因?yàn)榇蜃滞容^費(fèi)時(shí)，而且對(duì)功能熟悉的人打字未必比用戶快）。

（2）部分完成

用戶只完成了一部分的任務(wù)，沒有完成任務(wù)卡上的所有要求。比如，你希望用戶創(chuàng)建一個(gè)日程并邀請(qǐng)小王加入，用戶成功創(chuàng)建了日程但是卻不知道如何（或者忘了）邀請(qǐng)小王，這就是部分完成。之所以要區(qū)分“部分完成”這個(gè)類別，是因?yàn)樗?00%完成有差距，但是又不能與失敗混為一談。

（3）完成

這個(gè)很容易理解，就是在限定時(shí)間內(nèi)完成了任務(wù)卡上的所有要求。

最后，我們需要根據(jù)這些數(shù)據(jù)計(jì)算每個(gè)任務(wù)的成功率。NNG的建議算法是：任務(wù)成功率=(完全完成的用戶數(shù)+部分完成的用戶數(shù)*0.5)/用戶總數(shù)，即完全完成率+部分完成率的一半。

除了用完成、部分完成和失敗來評(píng)價(jià)任務(wù)完成情況外，還可以考慮另一種方式：順利完成、遇到障礙后完成、失敗。這是我之前使用的計(jì)分方式。這種方式下，以上所述的部分完成會(huì)被歸于失敗的類別（但如果用戶犯的是無傷大雅的錯(cuò)誤，比如輸入錯(cuò)誤，可以視為完成）。而成功完成的用戶會(huì)被細(xì)分為順利完成的和遇到障礙后完成的。之所以這樣區(qū)分是因?yàn)檫@兩種情況揭示了不同的可用水平——能讓用戶輕松地完成的功能可以說是相當(dāng)易用的。

效率

效率可以用時(shí)間測(cè)量，對(duì)用戶的操作過程計(jì)時(shí)。

可以從用戶拿到任務(wù)卡開始計(jì)時(shí)，在用戶宣布自己已經(jīng)完成、或者限定時(shí)間到了的時(shí)候即結(jié)束計(jì)時(shí)。不要等到用戶讀完任務(wù)卡、開始操作時(shí)才計(jì)時(shí)，因?yàn)橛械挠脩袅?xí)慣讀完再操作，有的卻喜歡一邊讀一邊做。也不要在看到用戶完成了就結(jié)束計(jì)時(shí)，而要等用戶自己認(rèn)為他已經(jīng)完成了，因?yàn)橛脩粲袝r(shí)候會(huì)在做完操作之后去檢查自己的操作是否成功了，這也應(yīng)該算作任務(wù)用時(shí)的一部分。

計(jì)時(shí)不需要太精確。手動(dòng)計(jì)時(shí)存在幾秒鐘的誤差都算是正常的，而且用戶在操作過程中多說了句話、或者應(yīng)用響應(yīng)速度慢了些，這些都會(huì)影響任務(wù)的完成時(shí)間（并且很多影響因素跟可用性并沒有關(guān)系）。所以計(jì)時(shí)只要精確到秒就好了，提高記錄的精確度也沒有意義。

在計(jì)算每個(gè)任務(wù)的效率水平的時(shí)候，可以用用戶的平均用時(shí)除以熟練用時(shí)所得的倍數(shù)表示（數(shù)值越大表示效率越低）。這是為了便于任務(wù)間的橫向比較，因?yàn)椴煌蝿?wù)的復(fù)雜度不同，A任務(wù)平均用時(shí)1分鐘、B任務(wù)平均用時(shí)4分鐘，也不能說明A的操作效率比B高。通過平均用時(shí)/熟練用時(shí)的比值，可以知道新手與熟手之間的差距，從而了解因?yàn)橄到y(tǒng)的可用性及學(xué)習(xí)成本給用戶帶來的操作時(shí)間損耗。

滿意度

滿意度涉及到用戶的主觀評(píng)價(jià)，因此需要通過用戶自評(píng)量表來收集。

這里參考的是Jakob Nielsen使用的一個(gè)單題項(xiàng)七點(diǎn)量表，并根據(jù)需要對(duì)題目進(jìn)行了修正：

用戶價(jià)值

用戶價(jià)值是指用戶感知到的功能價(jià)值，也需要通過用戶的評(píng)價(jià)獲得。

因?yàn)槲覀冏龅氖且豢钷k公軟件，所以通過詢問功能對(duì)工作的幫助來了解用戶價(jià)值：

滿意度和用戶價(jià)值都需要用戶評(píng)分，因此用戶在完成每個(gè)任務(wù)之后都會(huì)拿到同樣的兩個(gè)題目，要求對(duì)該任務(wù)做出評(píng)價(jià)。我會(huì)把不同任務(wù)的題目打印在同一張紙上，這樣用戶在評(píng)價(jià)時(shí)可以參考自己對(duì)前面的任務(wù)的評(píng)價(jià)來調(diào)整分?jǐn)?shù)。

任務(wù)橫向?qū)Ρ?/h2>
用有效性、效率、滿意度、用戶價(jià)值四個(gè)維度對(duì)任務(wù)進(jìn)行評(píng)價(jià)后，我們可以根據(jù)這些數(shù)據(jù)對(duì)不同的任務(wù)做橫向?qū)Ρ?，可以通過類似下方這樣的折線圖對(duì)比不同任務(wù)的情況。

比如從上面這個(gè)示例圖中，我們可以看到任務(wù)2的可用性水平是比較低的（有效性水平低、完成時(shí)間長(zhǎng)、用戶滿意度低），但是它的用戶價(jià)值處于相對(duì)較高的水平；而任務(wù)3的用戶價(jià)值最高，可用性水平居中。

有效性、效率和滿意度都是用來評(píng)估可用性水平的。如果根據(jù)這三個(gè)數(shù)值計(jì)算出可用性水平，直接用可用性去做橫向?qū)Ρ龋欠窀奖隳?？前文提到在可用性中，有效性問題>效率問題>滿意度問題，所以在計(jì)算可用性水平時(shí)它們應(yīng)該有不同的權(quán)重；并且由于度量方式的不同，它們的量綱有較大差異（從上圖可以看出），需要做標(biāo)準(zhǔn)化處理。

因此，我們需要對(duì)有效性、效率、滿意度分別做標(biāo)準(zhǔn)化處理，然后按照5:3:2的權(quán)重計(jì)分（或者其他權(quán)重，按需調(diào)整）：

**可用性水平=Z(有效性)0.5-Z(效率)0.3+Z(滿意度)*0.2**

（效率處用減號(hào)是因?yàn)槠溆脮r(shí)間測(cè)量，數(shù)值越大效率越低）

這樣我們得以在同個(gè)量綱上比較不同任務(wù)的可用性水平，結(jié)合對(duì)功能價(jià)值的評(píng)估，可以得出類似這樣的四象限圖：

這樣的象限圖不僅可以幫助我們比較測(cè)試的各個(gè)功能的情況，還能幫助確定體驗(yàn)優(yōu)化的優(yōu)先級(jí)。功能價(jià)值高、可用性差的功能應(yīng)該列入最高優(yōu)先級(jí)，其次是功能價(jià)值較低、可用性差的功能。

問題優(yōu)先級(jí)

除了上述的評(píng)估模型外，在可用性測(cè)試中我們還會(huì)發(fā)現(xiàn)很多可用性問題，這些問題大概是可用性測(cè)試產(chǎn)生的最重要的數(shù)據(jù)了。那么，這些可用性問題是否需要進(jìn)行優(yōu)先級(jí)評(píng)估呢？

可用性問題當(dāng)然是有優(yōu)先級(jí)之分的，一個(gè)問題是影響了功能的有效性、效率還是滿意度，就決定了這個(gè)問題的優(yōu)先級(jí)如何。我認(rèn)為可以在每個(gè)任務(wù)之內(nèi)按照這個(gè)標(biāo)準(zhǔn)對(duì)發(fā)現(xiàn)的可用性問題進(jìn)行排序，但是不需要把所有任務(wù)發(fā)現(xiàn)的所有問題羅列出來去排列優(yōu)先級(jí)。

優(yōu)化可用性問題時(shí)應(yīng)該以功能（即可用性測(cè)試中的任務(wù)）為單位，而不是以問題為單位——以問題為單位容易只見樹木不見森林，可能在修改了很多細(xì)節(jié)后仍然算不上好用。所以排列問題優(yōu)先級(jí)時(shí)，也建議根據(jù)上面的四象限圖先確定功能的優(yōu)先級(jí)，然后再去查看每個(gè)功能具體的可用性問題的優(yōu)先級(jí)。

本文由 @cyan_zheng 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

產(chǎn)品測(cè)試實(shí)用指南文章被收錄于該專欄

共 16 篇文章48454 人已學(xué)習(xí)

cyan_zheng

9篇作品 262665總閱讀量

一個(gè)方法教會(huì)你挖掘用戶痛點(diǎn)，賣爆產(chǎn)品

12-016021 瀏覽

共情B端客戶，從“讓他們少挨點(diǎn)罵”開始

12-111254 瀏覽

從0到1，讀懂活動(dòng)運(yùn)營(yíng)中臺(tái)

11-267298 瀏覽

信貸風(fēng)控和工程風(fēng)控的同一種思路

01-162708 瀏覽

全方位解讀NPS凈推薦值

11-223369 瀏覽

評(píng)論

黑眼鏡的貓

橫向任務(wù)對(duì)比——而任務(wù)3的用戶價(jià)值最高，可用性水平居中。這里是不是舉錯(cuò)例子了？

最近來自廣東回復(fù)
郭君禹

這篇方法論可用性很強(qiáng)，32個(gè)贊。最近項(xiàng)目要做α版本測(cè)試，正好拿來用一下。

最近來自廣東回復(fù)
貴子

對(duì)于樓主這篇文章要贊一個(gè)，可用性測(cè)試一般針對(duì)企業(yè)級(jí)產(chǎn)品用的比較多，畢竟用戶操作流暢度直接影響了他的工作效率，消費(fèi)級(jí)的產(chǎn)品目前國內(nèi)做的不是很多，即時(shí)做也只是類似用戶訪談，不會(huì)如此精確，一是缺乏專業(yè)訓(xùn)練，二是時(shí)間成本較高，投入產(chǎn)出比不如用戶訪談或調(diào)研直接了當(dāng)，大部分公司都沒有可用性測(cè)試，產(chǎn)品經(jīng)理疲于做版本迭代和開發(fā)撕逼，說起來都是淚。。。

最近來自江蘇回復(fù)
1. 黑眼鏡的貓回復(fù)貴子
  
  啊，那個(gè)大版本產(chǎn)品都要做可用性和易總性測(cè)試哇
  
  最近回復(fù)