為什么網(wǎng)站項(xiàng)目只需測(cè)試5個(gè)用戶

2011-11-30 10:47:32來(lái)源：譯言網(wǎng)作者：舒心翻譯

人們總是認(rèn)為，用戶測(cè)試是一個(gè)復(fù)雜且代價(jià)昂貴的事情。一個(gè)網(wǎng)站設(shè)計(jì)項(xiàng)目需要一個(gè)龐大的預(yù)算和長(zhǎng)長(zhǎng)的時(shí)間表。其實(shí)，可用性測(cè)試并非如大多數(shù)人認(rèn)為的是浪費(fèi)資源的事情。在你可承受的測(cè)試成本范圍內(nèi)，使用不超過(guò)5個(gè)用戶

人們總是認(rèn)為，用戶測(cè)試是一個(gè)復(fù)雜且代價(jià)昂貴的事情。一個(gè)網(wǎng)站設(shè)計(jì)項(xiàng)目需要一個(gè)龐大的預(yù)算和長(zhǎng)長(zhǎng)的時(shí)間表。其實(shí)，可用性測(cè)試并非如大多數(shù)人認(rèn)為的是浪費(fèi)資源的事情。在你可承受的測(cè)試成本范圍內(nèi)，使用不超過(guò)5個(gè)用戶，即可達(dá)到很好的測(cè)試效果。

最初的研究過(guò)程中，Tom Landauer 和我得出了一個(gè) 可用性測(cè)試方面的，關(guān)于測(cè)試人員的數(shù)量的公式：

假設(shè)一個(gè)可用性測(cè)試的測(cè)試人員數(shù)量為n，N為所有可用性測(cè)試發(fā)現(xiàn)的問(wèn)題總數(shù)，L是單個(gè)測(cè)試人員的問(wèn)題發(fā)現(xiàn)率。

N(1-(1-L)n)

我們發(fā)現(xiàn)，大多數(shù)項(xiàng)目的平均的問(wèn)題發(fā)現(xiàn)率為31%。當(dāng) L=31%時(shí)，可以得到如下的圖形：

當(dāng)用戶為零時(shí)，發(fā)現(xiàn)的問(wèn)題數(shù)目是零，即“零用戶零發(fā)現(xiàn)”。我們可以看到，第一個(gè)用戶幾乎發(fā)現(xiàn)的三分之一的設(shè)計(jì)的可用性的問(wèn)題，和零發(fā)現(xiàn)截然不同。當(dāng)我們看第二個(gè)用戶的測(cè)試情況時(shí)，可以發(fā)現(xiàn)，有一部分問(wèn)題是和第一個(gè)user重合的。人們之間的行為或發(fā)現(xiàn)有一定的差異，第二個(gè)user可以發(fā)現(xiàn)一些不同于第一個(gè) user的問(wèn)題，有區(qū)別于第一個(gè)用戶的新發(fā)現(xiàn)，但是問(wèn)題數(shù)量不及第一個(gè)用戶的最初發(fā)現(xiàn)。第三個(gè)用戶做了很多前兩者重復(fù)的事情，有些甚至重復(fù)2次。另外，當(dāng)然，第三個(gè)用戶本身異能發(fā)現(xiàn)少量的新問(wèn)題，顯然數(shù)量遠(yuǎn)遠(yuǎn)不及前兩個(gè)用戶。

現(xiàn)在，加入更多的測(cè)試人員(user)，你會(huì)發(fā)現(xiàn)一個(gè)現(xiàn)象，隨著人數(shù)的增加，重復(fù)的事情一再出現(xiàn)，發(fā)現(xiàn)的新問(wèn)題發(fā)現(xiàn)率開(kāi)始下降。顯然不再需要讓更多的人來(lái)重復(fù)發(fā)現(xiàn)重復(fù)的問(wèn)題，自然回回去重新設(shè)計(jì)，以解決發(fā)現(xiàn)問(wèn)題。

到了第5個(gè)user，你就是在浪費(fèi)時(shí)間，去做重復(fù)的事情，并且?guī)缀踉贈(zèng)]有先的發(fā)現(xiàn)。

迭代設(shè)計(jì)

上圖中的曲線很清除地標(biāo)明，至少需要15個(gè)用戶去發(fā)現(xiàn)所有的設(shè)計(jì)中的可用性問(wèn)題。但是，為什么我更傾向于推薦用更少的測(cè)試人員呢?一個(gè)主要的原因是合理分配可用性測(cè)試的預(yù)算。讓我們看看，當(dāng)你招聘15個(gè)客戶代表來(lái)對(duì)你的設(shè)計(jì)進(jìn)行測(cè)試時(shí)，就一位著你得花費(fèi)5個(gè)用戶的3倍的費(fèi)用!

當(dāng)我們?nèi)プ鲇脩舻目捎眯詼y(cè)試時(shí)，最終的目標(biāo)是為了解決或者提高實(shí)際的設(shè)計(jì)，而不是僅僅得到一份書(shū)面的報(bào)告。當(dāng)5個(gè)用戶的首次測(cè)試發(fā)現(xiàn)了85%的可用性問(wèn)題時(shí)，你已經(jīng)可以在下一個(gè)desagn中修復(fù)這些問(wèn)題。

如果想發(fā)現(xiàn)更多的問(wèn)題，當(dāng)然需要再次測(cè)試。即使我說(shuō)重新設(shè)計(jì)可以修復(fù)第一次測(cè)試時(shí)發(fā)現(xiàn)的問(wèn)題，事實(shí)是你可能認(rèn)為新的設(shè)計(jì)可以客服已有的問(wèn)題。但是，在沒(méi)有人能設(shè)計(jì)出更完美的用戶界面之前，無(wú)法保證新的設(shè)計(jì)可以修復(fù)事實(shí)存在的問(wèn)題。第二次測(cè)試可以回歸已有的問(wèn)題，確認(rèn)是否修復(fù)。同時(shí)，一個(gè)新的設(shè)計(jì)，意味著還需要一次新的用戶測(cè)試。

5個(gè)用戶的第二次測(cè)試，可以發(fā)現(xiàn)第一次測(cè)試時(shí)遺留的15%的問(wèn)題。(仍舊會(huì)有2%的問(wèn)題遺留要等到第三次測(cè)試來(lái)發(fā)現(xiàn))。

最終，第二次測(cè)試的深度可以設(shè)計(jì)到網(wǎng)站的設(shè)計(jì)架構(gòu)，獲取到我們所需的一些信息，如體系架構(gòu)、任務(wù)流程等是否符合客戶需求。這些問(wèn)題常常在隱藏在一些表面的可用性問(wèn)題之后，而為人們所忽略。

所以，第二次的測(cè)試作為第一次測(cè)試的質(zhì)量保障，并且可以發(fā)現(xiàn)更深入的問(wèn)題。第二次測(cè)試會(huì)為系統(tǒng)的重新設(shè)計(jì)提供一份新的問(wèn)題清單，但數(shù)量顯然會(huì)少于第一次測(cè)試。但是，本次測(cè)試并不能完全補(bǔ)充第一次測(cè)試，還需要第三次的測(cè)試來(lái)進(jìn)行查漏補(bǔ)缺。

5個(gè)用戶三次的最終測(cè)試效果要遠(yuǎn)高于15個(gè)用戶測(cè)試一次的效果。

為什么不建議單用戶的測(cè)試?單個(gè)人的行為總會(huì)有一些風(fēng)險(xiǎn)，人總會(huì)有一些意外的，不確定的行為。

你可能會(huì)認(rèn)為15個(gè)用戶做一輪測(cè)試，比5個(gè)用戶做3輪要好。因?yàn)榍€表明，第一個(gè)用戶的發(fā)現(xiàn)率明顯高于后續(xù)的用戶，但是，為什么我們要堅(jiān)持多輪測(cè)試?兩個(gè)原因：第一，通過(guò)觀察3個(gè)人就可以看到用戶行為的多樣性，可以洞察到那些行為是獨(dú)特的那些是可以一概而論的;第二，用戶測(cè)試的成本效益分析表明，3-5個(gè)測(cè)試用戶的最佳比例，依賴于測(cè)試的風(fēng)格。初始的運(yùn)行成本和測(cè)試計(jì)劃相關(guān)，多個(gè)用戶對(duì)于降低最初的成本效果更好。

什么時(shí)候增加更多的測(cè)試用戶

當(dāng)你的網(wǎng)站客戶群覆蓋到幾個(gè)不同高度的用戶群時(shí)，你需要增加更多的測(cè)試用戶。上面公式的適用于網(wǎng)站的用戶群接近或者差異很小時(shí)。舉個(gè)例子，當(dāng)你的網(wǎng)站客戶群是定位于父母和孩子時(shí)，你就需要充分考慮到兩個(gè)不同群里的使用行為。系統(tǒng)的相同之處是對(duì)于采購(gòu)代理商的銷售人員之間的連接。

甚至當(dāng)用戶群體差異性完全不同時(shí)，在兩類人之間也可發(fā)現(xiàn)很多相似之處。畢竟，所有的用戶都是人。所有的可用性問(wèn)題反應(yīng)的都是人的行為與網(wǎng)站之間的互動(dòng)和影響。

在測(cè)試不同的用戶群時(shí)，你不需要每個(gè)用戶群中都有很多測(cè)試人員(user)，有以下的一個(gè)測(cè)試人員數(shù)目就足夠了：1、如果測(cè)試兩個(gè)用戶群，則每類群需要 3-4個(gè)用戶;2、如果測(cè)試3個(gè)或更多的用戶群，則每類有3個(gè)測(cè)試用戶就可以了(至少3個(gè)users就可以確保你覆蓋到某一個(gè)用戶群中的不同的行為)

參考：Nielsen, Jakob, and Landauer, Thomas K.: "A mathematical model of the finding of usability problems," Proceedings of ACM INTERCHI'93 Conference (Amsterdam, The Netherlands, 24-29 April 1993), pp. 206-213.

原作者： Jakob Nielsen
原文鏈接：Why You Only Need to Test with 5 Users

關(guān)鍵詞：網(wǎng)站項(xiàng)目產(chǎn)品測(cè)試

為什么網(wǎng)站項(xiàng)目只需測(cè)試5個(gè)用戶

相關(guān)閱讀: