关于我们

ABOUT US

可用性评估与度量的方法

* 来源: * 作者: admin * 发表时间: 2020-04-08 12:07:35 * 浏览: 305

这篇文章的主要目的是介绍可用性评估不同的实施方式,以及各自的优缺点及应用场景。 并且针对「可用性度量」进行初步的探讨。

在ISO/IEC 25066中描述了进行可用性评估最常用的两个方式:用户测试和专家评估。这两种方式主要是针对产品使用的有效性、效率、满意度,以及影响产品可用性的其他特征进行了评估。

[公式]

这张表格很全面地分析了产品可用性评估的多种方法。我来逐以解释一下:

方法(1)与(2)是以专家的视角,基于一定的可用性选择以及专家自身经验,对产品可用性进行评估。这对专家的经验与能力有较高的要求,在本篇文章中暂不细讲。

方法(3)是大家较为熟悉的和常用的轻量级、低成本可用性评估方法。产品交付团队中的设计师往往会在的产品迭代前,针对产品的一个或多个功能模块组织小规模的吉林可用性测试。在这个过程中,会邀请4-6个目标用户对产品进行操作,设计师通过观察用户行为与收集用户的定性反馈来进行可用性的评估。

方法(4)和(5)与方法三有所不同,它们采用了定量的方式对可用性进行了度量,这类度量往往需要邀请至少20名的用户参与测试才能保证结果数据具有统计显著性(statistic significance)。从目前的实践上看,很少的企业会选择去定量地来度量可用性。 为什么?因为大部分的企业在产品可用性的领域投资很少,在这么有限的资金条件下,产品团队往往选择跳过定量的研究方式,而选择更容易实施的定性研究,而这种方式也能够获得更高的回报。毕竟,想要对设计进行提升,洞察往往比数字更重要。

那么,定量的可用性度量的价值是什么呢?

我们不妨先来设想一下这样的一个场景:

某企业的主要产品是一款线上订票APP,产品上线了一年,正在进行不断的测试、认知、开发迭代。为了让用户更好地使用产品,产品经理与设计师常常会组织小规模的吉林可用性测试,就产品的设计缺陷、性能问题等收集反馈,不断进行调优。

但是,团队也常常会遇到一些困扰,有时候产品经理、设计师、开发等角色之间就一些产品的可用性问题与决策产生许多困惑,甚至吵得不可开交,比如:

  • 测试过程中收集了很多用户的反馈与行为记录,但哪些才是能够帮助我们决策的关键信息?
  • 这几版设计用户褒贬不一,到底要选择哪个版本比较合适?
  • 设计稿不断修改,但如何知道可用性是提升了还是下降,要提升到什么程度才是个尽头?
  • 大家对吉林可用性测试的结果都有不同的理解与解读,对产品改进方向也有不一样的意见。

为了解决这些问题,团队开始尝试将定量的度量方式加入可用性的评估过程中:

首先,他们对产品可用性建立了基本的度量的纬度,将 “有效性、效率、满意度“ 作为定量数据采集的三大维度。

其次,他们结合了产品的特性与业务场景,为每个纬度设计了多项子纬度,以及具体的数据采集方法,举个例子:

[公式]

最后,他们为了能够让采集的数据可被评价,于是参考了以往测试的经验以及行业的标准等,为这些子纬度分别确立了「度量指标」,比如,“用户完成整个订票操作的时间必须要3分钟以内”。这些度量指标能够帮助团队对测试数据有更清楚的认知, 也直接反应了产品当前的水平。

总结一下,「可用性度量」给团队带来的变化是:

  • 明确产品可用性应该关注的纬度,并帮助团队通过客观的数据快速诊断、追溯产品可用性的问题。
  • 持续跟踪产品的可用性,了解迭代过程中产品可用性水平。
  • 评估产品是否达到标准。通过定量的数据搭建产品基准线,为决策者为产品的Stop/Go做决策依据。
  • 帮助进行产品对比。包括不同版本迭代对比、与行业竞品对比、与基准线对比等。

当然,有了这些定量度量的方法,并不意味着就可以抛弃定性的数据。就像一开始所讲的,洞察有时候比数值更重要。 产品团队应该做到的是将两种方式适当结合,结合定性与定量数据进行分析。

下一条: 工效学