一步步教你分析网站数据
可用性测试和数据分析是一对无敌好搭档,它们让我们更多地了解用户,跟踪我们的目标,解决意外的问题。说到解决问题,数据分析告诉我们哪些页面或者流程正在给用户造成麻烦,哪些领域需要我们在可用性测试中重点关注。接下来,可用性测试会告诉我们为什么用户会表现出某些特定的行为。在这两者之上,我们可以为网站拥有者提供重点明确、针对用户的建议。
在小红(和许许多多与之相似的用户体验从业人员)的例子中,数据分析能揭露用户到底是怎么访问网站的。虽然小红和客户在用户体验或顾客方面的经验可能让他们对于测试什么有了不错的假设,但对于人们是如何访问网站,数据分析展示给他们的是更为清晰、无偏见的方式。
对于任何希望通过学习一些简单的工具来读懂数据的人,数据分析可以帮助你:
识别网站上出问题的地方显露网站对于用户的吸引力测量设计上的改善带来的结果在这两篇系列文章中,我将会解释如何利用数据分析来识别用户有问题的地方,以及网站的哪些地方会从可用性测试中受益最多。本篇文章的重点为——三个识别网站问题的参数:跳出和退出率(bounce and exit rate),页面平均时间(average time on page)和目标价值(page value)。在第二部分,我们会进一步利用这些参数来识别drop off points,然后我们会深入到数据分段(segmentation)来获取额外的细节信息。
辨认问题网页(组)作为一名自由职业者和用户体验咨询师,我与各种各样不同领域的网站合作过,其过程非常一致,总是以数据分析为开端。最开始我会去辨认每天有多少用户访问这个网站,哪个页面最常用。这会给我一个大概的感觉,知道人们是如何访问这个网站的。然后我会进行下一步:辨认潜在的出问题的领域,继而知道我的用户体验建议将会着重在哪一块。
总体来说,我会观察三种类型的参数来辨认问题所在:
跳出和退出率(Bounce and exit rate)页面平均时间(Average time on page)目标价值(Page value)跳出和退出率(Bounce and Exit Rate)
跳出率和退出率是两个可能造成混淆的参数。跳出率是只访问了网站的一个页面的用户的比例:在一个页面登陆,但是没有去访问任何其他页面就离开了网站。
【译者注:谷歌官方解释为“跳出率指单页访问次数(即访问者从入口页离开网站而未与网页互动的访问次数)所占的百分比”。】
退出率是从一个页面离开了网站的用户的比例(它包括了那些之前在该网站浏览了其他页面的人)。
【译者注:谷歌官方解释为“退出百分比指从某个或某组特定网页退出网站的次数所占的百分比”。】
如果我发现了网站的一部分出现了一个很高的跳出或者退出率,我会做上笔记,以防某些页面的什么东西造成了用户的离开。一个有着高跳出率的页面可能说明这个页面上的内容不是用户来到这个页面所期望看到的东西。一个高退出率的页面可能说明这个网页导致了用户在他们想要的流程中半途而废——从另一方面看,如果一个高退出率的页面是流程的最后一页,那么这个高退出率就不再是个问题了。
用谷歌分析(Google Analytics)中的“加权排序(weighted sort)”会让跳出率更加有用。根据谷歌分析,“加权排序把百分比数据根据重要程度排列,而不是序号排列”。举个例子,一个页面虽然有着100%的跳出率,但在过去的一个月中,只有一个用户访问,然后离开了该页面(另外一个更大的问题可能是没有任何人访问过这个页面!)。如果一个页面有80%的跳出率,但是是一个在流程中非常关键的起始页面,那么这个网站可能因此流失了大量的生意。为了更好地为页面可用性测试做准备,我们必须辨认出问题出现的原因:是因为没有人访问这个页面,还是每个访问的人都马上离开了网站?
页面平均时间(Average Time on Page)
“页面平均时间”是指用户浏览某个页面所花费的平均时间。如果我发现有一个页面的“页面平均时间”很低,这可能意味着该页面没有引起用户足够的注意。从另一反面来看,如果用户在一个结账页面停留很久,那么可能是因为该页面过于复杂了。当然,所有的参数都必须放在具体的情境下分析;如果一个博客文章有一个很高的“页面平均时间”,那么总体来说是一个好的现象,因为这可能意味着用户真的在阅读整篇文章。
另外一个衡量页面表现的非常好的方式是利用“与网站平均数比较”的选项。这个图会显示某些页面在某个参数上是不是在很大程度上高于或者低于平均值。虽然这些页面仍然需要一页一页地分析,因为不同的页面有用不同的目标,但是低于平均浏览时间的页面总体来说可能会有问题,假设目标是为了让用户继续阅读的话。下面的例子清晰地表现出“联系(contact)”页面相对来说有比平均值更低的浏览时间,然而“博客(blog)”页面有高于平均值80%的时间。
再次强调下,情境是关键。用户可能来到联系页面来寻找一个公司的地址,或者联系电话。如果他们成功地找到了,那么他们就会离开该网站,因此较低的页面浏览时间在这里是一个好的现象,说明页面很有用。一个“博客”页面是用来吸引用户的注意的,因此一个高于平均值的时间可以被看做是一件好事。
页面价值(Page value)
“页面价值”是一个非常重要,但是很少被用到的参数,它可以用来发现表现欠佳的页面。目标价值,就如它的名字所示,是一种赋予页面直接的货币价值的方式。对于电子商务网站来说,它纳入了各种各样的交易收入总数和所有类型的网页的目标价值——这些参数都需要在谷歌分析中人工设置,才能计算出页面价值。一个高价值的页面往往显示出它是一个重要的页面,意味着该页面值得被纳入可用性测试中。
一个高价值但是展示出高退出率的页面是值得重视和改进的。意味着这些页面让用户在回话流程的关键位置离开了。在下面的的例子中(一个电子商务网站),我突出显示了三个有着类似的页面价值的品类。可以清楚地看到,“个性化化玩具(personalised-toys)”的产品页面有一个相当高的退出率。这说明这个高价值的页面正在让用户“流失”,并且应该在未来的用户体验设计工作中引起重视。
然而,单独的某个页面只能展示部分真相。“内容分组(content grouping)”这个功能很重要,我们可以利用它来观察网站的某个部分表现如何。内容分组可以把数据根据用户访问的页面种类来进行分类,因此十分必要。我们可以用各种各样的方式来分组。比如对于一个买衣服的网站来说,可以根据不同种类的服饰来分组,看看裤子是不是比衬衫的页面价值要高。
一旦发现某个页面或者某个组的页面价值很低,下一步我们要做的就是:找出背后的原因。在上面的例子中,衬衫相对来说有比较低的价值。我采取的第一步行动是,根据我的经验和判断力,看看在衬衫的页面上有没有任何明显的用户体验或者技术方面的问题。做完这个之后,我会和真实的用户一起来测试这些个页面,来看看为什么会有这些问题——并且寻找那些暗含了修复方式的线索。
内容分组是一个非常强大的工具,可以让你看到网站的不同部分的真实表现。
在实践中利用参数
这只是利用数据分析来发现网站问题的第一步。在本系列的第二部分中,我们会着眼于如何发现用户流程中的流失点,以及如何把用户分类来看到更多的细节信息。
与此同时,你尝试着利用在本篇文章中学到的方法来发现可能存在的问题:
调出跳出率,找出那些用户访问并且马上离开了的页面。浏览所有页面的退出率,找出在流程的哪些地方用户离开了网站。考虑到用户在页面平均停留时间的重要性——一个拥有着高跳出率的博客页面,同时拥有着很长的平均页面时间,这是一件好事!根据页面价值排序,观察页面。页面价值越高,那么就越值得被纳入可用性测试,从而最终修复用户在该页面遇到的问题。在上一个客户的案例中,小红利用数据分析来发现那些需要进行可用性测试的地方。然而目前为止,小红只发现了网站中值得测试的单独的页面和页面组。她觉得她需要知道更多的关于最常见的用户行程(user journey)的信息。她还想更加深入地理解用户,看看不同类型的用户如何访问网站。为了能进行最佳的可用性测试,小红真心想要知道人们事实上是如何使用网站的。
简单来说,数据分析是一种用来发现可用性测试最佳测试页面的极好的方法。在本系列文章的第一部分,我讲解了如何利用数据分析来发现网站的问题所在之处。这么做可以让我们更好地理解目前的用户行为,并且帮助我们集中力量在将要测试的任务上。
在如何利用数据分析来指导可用性测试的这一系列文章的总结部分,我将更仔细地探讨如何通过识别用户行程、将用户分类来比较不同的用户组的行为。
识别流失点知道用户是如何在整个网站中流转的可以增加单个页面状态的情境(context)。比如,分析用户行程中前一个页面的数据可以帮助我们识别为什么某个特定页面的退出率特别高。另外,找出最常见的用户行程对于谋划可用性测试很有好处。可用性测试可根据这些常见的用户行程来设计,从而确保在测试中用户的行为是和已经存在的用户行为是相符的。
谷歌分析尝试通过用户流程图(user flow)和行为流程图(behavior flow)报告来展示用户行程。他们可能比较难阅读,并且经常因为把多个页面组合在了一起而变得很麻烦。这意味着谷歌分析通常只能把最为普遍的几个页面单独展示,而把其他的页面组合在一起,显示为“大于100个页面”——这对我们一点帮助也没有。下面的截图显示出这种非常局限的信息是如何让分析变得困难的:只有几个页面在每个用户行程的阶段中是单独被显示的,剩下的页面都被组合在了一起。
尽管页面被组合造成了很多问题,花些时间分析这些报告仍然可以帮我们发现问题区域,根据的是流失率或意想不到的用户行程(比如,我们本来期待的是这样,但用户却走向了另一个方向?)。一旦我们发现了问题区域,我们就可以谋划可用性测试,来看看用户在整个行程中是如何思考的,了解他们为什么会有这些麻烦。
在谷歌分析的用户流程和行为流程报告中,所有的页面用了绿色的矩形来表示,灰色的连接线用来表示页面之间的用户行程。每个矩形还用红色表示了流失率的百分比(也就是说用户正离开网站)。它们可以说明常见的用户行程,以及用户在哪些地方离开了网站——也是另一种问题区域的迹象。
下面的例子来自于一个我曾经工作过的旅行网站。它在主页有一个特别明显的搜索框。
在这个简化了的并加上了笔记的图中,我们可以看到一个可能的问题。用户利用搜索框来找到某个旅行目的地,但之后又从搜索结果页面回到了主页(又名,弹簧跳(pogo sticking)),说明了搜索结果对用户来说不够满意。这可能归结于许多的理由:可能搜索功能经常搜不出结果,搜到太多结果,或者太少结果。也可能这个问题和搜索结果本身无关,而是其他的理由,比如搜索结果里的酒店的价格太高了。
数据显示最初的搜索是让用户不满意的,这让我决定针对搜索框来进行一些可用性测试。可用性测试的结果显示,问题的原因在于搜索结果太多太泛了,用户被大量的结果淹没了。根据这个测试结果,我建议引入一个多面搜索系统(faceted search system):在搜索结果页面让用户可以根据一些标准来过滤搜索结果,而不用返回到主页重新搜索。这个新的搜索系统让用户可以根据酒店提供的服务设施来过滤他们的搜索结果;比如是否有游泳池、健身房和其他的设施,这意味着用户可以发现对他们自身有用的结果。这个设计方案让搜索后又回到主页的用户数量大幅度下降,让更多的用户进入到他们行程的下一步。
上面的结果显示的是多面搜索系统被引进一个月后的分析数据。图中显示出,主页和搜索结果页面之间的“弹簧跳”现象减少了。虽然仍然还有改进的空间,但这个变化产生的积极效应是非常鼓舞人心的。
数据分段,更多的细节数据分段为观察不同用户的不同行为提供了一个绝佳的方式。一个简单的例子就是比较新用户和回访用户。下面的图来自于一个在线找工作网站,它显示出新用户的数量在该月几乎是持平的,然而回访用户的数量却跟随了一个不同的模式:在周末的时候数量明显下降。
这使我想知道更多的细节,关于新用户和回访用户的不同点。其他关于这两种不同用户的数据显示出,回访用户倾向于在网站上花费更多的时间,每段时间会浏览更多的页面,并且更倾向于申请工作。
根据这个数据我可以做出假设:回访用户更可能是真正找工作的人,但新用户访问网站的时候更随意。因此我推荐网站做一些个性化的设计——对待新用户,展示更多的保证信息,说明该找工作的网站是合法的、值得信赖的,并且引导他们简单快速地做出行动,比如注册工作提醒。对待回访用户,展示更精确、细节的搜索工作的选项,并且提供信息鼓励他们申请工作。
新用户和回访用户不同的行为可以透露许多事情,取决于网站的类型。比如,对一个电子商务网站来说,它显示回到这个网站的人更倾向于下单。如果这是真的话,那么我们可以把重点放到帮助第一次访问网站的用户下单。
这种数据分段分析还可以帮助可用性测试的招募。如果在新用户和回访用户之间有明显的行为区别,那么可能最好同时招募已有用户和尚未访问过该网站的用户来进行测试。测试不同的用户类型可以帮助解释为什么他们在网站上有迥然不同的行为。
除了上说例子中的新用户和回访用户,在谷歌分析上还有一些现成的数据分段方式来帮助我们分隔数据,包括:
不同的流量来源——可以用来发现那些通过搜索和链接来到网站的用户的区别。使用不同设备类型的用户——可以用来比较使用手机、平板和桌面电脑用户的参数。根据自己的需求来改造分段方式也是很好的方法,这可以使分段方式可以和整个网站重要的用户及角色更好地相符合。通过这种方法,我们可以分析这些不同的用户群所采取的不同的用户行程,例如,比较已有用户和第一次购买的用户的行程。
数据分段可以被用来观察使用不同设备的用户的行程。根据手平板和桌面电脑来分段可以提供三个不同的行为流程供研究。这种方法对于发现使用不同设备的用户可能存在的问题特别有帮助。手机用户的行为流程图可能会在用户流程中显示出一个重大的流失点,但在平板和桌面电脑中却不是问题。这应当引出相应的手机端的可用性测试,重点放在找出手机用户在流程中的该点流失的原因。
现在该怎么办?在利用数据分析识别问题区域后,下一步就是找到为什么用户会有这些问题。数据分析能够提供一些关键的地方,需要我们在可用性测试中特别关注,或者拆分出特别的测试。作为用户体验的职业人,我们自然而然地想要和我们的用户在一起,在可用性测试中从他们身上学到东西。数据分析只是帮助我们更好地进行测试。
尝试一下——提取一些这里提到的方法,把它们应用到某个项目中。你会惊奇地发现,我们竟然可以从数据分析中发现这么多东西。、