对《Google Analytics 的 9 宗罪》的回应
我逐条回应“Google Analytics 九宗罪”: 哪些批评成立,哪些忽略了工具定位与可执行分析的核心前提。
本文写于2011年,部分内容可能已发生变化。
Search Engine Journal 今天有篇文章叫:9 sins of Google analytics。
作为一个长期关注分析的人,我想就这个话题给一些评论。
1. 数据所有权(Data ownership)
早在 2006 年,我写过一篇简单文章:Google conversion tracking pros and cons。
当时我就提到过反垄断与数据使用问题:Google 确实有可能利用 Google Analytics / conversion tracking 的数据去强化 Adwords 体系。
更具体说,Analytics 数据可以帮助 Google 推断:广告主在某类转化上平均愿意支付多少 CPC。
此外,这类数据也可能被用于像 DoubleClick Ad planner 这类免费工具,而这些工具本身也在间接推动 Google Display Network。
Google 在日常线上生活中的触达越来越深,这本身也说明它的力量越来越大。隐私议题因此会长期重要。
如果你想更系统看 Google 可能掌握什么数据,可读 Danny Dover 在 2008 年的文章:The Evil Side of Google? Exploring Google's User Data Collection。
从点击、表单、搜索,到照片、社交连接、视频、音乐、浏览习惯、电话、手机号,甚至宠物名字——都可能通过 Google 的大量服务链路被采集。
这也解释了为什么会有各种尝试入侵 Google 数据库的行为。
在这篇文变成纯隐私讨论前,转到相关一点:
“不拥有数据”还有一个现实影响:你无法按自己意愿深度定制报表,也难以把分析数据和组织内部其他工具彻底打通。
如果有 Data Warehouse,很多复杂能力都能做出来。但现实是,真正需要这种复杂度的公司占比并不高。
2. 支持有限(Limited support / client service)
这个批评是成立的。
Google Analytics 是免费产品,所以遇到问题通常要自己查资料,某种意义上也算“公平交换”。
如果你还不知道,Google 有专门的帮助站点:Google analytics support。
还有更完整的学习入口:Education center,同样是免费。
3. 报表能力一般(Mediocre reporting)
作者提到 GA 的报表能力不如某些其他工具。
我觉得这一点需要更战略化地讨论。
就我个人而言,Avinash Kaushik 是我在分析领域非常敬佩的人之一。他是 web analytics evangelist。
在《Web Analytics an hour a day》里,他讲得很清楚:
如果分析后无法触发行动(Actionable Insights),报表就是无意义的。
所以在说“GA 报表一般”之前,应该先明确:到底哪些具体报表做不出来?这些报表背后的业务动机是什么?
再下一步才是:新增能力带来的收益,是否值得对应投入。
4. 自定义变量受限(Limits to defined variables)
我对这点的看法和第 3 点类似。
确实,用 GA 去定义/修改变量并不总是“轻松”;关键词是“轻松”。
但 GA 并非不能做,它支持 custom variables。
我倾向认为自定义变量的核心动机是为了更好的 segmentation。而这方面 GA 现在已经进步很多。
过去这曾是高阶付费方案的重要卖点,但现在 GA 已经能很方便地做分群,例如:
- New visitors
- Returning visitors
- Paid Search Traffic
- Non-paid Search Traffic
- Search Traffic
- Direct Traffic
- Referral Traffic
- Visits with Conversions
- Visits with Transactions
- Mobile Traffic
- Non-bounce Visits
也可以做更高级分群:基于 Visitors、Traffic Sources、Content、E-Commerce、Systems 等维度,和 site usage、e-commerce、content、goals 等指标组合。
如果你要导出数据,可看:http://code.google.com/intl/en/apis/analytics/
5. 数据延迟(Slow data delivery)
我没有专门精测 GA 的延迟时间。
如果你的业务对“实时数据”极度敏感,那 GA 可能确实不是最优。
但就我个人使用体验,延迟不是问题。现在是 2011 年 2 月 24 日周四早上 6:34,我已经能在报表里看到当天数据。
在你决定采购 Real-time Analytics 工具前,我依旧建议借用 Avinash 的方法:把 “So What” 测试连问三次。
可参考我之前文章里提到的这个思路:So What
6. 缺少日志文件(Lack of log files)
在博客里承认“不懂”不常见,但这一条我确实不完全理解作者具体在指什么。
我个人过去没有依赖 log files 去做额外分析能力。
如果作者想表达的是“数据导出能力”,那我找到这个入口:GA 支持通过 API export the data。我本人还没完整测试过。
7. 没有蜘蛛追踪(No spiders)
我个人不太认同把“蜘蛛追踪”作为 GA 必备点。
Google 已经给站长与 SEO 人员提供了很好的工具:Google webmaster tool。
如果你真的要看爬虫行为(通常是 SEO 目的),应重点用 Webmaster Tools,而不是只靠 Analytics。
而且从技术上看,多数 JavaScript 跟踪技术都无法有效追踪爬虫,因为爬虫抓站时通常不会执行 JS。
所以不只是 GA,Omniture 和许多其他工具同样面临这个限制。
但核心是:从我角度,这并不是 GA 的主要短板。
8. 付费搜索流量被归到自然流量(Paid search traffic shown as natural)
技术上,许多跟踪系统都有这个潜在问题。
但它并不难解决:在 GA 里,你可以打开 Adwords auto-tagging(通常默认开启),或者用 URL tool builder 做手动标记,就能清晰区分 paid 与 organic。
分析工具的原理通常是识别来路(source URL)并归类到不同 bucket。
如果你不告诉工具哪部分流量来自 campaign manager 的 paid vs organic,任何系统都会“看不见”。
9. 邮件渠道收入未知(Revenue from email unknown)
这个说法让我有点担心。
按我的理解,大多数分析方案都不能“自动”识别某来源收入,通常都需要你先做好标记。
而所有主流工具(包括 GA)都提供了很简单的方法:通过 tagging 跟踪某流量源的收入、转化和电商数据。
在 GA 里同样可用 URL tool builder。
启用 E-commerce tracking 后,你可以清楚看到:销量、数量、总收入、转化来源、成交日期等。
无论是 email、banner、Facebook 还是 affiliate campaign,都能追踪。前提一样:你必须先正确识别来源并打好 tracking tag。
这也是所有跟踪技术的基本操作逻辑。
最后,我注意到 Search Engine Journal 这篇原文作者 Annie Wallace 的背景是自学 viral marketer。
所以即便其中不少观点仍可继续讨论,我也会说她这篇在“传播层面”很成功:目前已有 16 条评论、204 次 tweets、119 次 shares,未来几天可能还会继续涨。
致敬,
Chandler

