作家们,你的故事统计数据刚刚得到了后端提升!如果您在 4 月 20 日或之后发表了一篇报道,您可能会看到更多关于您的报道的阅读量。原因是我们已经开始从Cloudflare Analytics收集数据。我们为什么这样做?获取更准确的读者报告!
58% 的精通技术的受众屏蔽了 Google Analytics ,因此使用 Google Analytics API(就像我们以前一样)来衡量每个故事的读者人数是有问题的。 Cloudflare 的优势在于与我们网站的内容交付方式如此不可或缺,以至于他们的服务器有机会在客户端阻止流量之前记录流量。 Cloudflare 的方法将成功的请求计入提供 HTML 类型内容的 URL。通过这种方式,我们可以直接了解故事流量。
“这并不意味着你可以去找你的广告商并开始要求更多的广告收入。然而,这应该意味着您现在可以更准确地了解运行您的网站所需的实际资源需求。”
- Cloudflare 的 Matthew Prince
为什么不?嗯,一个原因是 Cloudflare 在其分析中包含更多的机器人和爬虫流量。幸运的是,我们可以通过 Cloudflare 所谓的botManagementDecision
过滤页面视图
这样流量就被认为是“可能是人类”的来源。你是读这个故事的“可能的人”吗?然后,您将计入此故事页面顶部的阅读量,作家将在他们的故事统计中看到这一点。这是 GraphQL 查询中使用的过滤器:
"pageviewsFilter": { "AND": [ { "botManagementDecision": "likely_human" }, { "datetime_geq": startDate, "datetime_leq": endDate }, { "requestSource": "eyeball" }, { "AND": [ { "edgeResponseStatus": 200, "edgeResponseContentTypeName": "html" } ] } ]
这是我第一次使用 GraphQL,虽然它看起来支持某种活文档,但我很难弄清楚如何获得我想要的数据。他们的大部分文档都集中在防火墙和威胁检测上。我最终打开了浏览器的网络选项卡,以查看在我更改过滤器时发送的请求,同时在他们自己的网站上查看他们的图表。值得庆幸的是,我能够将这些粘贴到GraphiQL中,这是一个帮助您编写查询的开源客户端,并验证我获得了与图表中相同的页面读取。
我真的很喜欢使用这些服务器日志而不是在客户端上下载和执行 javascript 的想法。它更有效,侵入性更小。从我们的网站中删除 Google Analytics 代码会很好,但我们仍然依靠它来跟踪在页面上花费的时间和一些点击事件。将其保留在网站上可能有助于搜索流量;-) 也许我们将来会在那里推出我们自己的系统。
目前我们仍然每天只获取一次统计信息,但我会更频繁地获取这些统计信息,敬请期待。好的,这就是更新,享受!你现在应该很少在你的故事中看到这些人了🙂
立即前往https://app.hackernoon.com/stats亲自查看!