paint-brush
使用这些工具和技术尽早建立您的数据团队经过@courier
403 讀數
403 讀數

使用这些工具和技术尽早建立您的数据团队

经过 Courier6m2023/02/21
Read on Terminal Reader

太長; 讀書

尽快开始构建您的数据策略团队和架构。随着您的成长,单人数据团队可以对您的成功产生巨大影响。聘请一位全才,他可以创建数据洞察力、制定业务假设并从头开始创建可扩展的数据架构。
featured image - 使用这些工具和技术尽早建立您的数据团队
Courier HackerNoon profile picture
0-item

您真的不能太早投资于数据团队。这是我们作为一个规模虽小但不断壮大的团队学到的东西。我们在早期投资了一个数据团队,这样我们就可以建立产品使用趋势,创造业务洞察力,并确定需要改进我们产品的领域。

如果您是早期创业公司,请尽快开始构建您的数据策略团队和架构。您不必做大——一个人的数据团队可以随着您的成长对您的成功产生巨大影响。

首先雇用通才

在启动您的数据团队时,您可能会想从尽可能大的品牌中聘请专家。我们的建议:找一个有早期创业经验并且也处理过大规模数据的人。


大型企业数据团队中有很多头脑聪明的优秀人才,但这些大型团队通常让员工专门负责其数据平台的特定部分。当您的团队中有 10 名数据工程师,或者当您有一个由机器学习数据科学家组成的大型团队来研究定价算法时,这就有意义了。但是,当您在整个组织中只有一个数据角色时,您需要一个可以做所有事情的人。


重要的是首先要聘请一位能够创建数据洞察力、制定业务假设并从头开始创建可扩展数据架构的全才。您需要准备好从头开始构建数据团队的人,最好是可以在您准备好后雇用团队其他成员的人。


第一位雇员应该是有在早期创业公司建立(或至少从事)数据团队经验的人。他们需要能够快速创造价值,并具备提出正确问题的商业头脑。他们应该能够以 80/20 的方式处理数据以立即提供结果,而不是深入研究您遇到的最棘手的问题。


对于数据工程方面,通常会聘请顾问或承包商来帮助设置您的架构。我们决定用顾问补充我们的第一个雇员。这样,我们就拥有了两全其美的优势——兼职数据工程专家和可以日常维护数据架构的通才。我们建立了坚实的基础,并将我们的知识保留在内部。

一个小数据团队可以回答大问题

即使您不能立即聘用您希望在数据团队中长期担任的所有角色,您也可以只聘请一两个合适的人做很多事情。关键是考虑可扩展性和效率。什么可以帮助您的数据团队事半功倍?当你的团队更大时,这将如何运作?


对于小型数据团队,可扩展分析极其重要。通过提前考虑您的流程和工作流将如何随着团队的发展而发挥作用,您将节省时间并为员工最耗时的一些问题创建有价值的解决方案。


例如,我们立即意识到我们的销售团队无法了解潜在客户的产品使用情况,而且这种情况会经常出现。因此,我们为销售代表构建了一个工作区破折号,这样他们就可以自己提取数据。我们的数据团队的工作是实现数据驱动的决策。当我们看到一次性数据投资的机会可以在销售方面节省数百小时时,我们就采取了行动。


一个小型数据团队也应该专注于防止未来出现问题。如果你目前只有一个人的数据团队,让他们专注于你最大的问题,但也要预算时间来维护和扩展你的数据架构以减少技术债务。

我们的数据团队使用的工具

从一开始,我们的目标就是对每一个决定都具有前瞻性。


像所有初创公司一样,我们希望立即产生投资回报率。我们使用集中式数据仓库作为我们唯一的真实来源——没有什么比零散或不可信的数据更能伤害数据团队了。由于自动化和集成,我们能够整合我们的数据。


这有助于我们以较低的升幅为整个公司提供有价值的见解。


数据工具

我们使用 Segment(这也是我们的数据收集工具)、Fivetran 和 Snowflake 外部阶段等 ELT 工具输入所有数据。


我们用数据库将我们所有的原始数据清理成更有用的格式。例如,我们的 dim_user 表有大约 20 个表在幕后为其提供支持,其中有很多关于我们客户的关键信息,例如他们发送了多少通知以及他们使用的计划类型。通过使其如此容易获得,我们的非技术用户可以快速获得业务洞察力。我们可以快速查看发送大量通知的非付费或自助服务客户,以确定业务合同前景。我们的客户成功团队还构建了报告来查看我们的业务合同客户的健康状况。我们还使用 dbt 清理我们的敏感信息数据。


我们使用 Census 将我们的仓库数据发送回 HubSpot 和 Courier 等地方。这使我们的销售和营销团队能够在他们每天使用的平台上访问这些信息。


Metabase 是我们的 BI 工具。它允许我们创建仪表板、编写 SQL 查询并为非技术用户提供自助服务格式。我们发现,创建这些类型的自助式数据仪表板可以让用户自己回答很多问题。他们可以快速启动,而无需像使用 Looker 或 Tableau 的团队那样预先进行大量投资。


例如,我们有一个 KPI 破折号,显示整个公司的最高指标。我们还可以跟踪各个工作空间的执行情况,并确定我们可以为销售团队定位的工作空间。我们还通过深入了解客户的产品使用情况,将数据驱动的决策引入到我们的产品开发中。一个例子是,我们发现我们的很多用户都在创建他们自己的 Courier 实例,而不是加入他们同事现有的 Courier 实例。利用这种洞察力,我们的产品团队回到绘图板创建一个页面,该页面显示由同一企业电子邮件域创建的 Courier 工作区,以便您可以轻松请求访问。


数据信使工作区


我们还使用 Propel 为我们的应用内分析提供支持,为我们的最终用户提供可见性。我们使用 Propel 的一种方式是为我们的业务层客户提供模板分析。 Propel 允许我们的工程师轻松地将 GraphQL 可视化置于我们仓库的指标之上。


数据信使分析

我们的数据团队再次进化

现在,我们正在进入一个增长期,所以很自然地,我们正在再次发展我们的数据方法。我们当前的目标是使我们的数据科学家能够建立主题专业知识,同时仍保持集中的数据标准。


我们目前的结构是集中的,高级分析工程师向数据主管报告。它现在有效,因为我们仍处于构建数据团队的早期阶段。但是当团队扩大时,我们将过渡到混合模型。


数据科学家将涵盖某些业务领域(如产品团队),但他们仍将向数据主管汇报。随着我们的不断发展,这将使数据科学家能够建立主题专业知识,同时仍然保持集中的数据标准。由于数据团队将始终与组织的其他部分一起变化和成长,因此您需要能够随业务扩展的标准。


如果您想了解更多关于我们如何处理数据标准化的信息,请查看我们的博客文章Courier 如何符合 HIPAA 标准.