paint-brush
避免数据网格采用的陷阱经过@liorb
1,495 讀數
1,495 讀數

避免数据网格采用的陷阱

经过 Lior Barak6m2024/02/20
Read on Terminal Reader

太長; 讀書

想象一下,数据团队拥有和共享数据,就像厨师合作制作美味佳肴一样。听起来不错,但要小心!如果没有明确的所有权、培训和治理,您的数据厨房就会变成厨房噩梦。本文将指导您应对关键挑战,并帮助您顺利完成米其林星级数据之旅!
featured image - 避免数据网格采用的陷阱
Lior Barak HackerNoon profile picture
0-item
1-item
2-item

您是负责实施令人兴奋但具有挑战性的数据网格方法的数据领导者吗?作为数据领导者,我们认识到传统的集中式数据管理的局限性。缓慢的决策、孤立的信息和有限的敏捷性阻碍了我们有效利用数据的能力。输入数据网格:向去中心化所有权和协作的有希望的范式转变。想象一下,让主题专家能够拥有和管理他们的数据,培养更深层次的责任和更快的洞察力。然而,实现这种理想的平衡需要仔细的规划和执行。


本文深入探讨了我在数据网格之旅中遇到的常见障碍,为您提供克服这些障碍的知识。最后,您将做好充分准备开始成功实施,使您的团队能够释放数据的全部潜力,并为整个组织提供变革性的见解。


Zhamak Dehghani本人表示,“数据网格的最大挑战是定义明确的所有权边界。这不仅仅是为每个人提供访问权限,还要确保对数据的问责和责任。否则,你最终会得到混乱且相互矛盾的事实版本。”

厨房是有规矩的,当他们通过队伍时,厨师会在他们身后尖叫是有原因的


想象一下戈登拉姆齐冲进一家餐厅,期待着一群精疲力竭的快餐厨师团队提供米其林星级的执行力,而这些厨师从未见过高端厨房的压力。这就是许多组织在没有适当支持的情况下一头扎进数据网格时所酿成的混乱灾难。


戈登·拉姆齐 烹饪 GIF


他们没有赋予团队权力,而是释放了数据无政府状态。想象一下,将未经训练的厨师扔进五星级厨房,每个人都以有限的技能随意投入食材。混乱爆发,质量直线下降,业务陷入困境。当组织在实施数据网格之前缺乏强大的学习计划和数据策略时,就会发生这种情况。


如果没有适当的培训,即使是才华横溢的厨师也会在压力下举步维艰。同样,期望团队在没有正确技能和知识的情况下掌握数据所有权和分散决策会导致混乱、不一致,并最终导致数据驱动的消化不良。昨天他们致力于前端功能,今天突然他们需要根据他们触发的事件构建数据产品。


强大的数据策略就像餐厅的菜单,清晰地概述了目标、角色和期望。组织需要投资数据素养计划,为团队提供在分散厨房中蓬勃发展的技能和知识。


数据网格不仅仅是分发数据源;这是为了培养协作和卓越的文化。如果没有正确的培训和清晰的愿景,您的数据之旅可能最终看起来更像是厨房噩梦,而不是米其林星级的成功故事。


清晰的所有权和衡量标准:

不要只是“交出数据”而不定义边界和期望。将其视为提供指导方针,而不仅仅是组件。建立明确的所有权、角色和成功指标,以避免计划脱节,并确保每个人都处理相同的数据。


许多领导者将数据网格误解为简单地将数据所有权移交给各个团队而没有适当的支持。执行团队需要围绕它构建框架,不,我现在不呼吁人们聘请首席数据官(CDO),我认为这是高级管理人员试图推卸责任的不良行为。我希望执行团队能够参与决定组织使用的数据的真正来源。组织的目标是什么,如何评估为什么它朝着正确的方向前进或不正确,并与人们分享?然后确定你的一个真正的数据来源,我并不期望执行团队处理数据湖的决定,或者使用数据工具A或B,期望的是明确如何衡量成功

执行团队需要做什么,利奥尔·巴拉克 (Lior Barak)



如果执行团队避免这样做,就会酿成灾难。想象一下,每个团队都使用自己的元素和理解来准备自己的数据,没有统一的品味或衡量标准。管理人员需要定义所需的“风味”(业务目标)并建立 KPI 来监控成功情况,防止数据混乱和“FOMO 驱动”指标使情况变得模糊。


  • “数据网格并不是解决数据质量问题的灵丹妙药。如果输入的是不良数据,即使所有权分散,仍然会输出不良数据。数据治理和质量标准仍然至关重要。” - Hilary Mason,数据科学家兼作家


通过培训赋权

释放未经训练的厨师会导致灾难。投资数据素养计划,为团队提供在分散厨房中蓬勃发展的技能。请记住,戈登拉姆齐训练他的团队 - 不要跳过这关键的一步!


确保他们了解他们需要使用的工具,我记得几个月前与一位产品负责人进行的一次指导会议,他要求了解什么是数据产品,他是前端团队的一员,有一天他的经理告诉他从现在开始,他拥有了他的活动的数据产品,可怜的 PM 非常迷失,甚至不知道需要做什么,在吸引和增加用户转化方面,他是一位很棒的 PM,但他所理解的是什么根据他所解雇的事件创建数据产品。组织经常在没有明确的数据策略的情况下进入数据网格,就像开一家餐馆而不知道提供什么菜肴一样。定义的数据策略充当菜单,识别关键数据源并使每个人朝着共同目标前进。


派你的前端工程师去发现他们可以使用什么工具将数据发送到数据湖,然后还期望他们用它来构建表格,而不给他们提供标准化的工具和教育,这样的效果不会很好,而且你会拖很多时间。数据质量问题。


“最大的障碍不是技术,而是组织文化的改变。从集中式、自上而下的方法转向分散式、自助服务的方法需要进行重大的思维转变,而这种转变可能会遇到阻力。”—— Adrian Colyer,信息实验室联合创始人


数据治理是秘诀

不要低估数据治理的重要性。这就像有一个明确的菜单,确保每个人都使用正确的食材并以一致的质量进行烹饪。通过建立明确的指南和标准来避免数据孤岛和混乱。


没有采用数据契约(包括模式验证方法)的组织将遭受垃圾数据的困扰,非常简单,最重要的部分是拥有一个团队,可以构建工具来创建数据生态系统中的流程,从分析师的请求到数据生产者,以及从数据生产者到分析师和数据消费者的数据中创建的更改。


设置数据治理是在厨房中创建这种订单的关键,并不是说现在每个人都从不同的提供商处订购咖喱粉,然后味道就会不同

拥抱你的工具

Excel 表格是上等香料!专注于增强数据文化和协作,而不是工具势利。请记住,数据网格意味着团队拥有自己的声音并有效地做出贡献,无论他们使用什么工具。我记得过去我读过有关 Netflix 的文章,我说他们疯了吗?他们为什么拥有 Tableau、MicroStrategy 和 PowerBI,是因为他们无法为组织决定使用哪种工具吗?好吧,我对数据网格一无所知,这很可能是原因。


Excel 表格?无汗!拥抱数据网格的“Mise en Place”

遗留系统、有限的工具和数据质量障碍可能感觉像是厨房的噩梦。但不要害怕,数据厨师!忘掉工具势利吧。无论您的团队使用 Excel 工作表还是 Tableau,Data Mesh 都旨在增强他们的数据文化并使他们的声音与组织保持一致。也许 CRM 团队更关注内容质量而不是转化率。这就是数据网格的实际应用!团队可以进行自我评估,但要理解公司可能会以不同的方式评估绩效。


可以把它想象成“mise en place” ,这是一个法语烹饪术语,指的是在烹饪前准备食材。强大的数据策略列出了要素(数据源、治理),确保每个人都使用相同的语言并有效做出贡献。

向其他厨房学习

了解类似组织面临的共同障碍会有所帮助。想象一下厨师们分享他们的“厨房火灾”故事并从彼此的错误中学习。通过强调这些挑战和潜在的解决方案,我们可以帮助其他人避免类似的陷阱。


数据网格不仅仅是打开厨房的大门;这是关于创建一个协调良好的烹饪整体。学习他人的“厨房火灾”故事,采用有用的工具和资源,最重要的是,以开放的心态和协作精神处理数据网格。因此,抛弃平淡无奇,拥抱辛辣,准备一份由数据驱动的杰作,挑逗每个人的味蕾!