在基础设施技术领域,事情发展得很快。就在不久前,人们还认为在Kubernetes上运行数据库过于棘手而不值得。但那是昨天的问题。云原生应用程序的构建者已经擅长运行有状态的工作负载,因为 Kubernetes 是一种快速高效地创建虚拟数据中心的强大方法。
上次我写这篇文章时,我稍微扩大了视野以考虑虚拟数据中心中应用程序堆栈的其他部分——特别是流式工作负载和分析。
随着这两个成为 Kubernetes 的主流,关于用例的讨论变得更加有趣。
如果我们可以访问这些基础数据工具,我们将如何处理它们?值得庆幸的是,我们不必调查得太深,因为业界已经选择了方向: AI/ML workloads 。
推动这一趋势的是需要更快、更敏捷的 MLOps 来支持
构建和维护机器学习 (ML) 模型正在走出后台,在生产中更接近用户。特征存储充当数据和机器学习模型之间的桥梁,为模型在离线和在线阶段访问数据提供一致的方式。它管理模型训练期间的数据处理需求,并在在线阶段提供对模型的低延迟实时访问。这样可以保证两个阶段的数据一致性,满足线上线下的要求。
解释器功能可以深入了解为什么为每个预测做出决定,提供特征重要性并突出模型中导致特定结果的因素。这可用于检测模型漂移和偏差,这是机器学习中一些“重要但困难”的部分。这些功能减少了 MLOps 中涉及的工作量并建立了对应用程序的信任。 KServe 最近从 Google KubeFlow 项目中分离出来,并一直
矢量相似性搜索 (VSS) 是一种机器学习工具,它增强了我们查找数据的传统方式,它使用矢量数学来查找两个事物彼此之间的“接近”程度。这是通过 K 最近邻(
结合我的
AI/ML工作负载可能是您刚刚开始探索的内容,因此现在可能是正确开始的最佳时机。提到的三个领域——特征服务、模型服务和向量相似性搜索——都包含在我与杰夫卡彭特合着的书中,“
也发布在这里。