各种关键的数字服务 - 包括流媒体服务,其视频内容的目录非常大,或提供有关其分析信息的数据服务 - 利用多种依赖的系统或机器在分布式计算的傘下表现为群集。 然而,这种能力带来了成本 - 分布式系统是资源拥挤或简单地过度工程 - 它们实际上可以非常低效。 机器学习不仅仅是一个幻想的口号;机器学习是一个有用的工具来预测需求,改善现有业务流程,并最终开发的分布式系统,不仅工作,但工作。 The Data Deluge: Too Much Information, Too Little Time 数据洪水:太多的信息,太少的时间 在过去的十年中,我们生成的数字数据量大幅增加,每天我们生成超过2500万字节的数据!我们不能再以同样的方式分析,存储或理解数据,我们曾经使用过或在这个规模上。在这个规模和结构下思考,工作和理解数据给我们带来了一系列技术问题,我们将不得不考虑长期,我们应该开发解决方案,使我们能够积极利用它来训练我们的模型。在分布式系统中工作使我们的尝试变得复杂;我们不仅有数据的大小要关系,但我们也与分布式图像有关 - 多台机器的组织或担保,多个网站,多个用户负载和复杂的系统用户负载与它们的互动有关。 Breaking Down Data Silos 破解数据硅 数据,其中数据被存储在一个或另一个系统中,该系统可以或不能在该系统之外做什么。来自所有来源的数据点可能具有高度不一致的基线质量或产品差异。对(传统)分析方法的压力将给您的数据分析平台和努力带来相当大的挑战,最终导致您登录到确保只访问“好”或好数据的潜在风险! 这种类型的数据通常会挑战传统的单台机器学习方法。关于这些数据的一种思维方式是通过分布式机器学习。想象在课堂上向一组学生分享知识,而不是每个学生一次。 Smarter Data Centers: Intelligent Decisions Drive Sustainability 数据中心是连接世界的重要组成部分,通过增加资源和能源消耗来增加全球应用和服务的访问量。历史上,运营管理导致了对工作时间的关注,现在我们正在看到一个更可持续的运营管理模式的转变。边缘计算 - 根据定义是更接近创建边缘的处理 - 提供了资源利用,优化和韧性 / 可持续性之间的效率更大的机会。 Optimizing Resource Allocation 优化资源配置 ML模型可以预测CPU处理所需的工作负载;此外,它们可以建议配置工作负载以最大限度地减少能耗和优化总体利用 - 而不是在“盲目”的条件下运作并不必要地添加额外的资源,所有在CPU处理中。 Final Thoughts: From Science Fiction to Engineering Reality 最后的想法:从科幻小说到工程现实 我们曾经只想过这些事情会发生 - 在科幻小说中。未来实际上是现在;机器学习和Gigabit分布式计算是真实的。 机器学习不仅仅是效率。事实上,机器学习正在改变我们对计算的看法。机器学习正在为分布式系统带来更高的速度,智能和思考力。智能的维度将决定我们开始构建具有不同的智能、多维元素的数字生态系统时,谁会繁荣或挣扎。 未来发生――现在,在现在。