Introduction 介绍 在这个系列的最后一部分,我问, “ ”这导致了与菲利普·摩尔(Philip Moore)的对话。 谁创立了GizmoData,在那里他正在做一些相当迷人的项目。一个是GizmoEdge,我可能会在未来写,而另一个是GizmoSQL,这篇文章的主题。 什么是DBC? 沃尔特数据 什么是DBC? 沃尔特数据 Background 背景 首先,GizmoSQL是一个开源的SQL数据库引擎和服务器,由 和 什么是 DuckDB?这是我的。 它是一个开源的进程分析数据库引擎,用于OLAP工作负载,直接在应用程序中执行复杂的SQL查询,而不需要单独的服务器。 杜克DB Apache Arrow Flight SQL 首页 » 什么是...... » 文章 杜克DB Apache 箭头飞行 SQL 首页 » 什么是...... » 文章 Apache Arrow Flight SQL 是一个基于 Arrow Flight RPC 的协议,允许客户端对远程数据库服务器执行标准 SQL 查询,结果以高效的 Arrow columnar in-memory 格式传输,为分析工作负载提供高输出、低延迟的数据传输,方便与 Arrow 生态系统如 Pandas、Polar、DuckDB 和支持该协议的数据平台无缝集成。 Apache Arrow Flight SQL是Apache Arrow生态系统的一部分,它本身是一个跨语言的内存分析平台,提供了一个标准化的列存储格式,在系统和编程语言之间移动数据时消除序列化和 deserialization,允许零副本读取和高效的数据共享。 这就是一切,一些相当酷的,潜在的困惑的技术,让您沉浸在其中,这就是GizmoSQL变得有趣的原因:获得这种力量并减少复杂性。 What is GizmoSQL? 什么是 GizmoSQL? 破碎到基本上,GizmoSQL是一个运行DuckDB的小服务器,Arrow Flight SQL协议包裹在它的周围,所以你可以远程运行DuckDB。为什么你想这么做?DuckDB是一个很棒的引擎;你可以在笔记本电脑上运行它,并处理数十亿行,例如。 有了所有这些背景,是时候挖掘大量的屏幕截图了。 Digging in 挖掘在 有一个 在我们的第一个屏幕截图中,这是你第一次登入时的默认视图,你可以简单地执行查询,这里有一个细微的小功能是你的查询历史,其中包括执行时间。你可以看到我已经做了一些事情,但也注意到仅仅点击历史上的查询会将其加载回SQL窗口,无需复制/粘贴。 免费Demo 免费Demo 这里的客户表有150万行,我写了一个查询来计算所有c_nationkey为15的记录,它在154ms内返回了60,000。 我们将尝试 Query 22 全球销售机会: 您可以看到它在不到一秒钟内执行,并且正在进行大量的处理,这非常令人印象深刻。 它在半秒钟内结束了,这只是疯狂的速度。 我从上世纪80年代开始就一直在做这样的事情,这让我想起数据库技术是如何演变的。我们曾经不得不玩很多技巧来让事情运行得快,但花了几个小时的运行并不罕见。 Summary 摘要 GizmoData在这里做的是结合一些技术,在上面做了一些创新,并制作了一个愚蠢的简单产品,为您提供令人难以置信的速度和易用性。 是的,是的,但它也不同于Arrow Flight SQL是如何集成的。这适合你的堆栈吗?这取决于你决定,当然,但有相当好的集成和适配器选择,为你打开东西。 母子 母子 这是聪明的,我喜欢聪明的东西. 如果我仍然在私营部门,我会一直使用这种东西。 想閱讀更多關於我的“什麼是屁股??”系列?下面是一個方便的列表: 什么是 DuckDB? 什么是Malloy的背影? 什么是PRQL的背影? 什么是GlareDB? 海底隧道是什么? 什么是LanceDB? 到底什么是SDF? 什么样的背影是Paimon? 什么是Heck Proton? 什么是 PuppyGraph? 什么是GPTScript? 什么是 WarpStream? 什么是DeltaStream? 什么是OpenMetadata? 什么是DBC? 什么是 DuckDB? 什么是Malloy的背影? 什么是PRQL的背影? 什么是GlareDB? 海底隧道是什么? 什么是LanceDB? 到底什么是SDF? 什么样的背影是Paimon? 什么是Heck Proton? 什么是 PuppyGraph? 什么是GPTScript? 什么是 WarpStream? 什么是DeltaStream? 什么是OpenMetadata? 什么是DBC?