1,395 讀數

微软的牛头怪时刻

经过 Bruce Li11m2023/04/20

太長; 讀書

虽然我对微软的 OpenAI 和 GitHub 组合带来的新生产力提升感到兴奋和高兴，但我也担心一家公司可以对整个人类的集体智慧拥有如此大的影响力。希望年轻的忒修斯能够拿起开源之剑，在迷宫之外开辟新的道路，让人类的智慧自由繁荣。

牛头怪神话

这希腊神话中的牛头怪是拥有巨大力量但也有致命弱点的事物的完美例子。牛头怪是一种半人半牛的生物，力大无穷，凶猛无比。

然而，它最终被雅典英雄忒修斯打败，后者利用该生物的一个致命弱点——无法在囚禁它的迷宫中穿行——来对抗它。

现在，让我们看看这个强大的希腊神话生物与现代微软有什么关系，以及有抱负的年轻企业家如何找到方法来对抗它几乎不可逾越的力量。

微软的复兴

当 Satya Nadella 于 2014 年接任微软 CEO 时，他接手的是一家面临停滞且难以在快速发展的技术领域竞争的公司。

自那以后，纳德拉的领导被认为重振了微软，将其重点从传统操作系统和生产力软件转向云计算和人工智能。

一个很好的例子是 Office 生产力套件，以及它在纳德拉上任前后的演变情况。

Microsoft Office 于 1989 年首次推出，现已成为商业世界生产力和沟通的基石。

作为一套软件应用程序，它最初包括 Word、Excel 和 PowerPoint，但后来发展到包括其他工具，例如 Outlook、Access 和 Publisher。

Microsoft 不断努力改进和完善这些应用程序，使它们能够在市场上保持主导地位。

到 2000 年代初期，Microsoft Office 已成为文档创建、数据管理和演示文稿设计的行业标准，这一地位至今仍在继续。

2011 年，微软推出了 Office 365，这是公司业务战略的重大转变。通过过渡到基于云的订阅模式。这种模式有助于巩固微软在市场上的主导地位，同时也创造了强大的客户锁定效应。

订阅模式确保了 Microsoft 稳定的收入流，并鼓励用户留在生态系统中，因为切换到替代解决方案的成本变得更加繁琐且吸引力降低。

但微软的野心远不止 Office 365 和 Azure 云计算。

进入牛头怪

我们从希腊神话中回忆起，牛头怪之所以力大无穷，主要是因为它是半人半牛的混血生物。如果我们可以打个比方，微软是：

半人：通过 OpenAI 独家许可的人类语言和智慧

Half Bull：通过其对 GitHub 的所有权获得计算机语言和智能

我们将深入研究这些同样强大的部分以进行更深入的分析。

半人 - OpenAI 和 ChatGPT

微软对ChatGPT的发明者OpenAI的战略投资和独家授权合作，对巩固微软在人工智能领域的霸主地位起到了重要作用。

该合作伙伴关系于 2019 年宣布，帮助微软利用 OpenAI 的前沿研究开发新的 AI 技术并将其集成到其产品和服务中。

这种合作推动了微软 AI 生态系统的发展，使该公司能够在其产品中提供 AI 驱动的功能，包括 Azure AI 服务、Cortana，甚至 Office 365 应用程序。

Office 365 中 OpenAI 集成的绝对范围和异常高的速度是 Microsoft 生产力套件皇冠上的明珠，充分说明了 OpenAI 对 Microsoft 的战略重要性。

因此，在某种程度上，微软现在捕获了全部人类语言、知识和至少一些推断的智慧（一些微软研究人员称之为“AGI 的火花” ).通过与 OpenAI 的独家许可协议，它不会有任何紧密的竞争对手。

你可能会争辩说 Google 和 Meta 可能会挑战 OpenAI/Microsoft 的垄断地位，但它们各自的大型语言模型 Bard 和 LLaMA 似乎至少落后了一代人。

此外，OpenAI 已经从一个非营利组织发展成为一个上限利润组织。并且在 100 倍投资时有这个有趣的利润上限。

由于微软已经并计划向 OpenAI 注入超过 100 亿美元，你可以放心地假设 OpenAI 不会很快与微软脱离关系。

而微软总能把更多的钱“投入”到 OpenAI 而不是购买 OpenAI 的产品和服务。这将延续 OpenAI 和微软之间的共生关系。

毫不奇怪，一群非常重要的人惊慌失措地签署了一份请愿书在接下来的 6 个月内停止所有人工智能研究.

Half Bull - GitHub、Codex 和 Co-Pilot

2018 年收购和整合领先的软件开发和协作平台 GitHub，进一步扩大了微软对整个人类智能的控制。

GitHub 是所有领先开源项目的中心，您可以将其视为以计算机语言表达的人类智慧的聚合存储库，为当今世界的每个人运行一切。

我想强调 OpenAI 的 Codex 的重要性，这是一种对软件开发领域产生深远影响的高级语言模型，特别是通过与 GitHub 的 Copilot 的集成。

Codex 是 GPT-3 模型系列的一部分，能够理解和生成类似人类的文本，包括编程代码。

它解释自然语言查询并生成准确且上下文相关的代码片段的能力使其成为开发人员的宝贵工具。

GitHub 的 Copilot 利用 Codex 的功能，充当 AI 驱动的编码助手，通过提供实时建议和自动完成代码段来帮助开发人员更高效地编写代码。

Copilot 与 Codex 的集成通过减少编写代码所需的时间和精力、最大限度地减少错误并使开发人员能够专注于更高层次的设计和解决问题的任务，改变了软件开发过程。

在长时间使用 GitHub Co-Pilot 并最近将其与 ChatGPT v4 结合使用后，我才刚刚开始意识到它的巨大力量和巨大潜力。

作为一名产品经理和联合创始人，现在我可以将一个想法概念化，编写一个简洁的需求，然后让 ChatGPT 吐出一个相当不错的样板文件。

然后，在带有 GitHub Co-Pilot 的 Visual Studio Code 中，我可以在必要时修改函数和参数，微调一些控制流和业务逻辑，我在几小时内就拥有了一个完整的工作原型。

由于我不是一个真正的执业软件工程师，这样的原型制作会花费我 1-2 周的黑客时间或乞求一些软件工程师来处理它。

与真正的“无代码”软件开发运动相距不远，这种运动将在甚至不了解现有计算机编程语言基础知识的人们中蓬勃发展。

对于经验丰富的软件工程师来说，据称通过 GitHub Co-Pilot 和 chatGPT v4 的结合，生产力提高了 3 倍甚至 10 倍。

这些工具可以轻松找到设计模式来自 GitHub 的巨大存储库，并适合开发人员当前正在使用的软件系统的上下文。

它节省了大量的谷歌搜索，减少了输入和错误检查，并自动化了大量的文档和测试。一位工程师甚至感叹，当 GitHub Co-Pilot 离线几个小时时，他就像失去了一只手臂。

牛头怪的潜在危险

谷歌的使命是“组织全球信息，使人人皆可访问并从中受益”，它通过在所有网站上进行基本的 PageRank 并为它们建立一个巨大的索引来实现这一目标。

但是有了微软/OpenAI 的 GPT 大语言模型和 GitHub codex，世界上的信息可能会被浓缩成数十亿和数万亿的权重（形象地说，是统计重要性的数字）。

就在那时，我突然意识到我们已经进入了微软的牛头怪时刻。

微软与 OpenAI 根深蒂固的关系引发了人们对该公司利用其联合力量在人工智能领域创造垄断的可能性的担忧。

OpenAI 的 GPT-4 语言模型是当今世界上最强大的人工智能系统之一，GitHub 是世界上最大的代码托管平台。

如果微软使用这些工具来扼杀竞争，它可能会对人工智能和整个科技行业的发展产生重大影响。

需要注意的是，这些只是担忧，并没有证据表明微软打算以垄断的方式使用其联合力量。

但是，了解此举的潜在危险并确保微软不会滥用权力至关重要。

忒修斯（和初创公司）的希望

站在巨人的肩膀上创新

初创公司可以利用大公司的平台，利用这些平台提供的资源、基础设施和用户群，在新产品上进行创新。以下是以往成功案例的一些示例：

Apple App Store 和 Google Play Store：通过在这些平台上构建应用程序，初创公司可以进入广阔的智能手机用户市场，轻松分销他们的产品，并从应用程序商店的安全支付系统中获益。
Amazon Web Services (AWS)：初创公司可以利用 AWS 的云计算基础架构来构建和扩展其应用程序、存储数据和访问高级分析工具。这使他们能够专注于创新和产品开发，而不必担心投资和管理自己的 IT 基础架构。

通过利用大公司的平台，初创公司可以获得资源、基础设施和用户群，否则很难或昂贵地获得这些资源。这使他们能够专注于创新和产品开发，从而增加在竞争激烈的市场中取得成功的机会。

我们已经见证了人工智能工具和解决方案的寒武纪大爆发。没有一天没有雄心勃勃的初创公司宣布将 OpenAI 的 GPT 与新数据集（法律、金融）、其他 AI 模型（语音识别、图像识别）、其他生成 AI 解决方案（语音合成、文本到-图像和文本到视频），等等。

寻求主权者的帮助

在第 3 方营利性平台上构建的主要风险之一是该平台可能会发生变化、消亡，甚至与自己的生态系统合作伙伴竞争。一个例子是 Facebook vs Zynga，而另一个例子是主要社交网络对不同意识形态的去平台化。

因此，企业家可能会在不寻常的地方寻求帮助：政府和监管机构来阻止任何反竞争行为。而且他们或许可以从之前科技领域的反垄断诉讼中吸取教训。

在公开场合玩游戏

开源一直是对抗大型闭源巨石的可靠和真正的武器。由于 OpenAI 已经对其 GPT-3 和 GPT-4 模型进行了闭源，Meta 做了一个非典型的举动，开源了自己的名为 LLaMA 的大型语言模型用于研究目的。

这是迄今为止最先进的开源 LLM，在 1.4 万亿个单词上训练了多达 650 亿个权重。

更有趣的是，Meta 还开源了 7、13 和 330 亿权重模型。这些较小的 LLM 使许多研究团队能够基于 LLaMA 提出自己的微调模型。

仅举几例：斯坦福大学的羊驼、伯克利大学的骆马和考拉、GPT4All 等等。

通过人类反馈使用强化学习，这些研究工作声称他们可以达到商业 ChatGPT 3.5（1750 亿权重）90-95% 的性能，而权重仅为 70 亿或 130 亿。

当您拥有这些较小的 LLM 模型和优化的 C++ 实现时，例如美洲驼.cpp ，突然之间，您可以在笔记本电脑上本地运行这些模型。您现在拥有一个在本地运行的智能助手，它不依赖于云服务且无需任何费用。

LLaMA 模型仅用于研究，因此您不能将它们用于商业用途。

确实存在开源 LLM，尽管它们的规模和性能落后于最先进的商业替代品几代人。然而，更多的开源法学硕士如雨后春笋般涌现。

如果你对 huggingface 和 GitHub 保持警惕，你会发现其中很多，例如：

OpenAI：GPT-2 和 GPT-Neo

巨大的人工智能

在一起.xyz打开聊天工具

诺米艾GPT4全部

在迷宫之外思考

Office 365 可能是微软自己的迷宫。我为什么要这么说？

最重要的是，从收入和利润的角度来看，Office 365 对微软至关重要（占 2022 年总收入的 23%（来源).微软或许能够将 OpenAI 功能添加到 Office 365，但它可能仍然是增量更新，而不是根本性的改变。

这仅仅是因为微软无法以过快的速度或过于戏剧化的方式将他们的企业客户转移到一个新的范例中，这些客户以规避风险和变化缓慢着称。所以在某种程度上，Office 365 也是微软的枷锁。

那么年轻创业者的机会在哪里呢？如果我们退一步说，我们创建 Microsoft Office 套件（包括 Word、Powerpoint 和 Excel）的原因是我们可以在业务环境中更好地沟通。

我们如何发明超越这些现有工具的新沟通方式？想一想 Slack 和 Notion 如何超越电子邮件，以及 Figma 如何超越传统的 Adobe 创意套件。

想象一下更新的人机界面和人机界面如何在商业环境中工作。

如果你想进入科幻领域，你可以考虑 Elon Musk 的 Neuralink，其中人和机器是电气连接的。

埃隆·马斯克 (Elon Musk) 的 Neuralink 等技术的出现旨在在人脑和机器之间建立直接通信，为重新构想商业环境中的通信开辟了令人兴奋的可能性。

以下是此类技术可能超越 Microsoft Office 套件等传统工具的几种方式：

思想到文本的交流：借助像 Neuralink 这样的脑机接口 (BCI)，人们可以直接以文本或视觉内容的形式交流他们的思想，而无需使用键盘或其他输入设备。这可能导致更有效和更快的思想交流，最大限度地减少传统方法可能产生的误解和错误传达。
协作头脑风暴：脑机接口可以在头脑风暴会议期间实时分享想法和想法，让团队成员同时贡献和可视化概念。这可以加强创造性的问题解决和决策过程，营造更加协作和高效的工作环境。
沉浸式演示：将 BCI 与增强现实 (AR) 或虚拟现实 (VR) 技术相结合可以彻底改变业务演示。与依赖 PowerPoint 等传统工具不同，演示者可以创造身临其境的互动体验，吸引观众的感官和情感，从而更有效地交流复杂的概念和想法。
情绪感知交流：BCI 可能会在对话过程中检测情绪和精神状态，使参与者能够更好地理解彼此的感受和观点。这可以增强同理心，促进建设性反馈，并培养更健康的工作关系。
直接知识转移：Neuralink 和类似技术可以为个人之间或从机器到人类的直接知识转移铺平道路。这可能会彻底改变工作场所的学习和培训流程，使其更加高效和个性化。