4,110 讀數

基础 AI 模型简介：类型、用例以及如何开始

经过 ITRex9m2023/03/20

太長; 讀書

基础模型是大型机器学习模型，在熟练的 AI 顾问的指导下对大量未标记数据进行训练。此类模型可用于增强或自动化各种任务，从将纸质文档转换为可编辑的文本文件到揭示社交媒体中的客户情绪。

虽然全球各地的组织长期以来一直在 AI 投资狂潮，但从原型到生产的人工智能项目数量仍然在 53% 左右波动。

专家认为，这种情况经常发生是因为缺乏技术技能、人力资源和工具，无法在其他用例中扩展孤立的AI概念验证 (PoC)。当然，为不同的任务训练单独的 AI 模型的成本可能很高。

基础模型——即在熟练的 AI 顾问的指导下对大量未标记数据进行训练的大型机器学习模型——可能是解决令人生畏的 AI 可扩展性和成本问题的最终答案。

您的公司可以使用此类模型作为起点来增强或自动化各种任务，从将纸质文档转换为可编辑的文本文件到在社交媒体评论中揭示客户情绪。并从那里建立您的 AI 卓越，为未来的任务和用例调整基础模型。

什么是基础模型，它们如何帮助您的公司在 AI 领域脱颖而出？

除非您一直生活在岩石下，否则您一定听说过OpenAI 的 ChatGPT 。该语言模型使用监督学习吸收了大量的对话文本，并在微调阶段使用人类反馈强化学习 (RLHF) 方法。

生成式 AI 解决方案可以针对 1750 亿个参数分析输入数据，深刻理解书面语言。这个智能工具可以回答问题、总结和翻译文本、针对给定主题生成文章、编写代码等等。您只需向 ChatGPT 提供正确的提示即可。

正如我们所知，OpenAI 的开创性产品只是改变AI 应用程序开发的基础模型的一个例子。

正如我们所知，基础模型扰乱了人工智能的发展。您现在可以利用预训练的 AI 解决方案来增强或完全自动化跨多个部门和工作职能的任务，而不是为单独的用例训练多个模型。

有了像 ChatGPT 这样的基础 AI 模型，公司不再需要为他们想要增强或自动化的每项任务从头开始训练算法。相反，您只需选择最适合您的用例的基础模型，然后针对您希望实现的特定目标微调其性能。

基础模型非常适合训练数据难以获取或获取成本高昂的行业。这些行业包括医疗保健、生命科学、生物技术和制造业，仅举几例。

有哪些类型的基础 AI 模型？

业务应用程序中通常使用几种类型的基础 AI 模型：

半监督学习模型是在包含标记和未标记数据的混合数据集上训练的。目标是使用标记数据来提高模型在未标记数据上的性能。当难以获得训练数据或会让您的公司付出代价时，AI 专家会转向半监督学习。例如，这可能发生在制定了各种医疗保健 IT 法规的医疗环境中。半监督模型的一些常见示例包括预训练的文本文档和 Web 内容分类算法。
无监督学习模型在未标记的数据集上进行了全面训练。他们发现训练数据中的模式或自行将其结构化。这些模型，除其他外，可以根据它们在训练数据集中发现的参数将信息分割成集群。 ML 工程师转向自动编码器、K-Means、层次聚类和其他技术来创建无监督机器学习解决方案并提高其准确性。
强化学习模型无需特定训练即可与其环境交互。当实现预期结果时——即做出开发人员希望的预测——模型会得到奖励。相反，强化学习模型在做出错误假设时会受到惩罚。该方法允许 AI 算法做出比其监督和半监督算法更复杂的决策。强化学习的一个例子是自动驾驶汽车或玩游戏的人工智能，如 AlphaGo。
生成式 AI 模型会生成与它们接受过训练的数据相似的新数据。此数据可能包括文本、图像、音频剪辑和视频。上一节提到的 ChatGPT 解决方案属于此类基础 AI 模型。生成式 AI 的其他例子包括DALL-E 2 工具，它根据用自然语言编写的描述创建图像，以及Synthesia.io视频平台，它使用基于文本的输入来制作视频内容。
迁移学习模型可以解决训练之外的任务。例如，计算机视觉工程师可以利用预先训练的图像分类算法进行对象检测。或者利用现有的 NLP 解决方案来完成更多知识密集型任务，例如客户情绪分析。一些流行的预训练机器学习解决方案包括 OpenCV，一个包含用于对象分类和图像检测的强大模型的计算机视觉库，以及 Hugging Face 的 Transformers 库产品，例如生成预训练 transformer (GPT)——即丰富的语言模型，其第三代 (GPT-3) 为 ChatGPT 服务提供支持。
元学习模型，不像他们以任务为导向的等价物，从字面上学会学习（没有双关语意）。这些模型不是吞噬数据来解决特定问题，而是制定解决问题的通用策略。这样，元学习解决方案可以轻松地适应新的挑战，同时更有效地使用它们的资源，例如内存和计算能力。当训练数据稀缺，或者公司缺乏有关 AI 在业务中实施的明确计划时，ML 专家会利用元学习。 TensorFlow、PyTorch 和其他开源机器学习库和框架提供了允许开发人员探索元学习技术的工具。像谷歌这样的云计算提供商帮助 ML 专家和新手使用 AutoML 训练自定义机器学习模型。

根据具体的应用程序和您拥有的数据类型，一种基础模型可能比另一种更合适。您的公司可以自由选择开源解决方案（需要进行一些调整）或即用型第三方产品 - 只要它符合您的业务目标。

为您的下一个项目利用基础 AI 模型的 3 大理由

与独立的、面向任务的机器学习模型相比，基础模型有助于更快、更便宜地创建可靠的人工智能解决方案，涉及的数据更少，微调最少。更不用说，基础模型接受的数据训练比单个组织所能获得的还要多，从第一天起就显示出很高的准确性。

您将在下面找到基础 AI 模型优势的概要：

基础模型将帮助您以更少的资源更快、更便宜地实施人工智能。创建和部署 AI 解决方案需要大量时间和资源。对于每个新应用程序，您都需要一个单独的标记良好的数据集。如果您没有，您将需要一个数据专家团队来查找、清理和标记该信息。根据 IBM AI 首席技术官 Dakshi Agrawal 的说法，基础模型有助于根据给定的用例将数据标签要求减少 10-200 倍，这转化为显着的成本节约。在业务方面，您还应该考虑不断上涨的云计算费用。例如，谷歌花费了 3500 万美元来教 DeepMind 下围棋。虽然您的 AI 项目可能没有一半那么雄心勃勃，但您可以轻松地花费 300,000 美元的云服务器成本来启动和运行您的 AI 应用程序。使用基础模型（例如生成式 AI 解决方案）的另一个原因是有机会快速制作原型和测试不同的概念，而无需大量投资研发。
您可以重复使用基础 AI 模型来创建不同的应用程序。顾名思义，AI 基础模型可以作为多个 AI 应用程序的基础。想想开车。一旦你拿到了驾照，你就不需要在每次购买另一辆车时都通过考试。同样，您可以使用较少量的标记数据来训练一个通用基础模型，该模型可以汇总文本以处理特定领域的内容。基础模型也具有“涌现”能力，这意味着模型一旦经过训练，就可以学会解决它不应该解决的问题，或者从训练数据中收集意想不到的见解。
Foundation AI 模型有助于实现贵公司的可持续发展目标。训练一个大型机器学习模型所产生的环境足迹与在其整个生命周期内运行五辆汽车所产生的环境足迹相同。如此沉重的碳足迹与 66% 和 49% 的企业分别提高能源使用效率和开发新的气候友好型服务和产品的事实形成鲜明对比。借助基础 AI 模型，您可以更快地训练智能算法并明智地利用计算资源——这尤其要归功于利用硬件并行性的模型架构，同时执行多项任务。

被视为“人工智能的未来”的基础模型降低了利用人工智能的门槛，并有可能通过帮助企业在其他用例和公司范围内扩展模型来结束失败的人工智能概念验证周期。

但每一个机会都伴随着挑战。

使用基础模型时的注意事项

基础人工智能模型唯一明显的缺点是缺乏可解释性。

大型基础模型可以使用如此多的训练数据并且具有如此多的深层，以至于有时很难确定算法是如何得出结论的。

基础模型的黑盒性质也为网络犯罪分子留下了后门。黑客可以发起数据投毒攻击并引入人工智能偏见，进一步加剧人工智能的伦理问题。

科技公司应与政府联手为公共人工智能项目建立基础设施，以避免围绕基础人工智能模型的使用产生争论。人工智能供应商还应披露他们使用的数据集以及他们如何训练模型。

正如斯坦福大学 HAI 教员兼计算机科学教授 Percy Liang在最近接受 Venture Beat 采访时所说，“我们还处于早期阶段，因此专业规范还不完善。因此，作为一个社区，我们必须立即采取行动，确保以对道德和社会负责的方式开发和部署这项技术。”

在您的组织中开始使用基础模型需要什么

作为过去十年帮助公司实施人工智能系统的人，ITRex 团队正在见证人工智能的转变。

在单个域中执行特定任务的系统让位于广泛的 AI，后者可以更广泛地学习并跨行业和用例工作。在大型未标记数据集上训练并针对各种应用程序进行微调的基础模型正在推动这一转变。

如果您的公司准备好超越您的竞争对手并更快地从您的 AI 系统中获得投资回报，这里有一个实施基础模型的高级策略：

收集和预处理您的数据。第一步涉及收集和预处理您将提供给基础 AI 模型的数据。这些数据的质量和多样性对于确保微调模型的准确性和稳健性至关重要。
选择基础模型。市场上有许多预训练的 AI 基础模型。一些流行的解决方案包括 BERT、GPT 和 ResNet 等。根据您要解决的任务和您拥有的数据类型选择正确的基础模型非常重要。
根据您的业务目标调整模型。一旦您的基础模型和数据准备就绪，您就可以根据您的特定任务调整模型的参数。实现这一目标的一种方法是迁移学习，您可以使用基础模型的预训练权重作为起点，并根据您的训练数据对其进行调整。
评估模型。微调后，确定模型是否运行良好以及是否需要进一步调整至关重要。要评估基础模型的性能，您可以使用准确度、精确度、召回率和 F1 分数等标准指标。
部署您的 AI 解决方案。一旦您对微调模型的性能感到满意，就可以将其部署到生产环境中。部署 AI 模型的几种选择包括基于云的平台、本地服务器或边缘设备。

请务必记住，实施 AI 基础模型需要技术专长以及对专用硬件和软件工具的访问。因此，与专业的 AI 供应商合作或咨询 AI 专家团队可能会有所帮助，以确保流程有效完成。