paint-brush
AI 概念验证如何帮助您在 AI 努力中取得成功经过@itrex
813 讀數
813 讀數

AI 概念验证如何帮助您在 AI 努力中取得成功

经过 ITRex14m2023/01/11
Read on Terminal Reader

太長; 讀書

人工智能概念验证 (PoC) 是拟议的 AI 解决方案的原型或演示。它旨在测试解决方案是否可行以及是否有可能成功。创建 AI PoC 的目的是验证概念、评估提议的解决方案的潜在好处,并确定潜在的挑战或限制。
featured image - AI 概念验证如何帮助您在 AI 努力中取得成功
ITRex HackerNoon profile picture

我们的客户只损失了他们专用于 AI 项目的预算的四分之一,因为他们选择从概念验证开始。 PoC 允许他们测试他们的想法并以有限的支出快速失败。


为避免浪费时间和精力,请始终向您的AI 解决方案顾问咨询概念证明——尤其是当您的公司只是在测试人工智能领域时。


本文解释了什么是 AI 概念验证,并详细阐述了将指导您完成第一个 PoC 的五个步骤,以及您在此过程中可能遇到的挑战。它还展示了我们产品组合中的 AI PoC 示例。您会发现开头段落中描述的示例的圆满结局。

什么是 AI 概念验证,什么时候它对您的项目的成功至关重要?

人工智能概念验证 (PoC) 是拟议 AI 解决方案的原型或演示,旨在测试该解决方案是否可行并可能成功。

创建 AI PoC 的目的是验证概念、评估提议的解决方案的潜在优势,并确定任何潜在的挑战或限制。


AI PoC 通常涉及构建拟议 AI 解决方案的小规模版本,并在受控环境中对其进行测试,以查看其性能如何以及是否满足预期目标。然后可以使用 AI PoC 的结果为解决方案的进一步开发和实施提供信息。


与普通软件 PoC 相比,AI POC 可能涉及更复杂的考虑因素,例如 AI 解决方案随时间学习和适应的能力,以及解决方案的潜在伦理影响,例如AI 偏见


PoC AI 项目的技术栈也不同:


  1. 机器学习算法。这些算法允许 AI 系统从结构化数据中学习,并根据学习做出预测或决策。有许多不同类型的机器学习算法,包括监督学习算法、非监督学习算法和强化学习算法。
  2. 神经网络。这些计算模型的灵感来自于人脑的结构和功能。神经网络可以处理和分析大量非结构化数据。他们可以被训练来执行各种任务,例如图像识别、自然语言处理、场景建模和预测。
  3. 机器人学。该技术可用于构建能够自主操作和决策的物理系统。机器人解决方案包含传感器、执行器和其他硬件组件,使工程师能够构建可以与其环境交互并执行任务的机器人。
  4. 云计算。 Microsoft Azure、Google Cloud 和 AWS 等云计算平台提供支持 AI POC 开发和测试所需的计算能力、存储资源和预配置服务。这些平台还可以在开发和测试后托管和部署人工智能解决方案。


创建 AI PoC 涉及收集和准备数据、构建和训练机器学习模型,以及测试和评估 AI 系统的性能。

创建人工智能概念验证所需的时间可能会有很大差异,具体取决于多种因素,包括拟议的 AI 解决方案的复杂性、POC 可用的资源和专业知识以及 POC 的具体目标。一些 AI POC 可以在几天或几周内开发完成,而另一些则可能需要几个月甚至更长时间才能完成。

什么时候绝对没有办法绕过 AI PoC?

在以下情况下,必须使用 PoC 开始您的项目:


  • 你的项目依赖于一个以前没有测试过的创新想法。在业务层面研究过的东西,但在技术上没有尝试过。您和您的技术供应商都不确定这是否可以实现。
  • 如果您需要在有限的时间内向利益相关者、投资者等证明您的想法的可行性。 PoC 将比交互式原型或类似的东西更好地完成这项工作。

是否存在 AI PoC 是浪费时间的情况?

尽管 AI 概念验证在大多数情况下都是有益的,但也有一些例外。如果您的项目属于以下类别,那么 PoC 可能有点矫枉过正:


  • 如果您的想法和方法从功能和技术角度得到了很好的记录。这是相当罕见的。
  • 如果您要开发的解决方案是标准的并且类似于该领域的常见做法。我们已经知道,从技术角度来说,这是可行和可能的。
  • 如果你想构建你的前端和后端开发人员理解并且之前已经在相同的东西上工作过的软件

您可以从 AI 概念验证中获得哪些好处?

使用 AI 概念验证带来以下好处:


  • 在为这项工作投入更多资源之前确定潜在的挑战。 PoC AI 允许您“快速失败,更好地失败”。如果团队遇到他们无法克服的挑战,所有利益相关者都有时间重新组合或者可能改变假设以通过其他方法达到相同的目标。
  • 最大限度地降低业务风险,因为您可以小步测试创新想法,而不是投入长期项目
  • 改进数据收集实践
  • 让投资者和其他利益相关者参与进来
  • 节省时间和资源。 AI PoC 可能会发现与业务或流程相关的问题,并让您有时间在开始全面项目之前解决所有问题
  • 积累专业知识并培养知识所有者,他们将在未来指导其他团队成员开展类似项目
  • 在较小规模上测试技术堆栈,以了解其对所选业务案例的适用性

我们的产品组合中 AI PoC 挽救了局面的示例

以下是 ITRex 产品组合中的一些 AI PoC 示例,它们将帮助您更加了解概念验证方法。

意识到仅靠 ML 并不是解决问题的方法

一家大型货运物流公司每天执行 10,000-15,000 件货物,每件货物都附有提单和发票以涵盖操作。员工因手动处理所有文档而筋疲力尽。该公司希望构建一个基于 ML 的解决方案,该解决方案将使用光学字符识别 (OCR)来处理扫描的文档并识别不同的字段。


客户认为机器学习是这种情况的最佳选择,因此我们着手进行 AI PoC 来测试这一假设。很快我们意识到文档的格式不同,用于字段的标签也有很大差异。例如,仅加载 ID 字段就有 8 个别名。因此,ML 模型不断增长。它变得缓慢而低效。我们的团队决定为这个模型配备一个动态算法(例如,不同字段标签被硬编码的字典)。这一修改显着提高了解决方案的性能,并为客户节省了时间和金钱。


如果客户决定跳过 AI 概念验证,他们可能会浪费七个月的时间才意识到他们最初的纯基于 ML 的模型想法并不是这里的最佳解决方案。

有了人工智能PoC,他们只用了两个月就得出了这个结论。自 AI PoC 成功完成后,我们构建了一个可以处理四种类型文档的 MVP,承担了大约 25% 的手动处理负载。

对 Meta 对数据使用的限制感到吃惊

娱乐行业的一位客户希望为独立音乐表演者构建一个人工智能驱动的分析平台。该解决方案应该抓取包括 Facebook 和 Instagram 在内的社交媒体来收集数据。它将处理所有这些信息以衡量人们对艺术家的看法。音乐家可以与该平台签约,并收到关于哪些社交媒体行为对他们的成功最有利的反馈。


我们继续进行 AI 概念验证来测试这个想法。仅仅两周后,我们意识到根本不可能从 Facebook 和 Instagram 收集数据并将其用于上述目的。通常,可以通过图形 API 检索某些数据。将其与 Meta 中经过验证的企业帐户相结合,我们假设我们将获得所需信息的访问权限。但是,客户无法向我们提供经过验证的企业帐户,并且仅来自 Graph API 的数据不足以完成此解决方案工作。


如果客户决定跳过 PoC,他们将在发现项目上浪费大约 20,000 美元。


这将包括解决方案的详细描述和开发成本的估算。但是当他们选择从 AI PoC 开始时,他们只花了大约 5,000 美元就发现由于 Meta 公司实施的数据访问限制,这个想法无法执行。

首次 AI 概念验证的五步指南

您可以按照以下五个步骤成功通过 AI PoC。在本节中,我们还列出了与每个步骤相关的挑战。

第 1 步:确定您想用 AI 解决哪些问题

必须通过实施人工智能 PoC 来具体说明您想要完成什么。所选用例需要具有高价值并代表您可以使用该技术最好地解决的问题。如果您有疑问,一个好的起点是研究您所在领域的其他人使用 AI 解决方案的目的。另一种方法是调查您的企业面临的问题,并将其与人工智能的潜力进行比较。

在您积累了一系列机会后,您可以提出以下问题来确定哪些最适合您的项目:


  • 您打算解决的问题是否足够具体?你能评估结果以确定成功吗?
  • 您是否已尝试使用其他技术解决此问题?
  • 你有能力和资金支持这个项目直到最后吗?如果没有合适的内部人才,可以聘请外部专门的团队吗?
  • 它将如何影响您的业务?这种影响是否足以投入努力?
  • 你能把这个卖给高管吗?您的组织准备好承担此类项目了吗?
  • 您的公司是否已经制定了数据战略?它将如何与这个项目保持一致?
  • 使用 AI 解决这个问题的潜在风险和局限性是什么?


相关挑战:


  • 选择一个不会增加太多价值或没有充分发挥 AI 潜力的用例。人工智能是一项昂贵的技术,选择一个无关紧要的案例将意味着你得不偿失。查看我们关于实施 AI 的成本的文章,以便更好地了解费用。

第 2 步:准备数据

现在,由于您已经清楚地定义了问题,是时候为 AI 算法聚合和准备训练数据了。您可以通过以下方式做到这一点:


  • 检查哪些数据可供贵公司使用
  • 使用特定的现成应用程序或您自己的解决方案生成半合成数据
  • 从可靠的供应商处购买数据集
  • 使用开源数据
  • 雇人废弃符合您目的的数据


您不必将自己局限于一种来源。您可以组合使用上面列出的几个选项。


求助于数据科学家进行初步数据筛选。他们将执行以下任务:


  • 构建数据
  • 通过消除噪音来清洁它
  • 如果是表格数据,请添加任何缺失的数据点
  • 执行特征工程(即添加和删除数据字段)
  • 应用操作,例如组合或过滤数据


数据科学家可以就如何收集额外数据或如何缩小 AI 概念验证范围提供建议,以便您可以使用现有数据集获得预期结果。

当数据可供使用时,将其分成三组:


  • 模型将用于学习的训练集
  • 验证集用于验证模型并迭代训练
  • 将评估算法性能的测试集


相关挑战:


  • 训练数据不能代表整个人群。在这种情况下,算法可能在常见情况下表现良好,但在罕见情况下会产生较差的结果。例如,分析 X 射线的医疗保健 ML 模型可能擅长检测常见疾病,例如积液,但很难发现罕见疾病,例如疝气。
  • 类别不平衡,当代表一个类别的案例数量明显大于另一个类别时,比例为 99.9% 比 0.1%
  • 标签不正确,例如混合类别,例如将自行车标记为汽车
  • 训练数据集中的高噪声
  • 很难实现纯类可分离性。当训练集中的某些数据无法正确分类到特定类别下时,就会发生这种情况。

第 3 步:构建并构建或购买解决方案

您可能想知道是应该自己构建模型还是可以采购现有解决方案。


以下是从头开始创建 AI 模型的合理时机:


  • 您的解决方案具有创新性且不符合现有标准
  • 现成的解决方案定制成本高
  • 最接近的现成模型有点矫枉过正,它做的比你实际需要的要多得多

如果出现以下情况,请考虑购买现成的模型:

  • 购买和定制模型的成本低于从头开始构建的成本


如果您决定从头开始构建 AI 算法,您可以更好地控制其准确性。完成任务需要更长的时间,但它会根据您的业务问题和内部流程量身定制。您无需更改系统即可适应外部软件。

关于算法训练和实现的基础设施,可以依赖云端,而不是使用本地资源。您可以考虑四个参数来决定最适合您的参数:


  1. 保安。如果您的数据在安全方面非常敏感,那么您最好将所有内容都保留在本地。
  2. 工作量。如果处理负载比较重,选择云。
  3. 费用。评估什么会让你花费更多——在本地获取资源或随着时间的推移为云使用付费。
  4. 辅助功能。如果您只在本地使用该解决方案,则可以依赖您的内部服务器。如果需要从不同的地理位置访问它,那么值得考虑云。


每种方法都有其优点和缺点。如果您在医疗保健行业开展业务,我们在博客上的医疗保健云计算帖子中对这些内容进行了清楚的解释。否则,请随时联系我们的 AI 专家,为算法训练选择最佳技术堆栈。


相关挑战:


  • 缺乏适当的培训。这会导致一些问题,例如模型泛化能力差,这意味着模型无法对它在训练中没有见过的数据做出准确的预测。回到医疗领域的 X 射线图像分析,一种算法可能会成功地分析由最先进的扫描捕获的高质量图像,但在应用于由旧机器生成的扫描时仍然表现不佳。
  • 与现有系统集成,其中一些系统可能已经过时或由专有技术提供支持
  • 未能提出合适的模型架构,例如,无法为手头的问题选择正确的 ML 模型
  • 所选架构的功能无法满足模型的要求
  • 输入数据是易变的,这意味着模型必须经常重新训练
  • 使用比您的模型执行其任务所需的资源更多的资源。无需投资强大的服务器来运行简单的模型。

第 4 步:评估 AI 概念证明产生价值的潜力

这一步是评估AI PoC是否达标。有几种方法可以执行评估:


  • 回到您的关键绩效指标 (KPI) 并针对它们测试解决方案。这些因素可能包括准确性、客户满意度、速度、灵活性、公平性、安全性等。
  • 收集关于您的系统在 AI 概念验证部署之前如何运行的数据。这将包括在特定手动任务上花费的时间、错误数量等。接下来,您应该使用这些信息来评估 PoC 的影响。
  • 将解决方案的性能与被视为此类问题或行业基准的其他产品进行比较。例如,图像分类相关问题的基准是在流行的数据集(如 ImageNet)上提供准确结果的模型。
  • 通过焦点小组或在线调查收集用户反馈,以衡量满意度并确定缺失的内容
  • 进行成本效益分析以了解此解决方案对组织的财务影响


相关挑战:


  • 在你的评估中犯了一个错误。这可能是计算过程中的简单数学错误,也可能是与估算业务潜力相关的错误。

第 5 步:迭代 AI 概念证明以获得更好的结果,或扩大规模

如果您在上一步中收到的结果不符合标准,您可以考虑修改解决方案并迭代整个过程。您可以更改 ML 算法并测量每次调整的性能。您还可以尝试不同的硬件组件或替代的云服务模型。

如果您对 AI PoC 的性能感到满意,您可以在不同的方向上对其进行扩展。这里有一些例子:


  • 将 PoC 应用于其他业务案例。在您的企业中寻找这种新解决方案的其他应用。例如,如果您将 AI 作为预测性维护的一种应用进行测试,则可以尝试将其应用于其他相关场景。
  • 扩展基础设施。查看用于运行此软件的技术。您能否投入更多的处理能力或更多的数据存储容量?此类修改将使您能够使用更多数据、减少延迟,并可能实时交付结果。它还可以最大程度地减少将来出现瓶颈的可能性。
  • 优化AI PoC方案。即使您在上一步中已经获得了合理的结果,但可能值得寻找提高准确性的方法。您可以使用新数据、更准确标记的数据等继续训练您的算法。或者您甚至可以尝试实施调整和更改以获得更好的结果。


如果您决定在概念验证阶段之后在整个公司范围内采用 AI,您可以在我们的指南中找到有关如何在您的组织中实施 AI 的有用提示。


相关挑战:

  • 没有仔细考虑架构。该解决方案可能适用于 10,000 名用户,但当受众达到 100,000 时就会崩溃。
  • 该模型包含会在您尝试扩展 AI 解决方案时自行显现的错误
  • 将该模型应用于其他业务案例,而不是它原本打算用于的业务案例。例如,用于组装花园独轮手推车的解决方案不能应用于组装卡车,因为它可能会构建带有马达的大型花园独轮手推车。

总结

在实施 AI 时,从小处着手并保持可管理性。确保您有明确的业务案例,其中包含明确的目标和衡量成功的指标。并且始终考虑创建 AI 概念证明,本文开头介绍的案例除外。这将帮助您在全面投入之前识别任何潜在的障碍,并对不符合预期的解决方案进行大量财务投资。


您是否想在您的组织中实施 AI,但不确定您的经营理念是否可行?取得联系!我们的团队将帮助您进行 PoC 以测试您的想法的实用性。