paint-brush
Какова истинная цена генеративного ИИ?к@itrex
931 чтения
931 чтения

Какова истинная цена генеративного ИИ?

к ITRex18m2024/01/17
Read on Terminal Reader

Слишком долго; Читать

Наличие хорошо продуманного плана не только поможет вам без риска внедрить технологию и быстрее получить выгоду, но и снизить затраты на создание искусственного интеллекта.
featured image - Какова истинная цена генеративного ИИ?
ITRex HackerNoon profile picture
0-item
1-item

ТЛ;ДР

  • Стоимость внедрения генеративного ИИ в бизнесе может варьироваться от нескольких сотен долларов в месяц до 190 000 долларов (и продолжает расти) за индивидуальное решение генеративного ИИ, основанное на точно настроенной модели с открытым исходным кодом.
  • Эта разница в стоимости генеративного ИИ обусловлена несколькими факторами, включая задачи, которые вы хотите улучшить, модель, которая лучше всего подходит для этих задач, и выбранный подход к реализации.
  • Чтобы оптимизировать связанные с этим расходы, вам необходимо тщательно рассмотреть требования вашего проекта, оценить расходы на локальную и облачную инфраструктуру и сделать выбор между наймом собственных специалистов по искусственному интеллекту и передачей проекта третьей стороне.


Мы уже рассказывали вам , чем генеративный искусственный интеллект (Gen AI) отличается от традиционного искусственного интеллекта и какие плюсы и минусы имеет эта технология . Консультационная группа ITRex по генеративному искусственному интеллекту также изучила варианты использования Gen AI в нескольких отраслях, включая здравоохранение , розничную торговлю и цепочки поставок .


Кроме того, мы оценили стоимость создания систем искусственного интеллекта , инфраструктуры и всего остального, а также увеличили затраты на машинное обучение (ML) , рассчитав расходы, связанные с подготовкой обучающих данных, точной настройкой моделей и развертыванием решений на базе машинного обучения. .

Теперь пришло время расшифровать стоимость внедрения генеративного ИИ в бизнес.


Этот анализ может оказаться непростым, поскольку нам еще неизвестны особенности вашего проекта.

Однако мы могли бы использовать наш опыт консультирования по генеративному ИИ, чтобы изучить цены на услуги Gen AI и перечислить ключевые факторы, определяющие стоимость проектов Gen AI. Таким образом, мы предоставим вам знания для принятия обоснованных решений, что потенциально сэкономит вашему бизнесу значительное время и ресурсы в этой быстро развивающейся технологической среде.


Заинтересованы? Тогда давайте сразу же погрузимся!

Выбор модели и подхода к реализации — ключевые факторы, влияющие на стоимость генеративного ИИ

Размышляя о включении генеративного искусственного интеллекта в технологический стек вашей компании, важно учитывать следующее:


  • Какие бизнес-задачи вы собираетесь решить с помощью генеративного искусственного интеллекта?
  • Какая модель подойдет для этих задач?


В основе генеративных решений искусственного интеллекта лежат базовые модели, то есть большие модели, обученные на огромных объемах данных. По сути, базовые модели служат основой для создания индивидуальных решений Gen AI, упрощения процесса разработки и снижения затрат на генеративный AI. Их возможности обычно включают обработку естественного языка (NLP), компьютерное зрение (CV) и генерацию контента.


Когнитивные возможности базовых моделей во многом зависят от количества параметров, на которых они обучались. В этом контексте параметры относятся к элементам модели, которые изучаются на основе обучающих данных, таких как веса в нейронной сети. Эти параметры помогают модели принимать решения и прогнозировать. Следующая таблица иллюстрирует корреляцию между количеством параметров — по сути, объемом этих элементов принятия решений — и когнитивными способностями модели.

Количество параметров обучения

ТТХ модели

Возможные применения

1 миллиард параметров

Базовые знания о мире; сопоставление с образцом

Анализ настроений клиентов в отзывах

10 миллиардов параметров

Большее знание мира; следуя основным инструкциям

Чат-боты для заказа товаров (HoReCa, электронная коммерция)

100+ миллиардов параметров

Богатое знание мира; сложные рассуждения

Анализ данных, исследования и создание контента

Однако количество параметров – не единственный фактор, влияющий на возможности моделей фундаментов. Качество и разнообразие обучающих данных одинаково важны. Данные обучения — это информация, вводимая в модель для обучения, включая широкий спектр примеров, которые помогают модели понимать и интерпретировать новые данные. Кроме того, решающую роль играют архитектура модели, т. е. структурная схема взаимодействия параметров и данных, а также эффективность алгоритмов обучения, которые определяют, насколько эффективно модель обучается на основе данных. В результате в некоторых задачах модель с меньшим количеством параметров, но лучшими обучающими данными или более эффективной архитектурой может превзойти более крупную модель.

Как ваша компания могла бы выбрать базовую модель, которая одновременно эффективна и соответствует вашим ожиданиям в отношении стоимости генеративного ИИ?


Все существующие модели генеративного ИИ можно условно разделить на два типа:


  • Модели с закрытым исходным кодом разрабатываются крупными технологическими компаниями, такими как Google, Meta, Microsoft и OpenAI. Их исходный код, архитектура и интерфейсы прикладного программирования (API) могут быть полностью проприетарными или предоставляться третьим сторонам (обычно за определенную плату, которая по сути является стоимостью генеративного решения ИИ). В некоторых случаях вы можете точно настроить производительность моделей с закрытым исходным кодом, используя свои данные. В этой статье мы будем называть модели с закрытым исходным кодом коммерчески доступными генеративными решениями ИИ. Основным преимуществом таких моделей является то, что они оснащены облачной инфраструктурой и полностью поддерживаются первоначальным разработчиком.
  • Модели с открытым исходным кодом имеют исходный код, методы обучения, а иногда даже данные обучения, доступные для публичного использования и модификации. Ваша компания может использовать такие модели «как есть» или переобучить их на собственных данных для достижения большей точности и производительности. Однако для работы модели вам придется настроить локальную или облачную инфраструктуру. Таким образом, стоимость таких генеративных моделей ИИ будет включать затраты на вычисления и, если вы решите улучшить решение Gen AI, расходы, связанные с обучением модели.


В таблице ниже представлен краткий обзор характеристик моделей с закрытым и открытым исходным кодом.

Модели с закрытым исходным кодом

Модели с открытым исходным кодом

- Простая интеграция с использованием API-интерфейсов. - Более продвинутые когнитивные возможности. - Относительно низкая стоимость генеративного искусственного интеллекта (комиссия поставщика, модель на основе потребления). - Возможный риск привязки к поставщику. - Может работать на вашей собственной инфраструктуре (в зависимости от поставщика).

-Полный контроль над производительностью модели -Работает на собственной инфраструктуре (локально, в облаке) -Снижение риска нарушения конфиденциальности данных и безопасности -Затраты на генеративный искусственный интеллект увеличиваются с увеличением рабочей нагрузки

Подведем итоги.


Если ваша компания рассматривает возможность внедрения генеративного ИИ, есть четыре основных способа сделать это:


  1. Использование моделей с закрытым исходным кодом без настройки . Пионеры генеративного искусственного интеллекта могут интегрировать готовые продукты, такие как ChatGPT OpenAI, Google Bard, Claude и Synthesia, со своими приложениями с помощью API. Процесс интеграции довольно прост, как и ценообразование на генеративный ИИ (подробнее об этом позже). Коммерчески доступные продукты часто обновляются и предоставляют обширную документацию для разработчиков ИИ. Обратная сторона? Ваши возможности настройки будут ограничены, и вы будете сильно зависеть от внешней компании при выполнении жизненно важных бизнес-задач, таких как обработка запросов в службу поддержки клиентов или создание визуального контента.
  2. Переобучение коммерческих решений на ваших корпоративных данных . В этом сценарии ваша собственная команда ИИ выберет существующий продукт генеративного ИИ, разработанный конкретным поставщиком, например OpenAI, и настроит его, используя ваши собственные данные. Индивидуальные решения Gen AI помогут лучше понимать вопросы пользователей и давать более точные ответы. Однако поставщик по-прежнему будет взимать небольшую плату за выполнение ваших запросов, поэтому окончательные затраты на генеративный ИИ будут включать как эксплуатационные расходы, так и расходы на настройку.
  3. Использование моделей Foundation с открытым исходным кодом «как есть». Если преувеличить, ваша компания может выбрать RoBERTa, GPT-2, GPT-Neo или любую другую модель с открытым исходным кодом и применить ее для бизнес-задач, таких как ответы на электронные письма клиентов, без дополнительного обучения. Однако стоимость генеративного ИИ будет определяться вычислительными ресурсами, потребляемыми моделью. Кроме того, ваше решение Gen AI может работать неэффективно при работе с незнакомыми данными и задачами.
  4. Переобучение моделей с открытым исходным кодом на ваших данных . В этом случае вам необходимо будет получить и подготовить конкретные данные для обучения модели Gen AI, предоставить локальные или облачные серверы для обучения и эксплуатации модели, а также продолжать тонкую настройку и обновление модели по мере развития ваших задач. Хотя этот индивидуальный подход гарантирует превосходную производительность модели, он также влечет за собой более высокие затраты на генеративный искусственный интеллект.


Теперь, когда вы знаете варианты реализации, давайте углубимся в стоимость генеративного ИИ, которую влекут за собой эти варианты.

Анализ цен на генеративный ИИ на основе сценария внедрения

Стоимость коммерчески доступных инструментов Gen AI

Готовые услуги, которые облегчают обработку и создание текста, обычно взимают плату с предприятий в зависимости от количества символов или токенов — т. е. основных единиц текста, которые могут варьироваться от знаков препинания до слов и других элементов синтаксиса — во входном или выходном тексте. .

Вот как это работает на практике:


  1. Тарификация по персонажам . Некоторые решения, такие как инструменты Gen AI, управляемые Google Vertex AI, выставляют счета пользователям на основе количества символов во входном и выходном тексте. Они считают каждую букву, цифру, пробел и знак препинания символом. Например, цены на генеративный ИИ для модели PaLM 2 for Text, поддерживаемой Vertex, начинаются с 0,0005 доллара США за 1000 символов для входного и выходного текста (оплачивается отдельно).

  2. Биллинг на основе токенов . Более продвинутые инструменты Gen AI имеют тенденцию разбивать текст на токены, а не на символы. В зависимости от методов обучения и обработки модели токен может быть знаком препинания, словом или частью слова. Например, OpenAI определяет токен как группу примерно из четырех символов. Простое предложение вроде «Том принес Джилл цветы». таким образом, будет состоять из восьми токенов, поскольку слова «принес» и «цветы» немного превышают четырехзначный порог. Когда дело доходит до стоимости таких генеративных решений ИИ, она во многом зависит от выбранной вами языковой модели. GPT-4 Turbo от OpenAI, один из самых сложных инструментов на рынке, взимает 0,01 доллара США за 1000 токенов для входного текста и 0,03 доллара США за 1000 токенов для выходного текста. Для GPT-3.5 Turbo, его более старой версии, цены значительно ниже: от 0,001 доллара США за 1000 токенов для входного текста до 0,002 доллара США за 1000 токенов для выходного текста.

    Следует отметить, что разные поставщики генеративного ИИ имеют разные представления о персонажах и токенах. Чтобы выбрать наиболее экономически эффективный вариант, вам следует изучить их документацию и планы и решить, какой продукт лучше всего соответствует вашим уникальным бизнес-потребностям. Например, если ваши задачи связаны с генерацией текста, а не с анализом, более подходящим будет сервис генеративного искусственного интеллекта с более низкой скоростью вывода.


Между тем, сервисы Gen AI для создания визуального контента, как правило, взимают с пользователей плату за каждое созданное изображение, причем плата зависит от размера и качества изображения. Одно изображение размером 1024 на 1024 пикселей, созданное DALL·E 3 в стандартном качестве, обойдется вам в 0,04 доллара. За изображения большего размера (1024×1792 пикселей), а также изображения высокой четкости цена поднимется до $0,08–0,12 за штуку.


И не забывайте о готовых платформах Gen AI, таких как Synthesia.io, которые используют более традиционный подход к ценообразованию. Если ваша маркетинговая команда хочет ускорить процесс создания видео, вы можете попробовать этот инструмент всего за 804 доллара в год.

Стоимость настройки коммерчески доступных продуктов Gen AI

Как видно из предыдущего раздела, большинство готовых продуктов Gen AI используют стратегию монетизации с оплатой по мере использования.


Хотя на первый взгляд их модели ценообразования выглядят довольно простыми, может быть сложно предсказать, сколько запросов будут выполнять ваши сотрудники, особенно если вы стремитесь изучить несколько вариантов использования генеративного ИИ в различных отделах.


Это приводит к путанице в отношении цен на инструменты Gen AI и общей стоимости владения, как это было на заре облачных вычислений .


Еще одним недостатком использования коммерческих решений Gen AI является то, что продуктам общего назначения, таким как ChatGPT, не хватает контекстуальных знаний, таких как знание структуры, продуктов и услуг вашей компании. Это затрудняет дополнение таких операций, как поддержка клиентов и создание отчетов, возможностями искусственного интеллекта, даже если вы освоили оперативное проектирование.


По словам Эрика Ламарра, старшего партнера McKinsey, для решения этой проблемы организациям « необходимо создать среду данных, которую сможет использовать модель. Другими словами, вам придется переобучить коммерчески доступные инструменты Gen AI на ваших корпоративных данных, а также на информации, полученной из внешних источников через API.


Есть два способа достижения цели и несколько факторов, которые повлияют на стоимость генеративного ИИ в каждом сценарии:


  • Использование платформ «программное обеспечение как услуга» (SaaS) с возможностями генеративного искусственного интеллекта . Многие известные поставщики SaaS, в том числе SAP, TIBCO Spotfire и Salesforce, внедряют генеративные услуги искусственного интеллекта, которые можно точно настроить с использованием данных о клиентах. Salesforce, например, запустила Einstein Copilot, диалогового помощника с искусственным интеллектом, который извлекает собственные данные из облака данных Salesforce для разработки персонализированных ответов на вопросы клиентов. Информация, используемая интеллектуальным помощником, включает разговоры Slack, телеметрию, корпоративный контент и другие структурированные и неструктурированные данные . Клиенты Salesforce также могут создавать собственные модели искусственного интеллекта, навыки и подсказки с помощью построителя подсказок и построителя моделей Einstein Copilot Studio без использования кода. На данный момент последний инструмент поддерживает большие языковые модели OpenAI (LLM) , но есть планы по интеграции продукта с другими сторонними решениями, включая Amazon Bedrock и Vertex AI. Поскольку Einstein Copilot все еще находится на пилотной стадии (без каламбура), информация о ценах на генеративный ИИ еще не обнародована. Однако стоимость генеративного помощника AI Sales GPT, которая в настоящее время составляет 50 долларов США на пользователя в месяц , может дать вам общее представление о том, чего ожидать.
  • Интеграция вашего корпоративного программного обеспечения с решениями Gen AI через API и переобучение моделей на ваших данных . Чтобы снизить стоимость внедрения генеративного искусственного интеллекта, вы можете отказаться от промежуточных инструментов SaaS, объединив свои приложения напрямую с коммерческими решениями Gen AI на уровне API. Например, если вы хотите наполнить своего чат-бота поддержки клиентов возможностями Gen AI, вы можете синхронизировать его с одной из моделей OpenAI, например, GPT-3.5 или GPT-4, с помощью OpenAI API. Далее вам необходимо подготовить данные для машинного обучения , загрузить их в OpenAI и управлять процессом тонкой настройки с помощью инструмента OpenAI CLI и библиотеки Open AI Python. При точной настройке модели с вас будет взиматься плата в размере 0,008 доллара США за 1000 токенов (GPT-3.5). Как только ваша модель будет запущена в производство, ставки ввода и вывода составят 0,003 доллара США за 1000 токенов и 0,006 доллара США за тысячу токенов соответственно. Общая стоимость генеративного ИИ также будет включать затраты на хранение, если вы решите разместить свои данные на серверах OpenAI. Расходы на хранение данных могут добавить к окончательной оценке 0,2 доллара США за 1 ГБ данных в день . И не забывайте о подготовке данных и точной настройке модели. Если ваш ИТ-отдел не обладает необходимыми навыками, вам придется сотрудничать с надежной компанией, предоставляющей услуги по разработке искусственного интеллекта .

Стоимость использования моделей Gen AI с открытым исходным кодом «как есть»

Отказ от ответственности : мы не предлагаем вам создавать собственную базовую модель, подобную ChatGPT, с нуля — это предприятие лучше оставить тем, у кого есть существенная поддержка, такая как поддержка OpenAI со стороны Microsoft, чтобы компенсировать их потери в 540 миллионов долларов .


Даже более базовые модели фундаментов, такие как GPT-3, могут потребовать начального обучения и затрат на развертывание, превышающих 4 миллиона долларов. Более того, сложность этих моделей фундаментов в последние годы резко возросла.


Объем вычислительных ресурсов, необходимых для обучения крупных моделей ИИ , удваивается каждые 3,5 месяца . Меняется и сложность моделей фундамента. Например, в 2016 году Берт-Лардж прошел обучение по 340 миллионам параметров. Для сравнения, модель GPT-3 OpenAI была обучена примерно по 175 миллиардам параметров .


Хорошей новостью является то, что базовые модели уже существуют, что позволяет предприятиям относительно легко начать экспериментировать с ними, одновременно оптимизируя затраты на внедрение генеративного ИИ.


По сути, мы могли бы рассматривать базовые модели как набор инструментов для инженеров-программистов ИИ, поскольку они обеспечивают отправную точку для решения сложных проблем, но при этом оставляют место для настройки.


Мы могли бы условно разделить существующие модели фундаментов на три категории:


  • Языковые модели предназначены для решения задач перевода, генерации текста и ответов на вопросы.
  • Модели компьютерного зрения превосходно справляются с классификацией изображений, обнаружением объектов и распознаванием лиц.
  • Третья категория — генеративные модели ИИ — создает контент, напоминающий данные, использованные моделью. Этот контент может включать новые изображения, симуляции или, в некоторых случаях, текстовую информацию.


Выбрав модель с открытым исходным кодом, которая лучше всего соответствует вашим потребностям, вы можете интегрировать ее со своим программным обеспечением с помощью API и использовать собственную серверную инфраструктуру.

Этот подход предполагает следующие затраты на генеративный ИИ:


  1. Стоимость оборудования . Запуск моделей ИИ, особенно крупных, требует значительных вычислительных ресурсов. Если в вашей компании нет соответствующего оборудования, вам, возможно, придется инвестировать в мощные графические процессоры или процессоры, что может оказаться дорогостоящим. Если ваша модель относительно небольшая, может подойти высокопроизводительный графический процессор, например NVIDIA RTX 3080 или аналогичный. Стоимость такого графического процессора может варьироваться от 700 до 1500 долларов. Для больших моделей, таких как GPT-2 или аналогичных, вам понадобится несколько высокопроизводительных графических процессоров или даже специализированные ускорители искусственного интеллекта. Например, один графический процессор NVIDIA A100 может стоить от 10 000 до 20 000 долларов. Таким образом, установка с несколькими графическими процессорами может стоить от 30 000 до 50 000 долларов.
  2. Затраты на облачные вычисления . В качестве альтернативы покупке оборудования вы можете арендовать ресурсы облачных вычислений у таких поставщиков, как Amazon Web Services (AWS), Google Cloud Platform (GCP) или Microsoft Azure. Плата за эти услуги взимается в зависимости от использования, поэтому затраты будут зависеть от того, насколько вы используете их ресурсы с точки зрения вычислительного времени и памяти. Например, экземпляры графического процессора на AWS (например, P3 или P4) могут стоить от 3 до 24 долларов в час, в зависимости от типа экземпляра.
  3. Электричество и техническое обслуживание . Если вы используете собственное оборудование, вы понесете расходы на электроэнергию для работы машин и, возможно, на дополнительные системы охлаждения. Затраты на обслуживание оборудования также могут увеличиться.
  4. Интеграция и развертывание . Интеграция модели ИИ в существующие системы и ее развертывание (особенно в производственной среде) может потребовать дополнительных усилий по разработке программного обеспечения, что может повлечь за собой затраты на рабочую силу. Стоимость аутсорсинга разработки ИИ компании-разработчику программного обеспечения может варьироваться от 50 до 200 долларов в час, а общие затраты варьируются от нескольких тысяч до десятков тысяч долларов.
  5. Хранение и управление данными . Хранение и управление данными, используемыми моделью, может быть дорогостоящим, особенно при работе с большими наборами данных или при использовании решений облачного хранения. Для установок на месте стоимость хранения генеративных данных ИИ может варьироваться от 1000 до 10 000 долларов США, в зависимости от размера набора обучающих данных и потребностей в резервировании. Плата за облачные решения для хранения данных, такие как AWS S3, может варьироваться от 0,021 до 0,023 доллара США за ГБ в месяц, с дополнительными расходами на операции и передачу данных.


В конечном итоге, сколько может стоить вашей компании принятие базовой модели генеративного ИИ «как есть» и развертывание ее в собственной инфраструктуре?

Для предприятия среднего размера, стремящегося использовать локально модель среднего размера, такую как GPT-2, соответствующие затраты на генеративный ИИ могут охватывать:


  • Аппаратное обеспечение : 20 000–50 000 долларов США (за пару высокопроизводительных графических процессоров или базовую установку с несколькими графическими процессорами).
  • Электричество и техническое обслуживание : около 2000–5000 долларов в год.
  • Интеграция и развертывание : 10 000–30 000 долларов США (при условии средней сложности интеграции).
  • Хранение и управление данными : 5 000–15 000 долларов США (в зависимости от размера данных).

Общая стоимость установки и эксплуатации генеративного решения искусственного интеллекта будет включать следующее:

  • Затраты на первоначальное развертывание : примерно от 37 000 до 100 000 долларов США (аппаратное обеспечение + первоначальная интеграция и настройка хранилища).
  • Регулярные расходы : от 7 000 до 20 000 долларов США (включая затраты на электроэнергию, техническое обслуживание, текущую интеграцию и управление данными).


Эти приблизительные оценки могут значительно варьироваться в зависимости от конкретных требований, местоположения и рыночных условий. Всегда лучше проконсультироваться с профессионалом для более индивидуальной и точной оценки. Кроме того, рекомендуется проверить текущие рыночные цены на оборудование и облачные услуги, чтобы узнать самые актуальные цены.

Стоимость переобучения решений Gen AI с открытым исходным кодом с использованием ваших данных

Если ваша компания думает о корректировке базовой модели с открытым исходным кодом, важно учитывать факторы, которые могут повлиять на стоимость внедрения генеративного ИИ.

К таким факторам относятся:


  1. Размер модели . Более крупные модели, такие как GPT-3, требуют больше ресурсов для точной настройки и развертывания. В результате стоимость генеративного ИИ увеличивается с увеличением размера и сложности модели. Между тем, более простые модели с открытым исходным кодом, такие как GPT-2, XLNet и StyleGAN2, не могут генерировать контент с таким же уровнем согласованности и актуальности.
  2. Вычислительные ресурсы . Переобучение базовой модели с использованием данных вашей компании требует значительных вычислительных мощностей. Таким образом, стоимость генеративного решения искусственного интеллекта зависит от того, используете ли вы собственное оборудование или облачные сервисы, причем цена последних варьируется в зависимости от поставщика облачных услуг и масштаба ваших операций. Если вы выберете более простую модель и развернете ее локально, вам придется потратить 10 000–30 000 долларов США на графические процессоры для точной настройки генеративного решения искусственного интеллекта. При использовании облачных вычислений расходы могут варьироваться от 1 до 10 долларов в час, в зависимости от типа экземпляра. Модели с открытым исходным кодом, подобные GPT-3, требуют более продвинутой настройки графического процессора, стоимость которой превышает 50 000–100 000 долларов. Соответствующие расходы на облачные вычисления могут варьироваться от 10 до 24 долларов в час для высокопроизводительных экземпляров графического процессора.
  3. Подготовка данных . Процесс сбора, очистки и подготовки данных для точной настройки базовых моделей может оказаться ресурсоемким. Таким образом, стоимость внедрения генеративного ИИ будет включать расходы, связанные с хранением, обработкой данных и, возможно, приобретением наборов обучающих данных, если у вашей компании нет ваших собственных данных или она не может использовать их по соображениям безопасности и конфиденциальности.
  4. Время разработки и опыт . Талант в области искусственного интеллекта обходится недешево. Штатный инженер по искусственному интеллекту в США обойдется вашей компании в 70 000–200 000 долларов в год плюс найм, заработная плата, социальное обеспечение и другие административные расходы. Вы можете сократить затраты на генеративный искусственный интеллект, сотрудничая с оффшорной компанией по разработке программного обеспечения, имеющей опыт разработки искусственного интеллекта. В зависимости от местоположения почасовая ставка таких компаний может варьироваться от 62 до 95 долларов США для старших специалистов по разработке в ключевых регионах аутсорсинга, таких как Центральная Европа и Латинская Америка.
  5. Затраты на техническое обслуживание . Вы будете нести единоличную ответственность за обслуживание, обновление и устранение неполадок модели, что требует постоянных усилий и опыта проектирования и эксплуатации машинного обучения (MLOps).


Учитывая упомянутые выше факторы, какова реальная стоимость создания индивидуального генеративного решения ИИ на основе легкодоступной базовой модели?

Для предприятия среднего размера, желающего усовершенствовать модель среднего размера, такую как GPT-2, соответствующие затраты на внедрение генеративного ИИ могут охватывать:


  • Аппаратное обеспечение : 20 000–30 000 долларов США (при умеренной настройке графического процессора).
  • Разработка : Предполагается, что на разработку уйдет шесть месяцев с использованием как собственных, так и привлеченных специалистов:
    • Собственные: $35 000–100 000 (полугодовая зарплата)
    • Аутсорсинг: 20 000–40 000 долларов США (из расчета 400 часов при средней ставке 75 долларов США в час)
  • Подготовка данных : 5 000–20 000 долларов США (в зависимости от размера и сложности данных).
  • Техническое обслуживание : 5 000–15 000 долларов США в год (текущие расходы).

Общая стоимость установки и эксплуатации генеративного решения искусственного интеллекта будет включать следующее:

  • Первоначальные расходы на развертывание : примерно от 80 000 до 190 000 долларов США (включая затраты на оборудование, разработку и подготовку данных).
  • Периодические расходы : от 5 000 до 15 000 долларов США (техническое обслуживание и текущие расходы).


Фактические затраты на разработку и внедрение Gen AI могут варьироваться в зависимости от конкретных требований проекта, наличия данных для обучения и собственных специалистов по искусственному интеллекту, а также местоположения вашего аутсорсингового партнера. Для получения наиболее точных и актуальных цен рекомендуется напрямую проконсультироваться со специалистами или поставщиками услуг.


Хотя 190 000 долларов за генеративную систему ИИ могут показаться неоправданно дорогими, стоимость создания решения генеративного ИИ с использованием базовых моделей с открытым исходным кодом может быть ниже, чем выбор коммерчески доступного инструмента.


До того, как ChatGPT привлек внимание, Latitude, новаторский стартап, ответственный за приключенческую игру на основе искусственного интеллекта под названием AI Dungeon, использовал модель GPT OpenAI для генерации текста.

По мере роста их пользовательской базы росли и счета OpenAI, и расходы на инфраструктуру Amazon. В какой-то момент компания платила 200 000 долларов в месяц в качестве сопутствующих расходов на обработку растущего числа пользовательских запросов.


После перехода на нового поставщика генеративного ИИ компания сократила операционные расходы до 100 000 долларов в месяц и скорректировала свою стратегию монетизации, введя ежемесячную подписку на расширенные функции на базе ИИ.


Поэтому, чтобы выбрать правильный подход к внедрению и одновременно оптимизировать цены на генеративный ИИ, важно заранее тщательно проанализировать требования вашего проекта. Именно поэтому мы всегда рекомендуем нашим клиентам начинать свои инициативы по разработке ИИ с этапа открытия .

Что следует учитывать при внедрении Gen AI в бизнес

Теперь, когда вы знаете, чего ожидать от генеративного ИИ с точки зрения затрат, пришло время поговорить о подводных камнях и соображениях реализации технологии:


  • Модели Фонда, особенно большие языковые модели, могут галлюцинировать, давая, казалось бы, законные, но совершенно неверные ответы на вопросы пользователей. Ваша компания могла бы избежать этого сценария, улучшив обучающие данные, поэкспериментировав с различными архитектурами моделей и внедрив эффективные циклы обратной связи с пользователями.
  • Решения Gen AI обучаются с использованием огромных объемов данных, которые быстро устаревают. В результате вам придется регулярно переобучать свою модель, что увеличивает стоимость реализации генеративного ИИ.
  • Модели Фонда, обученные на конкретных данных, таких как записи электронных медицинских карт (ЭМК), могут с трудом создавать достоверный контент за пределами их непосредственного опыта. С другой стороны, модели общего назначения плохо справляются с запросами пользователей, специфичными для предметной области. Некоторые способы решения этой проблемы включают создание гибридных моделей, использование методов трансферного обучения и тонкую настройку моделей на основе отзывов пользователей.
  • Решения Gen AI по своей природе являются «черным ящиком», а это означает, что редко бывает ясно, почему они дают определенные результаты и как оценить их точность. Это отсутствие понимания может помешать разработчикам настраивать модели. Следуя объяснимым принципам ИИ во время генеративного обучения модели ИИ, например, внедряя методы интерпретации модели, механизмы внимания и контрольные журналы, вы можете получить представление о процессе принятия решений модели и оптимизировать ее производительность.


Кроме того, есть несколько вопросов, на которые ваша компания должна ответить, прежде чем приступить к внедрению генеративного ИИ:


  • Существует ли надежная стратегия покупки или сборки, позволяющая убедиться, что ваша компания применяет генеративный ИИ только в тех функциях, где технология станет отличительной чертой, предотвращая при этом привязку к поставщику? Эту стратегию следует дополнить подробной дорожной картой по управлению изменениями и масштабированию поколения ИИ, а также положениями по перепроектированию всех бизнес-процессов, если возникнет такая необходимость.
  • Обладает ли ваш собственный ИТ-отдел адекватными навыками MLOps для тестирования, точной настройки и поддержания качества сложных моделей машинного обучения и данных их обучения? Если нет, то выбрали ли вы уже надежную компанию по разработке искусственного интеллекта, которая возьмет на себя решение этих задач?
  • Есть ли у вас значительный объем вычислительных ресурсов как в облаке, так и на периферии? Кроме того, важно оценить масштабируемость вашей ИТ-инфраструктуры, а также возможность повторного использования моделей искусственного интеллекта поколения для различных задач, процессов и подразделений.
  • Есть ли у вашей компании или вашего партнера по разработке ИИ навыки для проверки осуществимости Gen AI посредством проверки концепции (PoC) и масштабирования ваших экспериментов за пределами контролируемой среды «песочницы»?
  • И последнее, но не менее важное: есть ли в вашей организации эффективные механизмы конфиденциальности и безопасности для защиты конфиденциальной информации и обеспечения соответствия отраслевым и региональным нормам?


Наличие хорошо продуманного плана внедрения не только поможет вам без риска внедрить технологию и быстрее получить выгоду, но и снизить затраты на генеративный ИИ.


Воспользуйтесь нашими консультационными услугами по генеративному ИИ, чтобы выяснить, поможет ли генеративный ИИ вам обновить бизнес-процессы, выбрать правильный подход к внедрению генеративного ИИ и оптимизировать затраты на генеративный ИИ. Напишите нам , чтобы начать работу!


Также опубликовано здесь .