Трюк, який Agentic Frameworks застосував до нас

Найбільший трюк, який будь-коли використовував диявол, — це переконати світ, що він не існує… Ви чули відому фразу: «Найбільший трюк, який будь-коли використовував диявол, — це переконати світ, що він не існує». Богословські посилання тут доречні, тому що манія навколо Generative AI більше, ніж будь-який технологічний прогрес останніх часів, більше релігія, ніж наука чи інженерія. Метою цього блогу є не боротьба з потягом ажіотажу (я пропоную ) для противаги. Це критичний аналіз зміїної олії, яка продається нічого не підозрюючому споживачеві. У мене проста теза. Фреймворки агентського штучного інтелекту є ненадійними та принципово нереалістичними абстракціями. Для створення складних, ланцюжкових і повторюваних потоків за допомогою LLM потрібні знання, навички та наполеглива робота. Гері Маркуса Спокусливо шукати ярлик, срібну кулю; але ви можете або їздити на хайп-поїзді, доки рейки не зійдуть, або побудувати фундамент для тривалого шляху. Що таке Agentic AI? Розрізнення зерна від полови «Agentic AI – це новаторський прогрес у сфері штучного інтелекту. Поєднання різних методів, моделей і підходів штучного інтелекту створює нову породу автономних агентів, які можуть аналізувати дані, встановлювати цілі та вживати заходів для їх досягнення — і все це з мінімальним контролем людини. Agentic AI дозволяє цим автономним агентам досягти майже людського пізнання в багатьох сферах, перетворюючи їх на машини для вирішення проблем, які процвітають у динамічних середовищах і постійно навчаються та вдосконалюються з кожною взаємодією. Нічого собі Дивовижно. Розумний. Абсолютна нісенітниця також... Дай я спробую, Агентський штучний інтелект — це використання Generative AI у складних робочих процесах. Результати, отримані LLM, можуть відповідати або не відповідати поставленому завданню. Agentic AI успадковує витонченість, інтелектуальність і надійність своїх результатів із системних інструкцій і програм, більшість з яких є дуже абстрактними, написаними новачками, і призведе до того, що система майже не функціонує. Agentic AI чудово підходить для створення демонстрацій для недосвідчених споживачів, але загалом погано підходить для будь-яких випадків використання, коли результат дійсно важливий. Це не спрацює взагалі, якщо ви не експерт, але ви майже напевно не є. Дозвольте мені бути ясним: я нітрохи не скептично ставлюся до Gen AI, я вважаю, що його використовують досвідчено, і за допомогою інструментів, яких ще немає, ми можемо реалізувати робочі процеси, які змінять спосіб виконання завдань. Можливо, не в тій мірі, про яку говорять пророки ШІ, але точно в міру зміни парадигми для багатьох способів роботи. Невипадково першим вбивчим випадком використання Gen AI є програмування, тому що програмування завжди буде першою сферою, яка отримає належні інструменти та інфраструктуру. Причина цього проста. Ми створюємо інструменти та інфраструктуру для інструментів програмування за допомогою, е-е-е, програмування. Програмування — справа низького рівня, ідеальний випадок першого використання. Це також навичка, яка, до речі, все ще буде (якщо не «самою») актуальною та найбільш бажаною здатністю протягом днів, тижнів, місяців, років і, можливо, майбутніх поколінь. Інструменти кодування довели потенціал Gen AI. У мене є два окремих інструменти LLM, які я (плачу та) використовую щодня для кодування, оскільки вони часто блокуються через величезний попит та зелену інфраструктуру. Я використовую їх одночасно в різних вікнах IDE. Це тому, що вони нові, тому повільні та іноді нестабільні. Незважаючи на це, вони революціонізували мій робочий процес. У мене поганий день, коли я завантажую свій комп’ютер, і Клод зайнятий, тому я замість цього розмовляю з o1-mini. І це початок того, як штучний інтелект покоління змінить ваш спосіб роботи… Ці інструменти створюються з нуля; вони абсолютно нові і ще не надійні. Це захоплююче, тому що це початок. Ми в середині нової хвилі. Що підводить мене до теми цього блогу. Брехня та надмірність, якими є Agentic AI. Брехня Agentic AI Проста абстракція складного ненадійного API. Багато років тому я керував агенцією розробки, і до нашої команди приєднався щойно закінчений розробник. Я поставив їм досить просте завдання (створити веб-форму на PHP). Я б перевірявся регулярно. «Як справи? «Дійсно добре! Минали дні й тижні, і тап тап тап пішов з клавіатури. Це зайняло надто багато часу, тому я підійшов до програміста й попросив їх показати мені код, над яким вони працювали. Це був вкладений шар циклів forEach, що охоплював тисячі рядків коду. У мене впало живіт (клієнт цього чекав…), і я втратила слова. Це був фізичний удар, все клацнуло. Це була моя вина, що я не надав вказівок? Чи був програміст програною справою? Якого біса я скажу клієнту, який повинен за це заплатити? (Ми виставили рахунок за час, а не за результати…) Причина, по якій я відволікаюся, полягає в тому, що це те саме відчуття, яке я відчуваю, коли читаю документи для будь-якої Agentic Framework, з якою я стикався. Я не одна. Я не хочу вибирати якусь конкретну структуру (я ще не знайшов жодної Python Agentic Framework, до якої я не можу це застосувати), але коли ваші документи починають говорити про ролі, працівників, босів і передісторії, починається вся концепція читати як фантастичний роман. Причина в тому, що все ЦЕ фантастичний роман. Це революційний і складний інструмент, створений на основі новаторської технології, який працює з коробки для початківців. І як би заплутано та суперечливо це не звучало. Я не кажу, що складні робочі процеси LLM не можуть працювати; Я кажу, що необхідний досвід і рівень контролю нюансів є надзвичайно високими, і створення «простих і доступних» фреймворків просто неможливо, доки інструменти не стануть більш зрілими, а основи – надійнішими. Зараз у світі є дуже мало людей (хоча вони є серед нас!), які володіють досвідом, щоб створювати та підтримувати надійні, складні ітераційні робочі процеси (засновані на Gen AI чи ні!), які працюють і відповідають визначенню Agentic. робочі процеси, які продаються в більшості. Але ось що мене непокоїть; ці кілька піонерів працюють над передовими варіантами використання, про які ми, ймовірно, не знаємо. Вони не створюють публічних повідомлень у Twitter, не пишуть блоги та практичні посібники. Вони не зосереджені на створенні фреймворку, тому ви можете легко автоматизувати свої публікації в LinkedIn. Вони ведуться тихо і за зачиненими дверима. Я розумію, справді розумію. Люди хочуть мати доступну, просту у використанні структуру, яка дозволить їм будувати надійні та складні робочі процеси з реальними бізнес-результатами. Я хочу багато чого. Еліксир життя. Вирости на кілька сантиметрів вище. Стань чемпіоном з тенісу в моєму спортивному клубі. Більш імовірно, що я стану високим місцевим чемпіоном з тенісу з вічною молодістю, ніж будь-яка з цих агентських фреймворків працюватиме для середнього користувача. Повірте мені та всім, хто бачив, як я граю в теніс, коли я скажу, що це вкрай малоймовірно. Фреймворки Agentic — це спроба створити конструктор веб-сайтів WYSIWYG ще до того, як ми навіть узгодили єдиний стандарт для HTML. Вони недоношені. Це не той випадок, коли віз перед конем; це спроба побудувати ракетний корабель до того, як ми відкрили електрику. Кон’юнктурне захоплення землі, яке вже вдалось. Шари абстракцій Зламаний інструмент. Проблема з наданням інструменту або фреймворку, який дозволяє абстрагувати функціональність, полягає в тому, що він постачається з набором припущень. Коли я купую молоток, я припускаю, що він працюватиме. Коли я купую очищувач високого тиску, я припускаю, що він працюватиме. Проблема в тому, що коли я використовую фреймворк, я припускаю, що він працюватиме. Але це буквально неможливо, враховуючи зрілість базової технології. Agentic Frameworks не тільки не збільшує поширення, але й продає ілюзію на додачу до висококонтрольованих демонстрацій і обмежених випадків використання, які ніколи не працюватимуть у руках звичайного користувача (а їх мільйони…). Шкода, яку вони завдають, значна. Подібно до того, як сьогоднішні розробники вивчають React, перш ніж вивчати javascript, або приймають фреймворки, перш ніж вивчати принципи програмування. Покоління ентузіастів-технологів стрибає на потяг ажіотажу, щоб вивчити структуру «x». Ось у чому справа; це не спрацює (за будь-яким розумним стандартом), насправді, створення демонстрації чи прототипу саме по собі є досягненням. Але це не означає, що Gen AI або LLMs «не» працюють, навіть якщо це стане припущенням у короткостроковій перспективі. Це просто означає, що ми не досягли рівня зрілості базової технології, щоб мати можливість безпечно створювати надійні абстракції на її основі. Надто багато проблем, які потрібно вирішити спочатку. Кілька фундаментальних проблем, які необхідно вирішити на глибокому рівні провайдерам LLM, включають, але не обмежуються: Затримка Доступність Безпека Надійний вихід масштаб Тож так, я хочу сказати, що основні API часто перевантажені використанням; вони повільні, вразливі до злому (особливо оперативного злому) і вносять критичні зміни щотижня. Справжні новатори наполегливо працюють над цими проблемами за зачиненими дверима. Але поки ми не досягнемо більшого прогресу, бажаємо успіхів у створенні надійної виробничої системи, а тим більше рамок. Якщо у вас немає розуміння базових API (до речі, це дійсно цінний прорив, над яким ми всі працюємо), як ви можете побудувати систему на його основі? Деякі API не вимагають від нас розуміння їхніх обмежень, головним чином тому, що вони є чорною скринькою, яка просто працює. Пройдуть роки, якщо не ціле покоління, щоб LLM досягли цього рівня зрілості, до того часу він повинен мати попереджувальний знак «Використовувати тільки для експертів». Неможливо побудувати надійну абстракцію на рухомих пісках. Насправді це порушує основний принцип комп’ютерного програмування. Абстракція в інформатиці - це процес видалення елементів, які відволікають увагу від більш важливих елементів. Ми не можемо зосередитися на деталях високого рівня, коли система низького рівня ненадійна; нам потрібно розуміти нюанси та використовувати їх у рамках складної парадигми. Це не чарівний фреймворк із низьким рівнем/без коду (з фантастичними абстракціями). Це штовхає нас у корито розчарування, яке, хоча саме по собі не є проблемою, оскільки дає простір для створення справжньої цінності, спостерігати все ж розчаровує. Найбільший трюк Винахід колеса в юрську еру. Найбільший трюк, який коли-небудь використовували фреймворки Agentic AI, це переконати вас, що вони необхідні. Вони є дияволом ландшафту LLM. Вам не потрібні команди, агенти, передісторії та красиві графічні інтерфейси, які показують вам те, що ніколи не працюватиме. Ви повинні розуміти, що магістратури — це потужні інструменти, які ви повинні зрозуміти без історій із фентезійного роману. Ваші програми Hello World і демонстраційні програми слід створювати вручну в коді. Коли ви зрозумієте, як, чому і що, і зможете контролювати вхідні та вихідні дані моделей Gen AI, тоді у вас буде основа, щоб вийти у світ і створити щось корисне. І це, ймовірно, займе деякий час. Не з чарівниками, менеджерами, агентами та драконами, а з точним детермінованим використанням прориву в ШІ. Спочатку опубліковано: https://tyingshoelaces.com/blog/agentic-framework-lie