もしあなたのテスト スイートがボタンを動かすたびに壊れ、DIV が変化するたびに、または - 神はそれを禁止します - A / B テストが実行される場合、それは本当に何かをテストしますか? あなたが休憩しなければならなかった場合、あなたのチームは、ほとんどのエンジニアリングチームと同様に、UIの変化ごとに壊れるスクリプトベースのテストを修正し、維持するのにあまりにも多くの時間を費やしている可能性があります。 幸いなことに、AIがワークフローに加わり、リリースサイクルが終了し、UIが壊れず、すべてがうまくいくのですよね? この記事では、AIテストとは何ですか、そしてQAエージェントがどのように機能するかを解説します - あなたが実際にチームに役立つかどうかを決めることができます。 伝統的なテスト自動化が行うこと Playwright や Selenium のようなテスト自動化ツールは、ステップごとに一連の指示に従います. それは何かのようなものになります:この URL に移動し、特定の CSS 選択器で要素を見つけて、それをクリックし、このテキストが表示されることを主張します... それはすべて、あなたの製品が決して変化しない限り、素晴らしい機能します。 しかし、いわゆる「The 基本的に、スクリプトはUIが変化するだけでなく、指示が停滞しているためだけではなく、既存のテストを維持するために開発時間の30%～40%を費やしていると報告するチームは、実際のバグを見つけることや修正するのではなく、新しい機能を構築します。 良いテストを維持するために摩擦を増加させただけです。 selector treadmill AI code generation Cursor、Claude Code、Copilotなどのツールは、企業がより速くコードを送信するのを助けていますが、より多くの出力はまた、スプリントごとにより多くのUI変更、より多くのコードリファクター、より多くのコンポーネントが書き直されることを意味します。 A によると 自動化プラットフォームでは、適切なQAソリューションを持たない高性能チームは、2週間のサイクルでスプリントあたり約20のバグを経験し、コードの量が伸び続けると、この数は膨大に増加し、マニュアルテストも古典的なテスト自動化もそれに追いつけない。 フォレスター TEI研究 不幸な現実は、伝統的なテスト自動化は、物事が安定しているときに優れた投資収益(ROI)を生み出すことである(同じフォレスター研究は、これらのプラットフォームの1つで3年間で209%のROIを報告している)。 エージェントテストに入ります。 エージェントテストって何? 単純に言えば、エージェントテストは、与えられた目標を達成するためのAIに焦点を当てています。 テスト(これをクリックし、主張し、それからそれ)を試すには、あなたは言います。 チェックする how what 以下は「ユーザーがMサイズのハウディをコートに追加し、GooglePayでチェックアウトを完了できるようにする」という例文です。 AIエージェントは、その目標を実現するために任務を果たしています。 エージェントテストでは、QAエージェントはユーザーから目標を受け取って、システム内でそれをどのように完了するかを計算します。 反応パターン ほとんどのエージェントシステム、私たちが構築したシステムを含む ReActパターンに従う: テクノロジー observe —> decide —> act —> evaluate 
 
 
 
 
 注: QA エージェントは、まず、DOM とビジュアル レイアウトの両方、ページの現在の状態を調べます。 決定するか、考えるか:それはゴールについての理由です。 「カートに追加する」ボタンを探す必要があります. 私はカートのアイコンを持つ青いボタンを見ます。 Act: ユーザーが行うように行動します。 評価:アクションが効いたかどうかをチェックし、次に何をすべきかを決定します(繰り返します)。 ここでは、Webアプリの構造的および視覚的階層を理解し、ユーザーが取る道を再現する自律的なシステムについて話しています。 メモリーレイヤー 単一のテストを実行する前に、アプリケーションの構造的な理解を作成します.Our agents crawl your website or an app to map all the pages, flows, interactive elements, and relationships between elements into a knowledge graph. 当社のエージェントは、すべてのページ、フロー、インタラクティブな要素、および要素間の関係を知識グラフにマップします。 テクノロジー 私たちの地図の類似性をもう一度用いましょう。街を散策する観光客と、心からすべての街を知っている地元の人との違いを考えましょう。 エージェントテストが実践でどのように機能するか あなたが単一のテストを書く前に、エージェントはあなたのアプリをスクロールします。 基本的にエージェントがアプリを自主的に探索してユーザーフローやUI要素をマッピングし、理解します。 epistemic foraging 試み エージェントに「ユーザーがプロパティを検索、閲覧、閲覧、予約できるかどうかを確認する」などの最終目標を伝える簡単で自然なメッセージを書きます。 発見 エージェントは、すでにクロール中に学んだ構造を使用してアプリケーションをロードします. Now that it has a map of the pages and elements, it can start searching for the homepage, browser properties feature, booking buttons, and every other required option the way a human user would. ページと要素のマップを持っているので、ホームページ、ブラウザの属性機能、予約ボタン、およびすべての他の必要なオプションを探すことができます。 実行フロー エージェントはステップごとにテストを実行する(録音セッションを通じて完全なプロセスを観ることができます)。もし何かが予想外に起こった場合、たとえば望ましくない提案のように、エージェントはそれを観察し、それが目標への障害であることに気づき、それを閉じます。 主張 フローが完了すると、エージェントは目標が達成されたかどうかに基づいてパスまたは失敗を評価します。 現在、この結果を同等のPlaywrightスクリプトと比較します。 , locate the property search input using a specific selector or 特定のセレクターを使用してプロパティ検索を入力します。 , 場所を入力し、検索を起動し、結果ページを待ってロードし、プロパティのリストをクリックし、予約ボタンを検索して押す。 /home page data-testid CAPTCHA が追加され、テスト ID が改名され、または予約プロセスが追加ページに分割される限り、あなたはメンテナンスモードに戻ります。 エージェントテスト自動化がAI支援テストと異なる理由 正直、AIテストオートメーションとしてマーケティングされるツールの大半は、Playwrightのような時代遅れのテクノロジーのためのスクリプトを生成するウォレッパーにすぎません。 我々は、このような方法でエージェント自動化を使用することは、誤ったパラダイムでAIを使用することだと思っている - AI ウォレッパーを使用する結果は、独立して行動するAI エージェントと比較すると悪くなります。 
 
 
 
 
 
 ターゲット指向:テストは、実装プロセスではなく結果に焦点を当て、どのようにそこに到達するかです。 Perceptual: The agent views your application just like a real user would (visually + via HTML). It does not rely on selectors created by an individual to reference an element. これがなぜあなたのagentic tests will not break due to UI modifications. エージェントはあなたのアプリケーションを実際のユーザーのように(視覚的に + HTML 経由で)見ています。 あなたがポジションや「提出」ボタンを動かしたり、A/Bテストとして追加のステップを追加する場合、エージェントは、元の要素が動いたり、道が変わっても、目標を達成するための道を見つけることができます。 自己評価:エージェントテストでは、エージェントは、指定された目標が達成されたかどうかに基づいてパスまたは失敗を決定します。 継続的な学習:エージェントがアプリケーションとの相互作用を増やすほど、ハッピーパスシナリオと特定のユーザインターフェイスコンポーネントの「正常」タスクパフォーマンスとみなされるものを認識するのに役立ちます。 When Agentic Testing Is (and Isn't) the Right Fit(エージェントテストが(そして)適切ではない場合) これを売り過ぎるのは簡単なので、明日持っているPlaywrightに書かれたすべての脚本を捨てるべきではないと思います。 このアプローチが本当に : strong fit 
 
 
 
 
 End-to-end (E2E) ユーザフロー:オンボード、チェックアウト、アカウントの管理、およびすべての CRUD アクティビティを実行するもの。 Regression suites: あなたが手動でテストできるよりも速くリリースするUIを継続的に変更する。 急速に動くUI:新しいリリースをタイムリーに検証する。 複雑な製品:経験を検証する最良の方法は、手動テストだったが、明らかな理由から、それは十分に速く起こらない。 しかし、現時点では、それは以下に最適な解決策です: 
 
 
 Webgl ゲームや webgl ベースの UI も、エージェントがテストするのが難しい。 セッションからセッションまで非常にダイナミックなUIです。 現実は、私たちが話すほとんどのチームはハイブリッドアプローチを使用しています. 彼らは小さな詳細のためにスクリプトに依存し、AIエージェントが幅広く複雑なユーザーフローを処理できるようにします。 言い換えれば、エージェントQAを採用する企業は3カ月の返済で529%のROIを獲得した。 Wrapping Up エージェントテストは伝統的なテストフレームワークとはまったく異なるアプローチを表しており、あなたの望む目標と実際の結果との間の1対1の関係があります。 あなたのチームが実際のバグを見つけるよりもテストインフラを維持するのにより多くの時間を費やしている場合、エージェントテスト自動化はそのギャップを埋めるのに役立ちます。 詳しくはこちらをご覧ください!有用な素材はこちら: 
 
 
 「Manual to Autonomous QA: A Step-by-Step Transition Guide」 QA Automation Is Worth It? インテリジェントテストの本当のROI QA.tech で、当社のエージェントが次回のリリースのための重要なフローをどのように検証できるかをご覧ください。 書籍 A Demo

このオーディオは、ストーリーの元の言語で制作されています。

エージェントテストって何?

About Author

コメント

ラベル

この記事は

Related Stories

AI/ML データレイクのリファレンスアーキテクチャを構築するためのアーキテクトガイド

フロキのヴァルハラがインドのスリランカツアーのアソシエイトスポンサーに加わる

ユーザー中心の暗号通貨製品の作成: 顧客からのフィードバックの重要性

Claude Sonnet 3.5 システムプロンプトの漏洩: 法医学的分析

AI/ML データレイクのリファレンスアーキテクチャを構築するためのアーキテクトガイド

フロキのヴァルハラがインドのスリランカツアーのアソシエイトスポンサーに加わる

ユーザー中心の暗号通貨製品の作成: 顧客からのフィードバックの重要性

Claude Sonnet 3.5 システムプロンプトの漏洩: 法医学的分析

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps