OpenAI は数か月前に、ブラウザ内でタスクを実行できる AI エージェント し、大きな話題を呼んだ。🚨 Operator を発表 それ以来、他の多くの AI エージェント ブラウザーがこの分野に参入してきました。しかし、ここで大きな疑問があります。それらは本当に私たち全員が期待した革命を先導しているのでしょうか、それとも失敗しているのでしょうか? (ネタバレ: 😅)。 失敗しています! それで、彼らが失敗しているのなら、それはなぜでしょうか?🤔 さあ、この記事を読んで確かめてください!👇 待ってください... AI エージェント ブラウザとは何ですか? AI エージェント ブラウザは、 とも呼ばれ、AI エージェントが人間のユーザーのように Web ブラウザを制御できるようにするツールです。 ブラウザベース エージェント プロンプトを記述すると、AI がブラウザを制御して、ページの移動、フォームへの入力、データのスクレイピング、ワークフローの自動化などのタスクを完了します。 https://www.youtube.com/watch?v=gYqs-wUKZsM&embedable=true これらのツールは、多くの場合オープンソースのライブラリやフレームワークを利用しており、AI と Web のギャップを埋め、通常は人間の介入が必要なタスクを実行します。その目標は、面倒なタスクを AI に効率的かつ効果的に処理させることで、時間の節約を支援することです。⏳ AI エージェント ブラウザの失敗に関する残酷な真実 さて、ここで話題にしている「AI エージェント ブラウザの障害」は、単に AI がプロンプトからのタスクを台無しにしているだけだと思われるかもしれません。確かにそれは間違いなく問題であり、X では AI ブラウザが何度も失敗するというトレンド動画がいくつかあります...🤖💀 https://x.com/liambolling/status/1882565960697282812?embedable=true しかし、物事を客観的に捉えてみましょう。 。👶 🍼 (たとえば、 。) ブラウザベースの AI エージェントはまだ初期段階にあり、最初の一歩を踏み出したばかりです OpenAI は数か月前に発表したばかりです 初期の AI 画像ジェネレーターは、命がけで手を描くことすらできなかったが、今ではほとんどの人を騙すようなリアルな画像を作成できるようになった。同様に、AI エージェント ブラウザーもまだ未熟な段階にあるが、 。 時間とともに改善されるだろう そうですね、ウィル・スミスがスパゲッティを食べている AI 生成のビデオもどんどん良くなってきています...🍝 https://www.youtube.com/watch?v=bXKkZh2UEEA&embedable=true つまり、「AI エージェント ブラウザが失敗している」本当の理由は、時折の不器用さだけではありません 。ほとんどの Web サイトが簡単にブロックできるためです。🛑 結局のところ、AI ブラウザはボットであり、現代の Web サイトにはボットを阻止するためのボット対策が満載されています。 考えてみてください。AI を活用した自動化は素晴らしいですが、企業はすでに ( を思い出してください 🚨)。企業 (そしてユーザーである私たち) がうんざりするのも無理はありません。この新しいブラウザ エージェントの波は いるだけです。💪 🦾 ボット トラフィックに溺れています インターネット トラフィックのほぼ 3 分の 1 が悪質なボットから来ていること 、ボットとアンチボット技術の間の軍拡競争に拍車をかけて AI ブラウザ エージェントをシャットダウンするために使用される最も一般的なボット対策手法と、それがなぜそれほど効果的なのかを説明します。👀 CAPTCHA について ので、ここでは詳しくは述べません。そうです、CAPTCHA は人間にとっては簡単だがボットにとっては悪夢となる、厄介な小さなチャレンジですが、AI エージェント ブラウザーを阻止するのに効果的です。 これについてはすでに専用の記事で取り上げている https://x.com/kevinroose/status/1882885941033095271?embedable=true 面白いと思いましたか? 他の AI CAPTCHA の失敗もご覧ください! 衝撃的ですよね?ボットをブロックするために特別に作られたツール…実際にボットをブロックするのに優れています。誰が想像したでしょう?😐 しかし、本当の問題は 、CAPTCHA だけではないということです... ブラウザフィンガープリンティング ほとんどのウェブサイトは、ボット 🤖 と実際の人間のユーザー 👨💻 を区別するために を使用しています。 ブラウザ フィンガープリント それはどのように機能するのでしょうか? 画面解像度、ブラウザのバージョン、OS のバージョン、インストールされているプラグインなど、ブラウザに関する固有の詳細を収集して、ブラウザの「指紋」を作成します。次に、この指紋を既知の指紋と比較して、ユーザーが人間のように見えるかどうかを判断します。 現在、AIエージェントブラウザは に依存しています。 、Playwright、Puppeteer、Selenium(または大手AI企業が開発した独自のツール)などのブラウザ自動化テクノロジー 結局のところ、AI エージェント ブラウザは魔法ではありません 🪄。Chrome などの既知のソリューションを使用して、基盤となるブラウザと対話する必要があります。少なくとも、ブラウザ エージェントを構築するための最も人気のあるオープンソース ライブラリ (Playwright に基づく など) はそれを行っています! 🔧 DevTools Protocol browser-use とはいえ、 が、これらは高度なフィンガープリンティング システムで簡単に検出できます。 ブラウザ自動化ツールは、ブラウザを制御するために必要な特別なパラメータやデフォルト設定など、いくつかの明らかな兆候や漏洩を残します 一度検出されると、リクエストが自動的にブロックされるか、よくあるように CAPTCHA が表示されるため、ゲームオーバーになります。 「ステルス プラグイン」はブラウザにパッチを当てて漏洩を隠すことができますが、これらのパッチはオープンソースであるため、アンチ AI ボット システムはそれを学習して回避することができます。簡単に言えば、これは勝者のいない継続的な戦いです... ⚔️ ブラウザ自動化ステルス プラグインについて詳しく知りたいですか? 以下の記事をお読みください。 Playwright Stealthでボット検出を回避する パペティアステルスでブロックされないようにする ユーザー行動分析 (略して ) は、エージェントベースのブラウザを阻止するために Web サイトが採用できるもう 1 つの強力な武器です。ブラウザの技術的な特性に重点を置く基本的なフィンガープリンティング システムとは異なり、UBA はユーザーがサイトとどのようにやり取りするかに注目します。 ユーザー行動分析 UBA 特に、UBA システムは、マウスの動き 🖱️、スクロール パターン 📜、キーストローク ⌨️、さらには各ページでの滞在時間 ⏱️ などの動作を追跡します。詳しくは、27 分 (はい、正しく読みました! 🤯) の「 」の記事をご覧ください。 ボット対策生体認証保護について AI エージェント ブラウザは、どれほど人間らしく動作しようとしても、不自然にスムーズまたは「完璧な」マウスの動きを伴う予測可能なパターンに従う傾向があり、これは UBA によって簡単に見分けられます。 もちろん、すべてのサイトが UBA を採用しているわけではありません。UBA を効果的に機能させるには、大量のデータをリアルタイムで収集して分析する必要があり、帯域幅を大量に消費する可能性があります 💻⇄💻。また、UBA システムは、その背後にあるヒューリスティックと ML モデルが原因で誤検知を生成することがあります... しかし、AI エージェント ブラウザ ボットが増加していることから、 そして将来的には、これらのシステムはこれまで以上に手頃な価格で効果的なものになるでしょう。 UBA がボット検出においてさらに大きな役割を果たすことは明らかです。 AIエージェントブラウザを破壊するその他のボット対策 ボットを止めるのは芸術であり、多くのトリックが関係します!🧙♂️ ほとんどのボット対策システムには、ツールボックスにたくさんのツール🧰があり、切り札もたくさんあります♠️。先ほど、新しい AI エージェント ブラウザーに対して最も効果的なものについて説明しました。しかし、それだけではありません。 知っておくべきボット対策トップ5 TLS フィンガープリンティングとは何ですか? 効果的な Web 自動化のための JavaScript の課題の回避 プロキシを使用して IP 禁止を回避する方法 また、高度で最新のボット対策戦術については、以下のビデオもお見逃しなく: 🎥 https://www.youtube.com/watch?v=RArxdFeijd4&embedable=true AI エージェント ブラウザの障害とはおさらばです。修正方法は次のとおりです。 さて、この記事で何を学びましたか?🤔 ほとんどの AI エージェント ボットは、既存のボット対策ソリューションによって簡単に検出 (および停止) できることを学びました。一部の高度なシステムはユーザーの行動に基づいてブロックしますが、ほとんどのブロックは依然としてフィンガープリントや CAPTCHA などの従来の手法に依存しています。🔒 したがって、AI エージェント ブラウザ エージェントの本当の弱点は、AI 自動化技術そのものではなく、それらが使用するブラウザ (通常は Chromium またはその修正バージョン) であると言えます。 ためです。 これは簡単に検出できる ここで、次のような機能を備えたブラウザを想像してください。 クラウドで無限に拡張☁️ 、 、 などの人気の自動化ツールや、 、 、 などの新しい AI ベースのツールと統合します🤖 Playwright Puppeteer Selenium Stagehand browser-use Midscene.js 7,200 万の高品質な住宅 IP にわたるシームレスなプロキシ統合により、IP 禁止を回避します 🌍 ブラウザのフィンガープリントの問題を防ぐ 🕵️♂️ 組み込みのプロキシサポートで地理的制限を回避🌏 reCAPTCHA、hCaptcha、SimpleCaptcha など、人気のプロバイダの CAPTCHA を自動的に解決します 🛡️ まあ、もしそのブラウザが存在したとしたら、現在の AI エージェント ブラウザよりもはるかに効果的でしょう。何だと思いますか? それは存在するのです! 🙌 ➡️ : 解決策 Bright Data の ブラウザ エージェントです! https://www.youtube.com/watch?v=kuDuJWvho7Q&embedable=true あらゆるボット対策システムを回避するように特別に設計されたブラウザで、ブロックなしで AI を活用したブラウザ自動化をお楽しみください。🎉 最後に AI エージェント ブラウザは、インターネット上での面倒なタスクの処理方法に革命をもたらします。🌐 しかし、自動化に使用するブラウザは、従来のブラウザ自動化ボットと同じ古い問題に直面しています。つまり、アンチボット ソリューションが優位に立つことが多いのです。😬 組み込みのボット対策バイパスと、一般的なオープンソース AI ブラウザ エージェント ライブラリとのシームレスな統合を備えた を使用すると、面倒な作業を回避できます。 Browser Agent 次回まで、AI エージェントを使ってインターネットを自由に探索し続けてください。