paint-brush
AI でエンジニアリング図面を処理する方法@olegkokorin
新しい歴史

AI でエンジニアリング図面を処理する方法

Oleg Kokorin5m2024/08/29
Read on Terminal Reader

長すぎる; 読むには

エンジニアリング図面は複雑な非構造化文書であるため、従来のデジタル文書処理方法では処理が困難です。一方、AI は、特にエンジニアリング図面の処理に重点を置いた既製の AI ツールでは、迅速かつ正確なデータ抽出が可能です。しかし、実際には、物事は見た目ほど良くはありません。エンジニアリング図面は非構造化されているため、既製の AI システムにとって大きな課題となります。この記事では、AI を使用して、高精度で真に機能的なエンジニアリング図面処理システムを作成する方法について説明します。
featured image - AI でエンジニアリング図面を処理する方法
Oleg Kokorin HackerNoon profile picture
0-item

複数の技術図面処理プロジェクトに携わってきた経験から、エンジニアリング図面の自動化プロジェクトが当社にやってくるのは時間の問題でした。エンジニアリング図面の何が特別なのか、と疑問に思うかもしれません。


幾何公差注釈 (GD&T) がその答えです。これらの厄介なラベルは、ページ上の位置や全体的な構造のせいで、エンジニアリング図面からデータを処理および抽出するときに課題となることがよくあります。でも心配しないでください。エンジニアリング図面の GD&T 注釈を AI で処理する方法をここでご紹介します。まずは最初から始めましょう。

非構造化ドキュメントの処理

すべてのデジタル文書は、構造化文書と非構造化文書の 2 種類に分けられます。


  • 構造化ドキュメントは事前に定義された構造に従うため、AI で簡単に処理および分析できます。フォーム、請求書、領収書、アンケート、契約書などのドキュメントはすべて、構造化ドキュメントの例です。


  • 逆に、非構造化ドキュメントには一貫した構成がないため、自動的に処理することが本質的に困難です。非構造化ドキュメントの例には、新聞、研究論文、ビジネス レポートなどがあります。


ご想像のとおり、技術図面は非構造化文書の典型的な例です。厳格な一連の標準に準拠しているにもかかわらず、厳格な構造がないため、各図面は互いに異なります。入力されたテキスト データと手書きのテキスト データ、特殊な記号、複雑なスプレッドシート、さまざまな注釈が混在する技術図面では、データを自動的に抽出することが非常に困難です。


技術図面は複雑な性質を持っているため、AI データ抽出に最適です。実際、ニューラル モデルを使用して図面からさまざまなデータを検出して抽出することが、図面の処理を自動化する唯一の方法です。最新のコンピューター ビジョン モデルと製品開発へのスマートなアプローチにより、あらゆる技術図面を迅速に処理できる強力なツールが生まれます。

既成ツールの問題

Google で簡単に検索すると、エンジニアリング図面を処理するためのソリューションが少なくとも 2 つは見つかります。そのほとんどすべてが幅広い機能を備えており、複雑なデータを迅速かつ正確に処理できます。


一見すると、月額サブスクリプション料金を支払ってエンジニアリング図面を高精度に処理できるというのは、非常に有望に思えるかもしれません。しかし、実際には物事はそれほどスムーズに進まないことがよくあります。


既製のツールでは、アルゴリズムが「共通分母」を処理するようにのみトレーニングされているため、回転した要素を検出して処理するのが難しいことがよくあります。この場合、共通分母とは、ラベルと注釈が水平に配置されたエンジニアリング図面です。

したがって、既製のソリューションの使用は、図面が比較的単純で、標準データのみが含まれている場合にのみ適しています。 「共通分母」からの逸脱は、既製のツールにとって課題となります。

エンジニアリング図面からの特徴抽出

まさにこの状況が、当社の顧客の 1 社で発生しました。市場にあるエンジニアリング図面を処理するソリューションでは、複雑な図面や非標準の図面を処理するニーズに応えられず、データ認識結果が不十分でした。


GD&T 注釈には、図面から抽出してさらに処理するために不可欠な非常に重要な情報が多数含まれていますが、ページ上の注釈の位置 (この場合、注釈が斜めに配置されているため) により、既製の AI ツールによる図面の分析プロセスが妨げられます。


ここでカスタム AI 開発が役立ちます。特定のドキュメントから情報を検出して抽出するようにトレーニングされた AI モデルは、既製のツールが解決できない (ほぼ) すべての課題を解決できます。


ここでは、カスタム AI モデル開発を使用してエンジニアリング図面を処理する際の課題の 1 つである、斜めに配置された GD&T 注釈の抽出を解決した方法を説明します。

ステップ1: 注釈の位置を検出する

最初のステップは、図面上の注釈の位置を特定することです。AI モデルは、注釈の位置や回転角度に関係なく、注釈の位置を検出するようにトレーニングできます。


注: 複数ページのドキュメントでは、ドキュメントをページに分割し、さまざまなエンジニアリング図面を区別するという追加の手順が必要です。各ページに複数の図面が含まれているドキュメントでも同様です。まずモデルを実行して各図面を検出し、ドキュメントから抽出する必要があります。

ステップ2: 回転角度を検出する

ここで重要なのは、注釈がどのように回転しているかを検出することです。AI モデルは回転角度を計算し、注釈を水平になるように回転させる必要があります。切り取られた PNG は、その後の処理に渡されます。

ステップ3: 注釈からデータを抽出する

すべての注釈が検出され、回転され、図面から抽出された後、それらはシンボル検出エンジンに通されます。Tesseract は認識精度が高く、複数行のテキストや高さの異なるシンボルを処理できるため、この目的に適しています。


まず、シンボル認識プロセスを改善するために、テキストが配置されている正確な領域を見つける必要があります。OpenCV はこれらのタスクを非常にうまく処理し、比較的簡単に操作できるため、OpenCV の使用をお勧めします。次に、検出されたテキスト領域が OCR エンジンに渡され、すべてのテキストとシンボルが抽出されます。

ステップ4: データの分析

人間やデータ管理システムが理解して処理できる「理解しやすい」データを提供するには、文字、数字、記号の配列を解釈する必要があります。検出された記号は、部品の寸法、許容差、フィット、半径を形成するグループに分けられます。

ステップ5: データ管理

AI システムによって抽出されるデータは、ニーズに応じて抽出する必要があります。


  1. JSONファイル:既存のソフトウェアにデータをインポートするのに最適です。
  2. .XLSX ファイル: システム テストや少量のデータに最適な、読みやすいデータ形式です。
  3. 後処理: データは追加処理されてデジタル ドキュメント処理システムに直接送信されます。完全なソリューションを求めている方に最適です。

まとめ

  1. 市場には文書処理用の AI ツールが溢れていますが、それらは単純なファイルしかうまく処理できません。「標準」から外れたものは、カスタム ソリューションで処理した方がよいでしょう。


  2. 適切なアプローチと開発者のスキルがあれば、カスタム AI モデルは事実上すべてのデータ抽出タスクを処理できます。


  3. 私が書いた技術図面はエンジニアリング図面だけではありません。 AIが建築図面の処理にどのように役立つか