複数の技術図面処理プロジェクトに携わってきた経験から、エンジニアリング図面の自動化プロジェクトが当社にやってくるのは時間の問題でした。エンジニアリング図面の何が特別なのか、と疑問に思うかもしれません。 幾何公差注釈 (GD&T) がその答えです。これらの厄介なラベルは、ページ上の位置や全体的な構造のせいで、エンジニアリング図面からデータを処理および抽出するときに課題となることがよくあります。でも心配しないでください。エンジニアリング図面の GD&T 注釈を AI で処理する方法をここでご紹介します。まずは最初から始めましょう。 非構造化ドキュメントの処理 すべてのデジタル文書は、構造化文書と非構造化文書の 2 種類に分けられます。 事前に定義された構造に従うため、AI で簡単に処理および分析できます。フォーム、請求書、領収書、アンケート、契約書などのドキュメントはすべて、構造化ドキュメントの例です。 構造化ドキュメントは 逆に、 には一貫した構成がないため、自動的に処理することが本質的に困難です。非構造化ドキュメントの例には、新聞、研究論文、ビジネス レポートなどがあります。 非構造化ドキュメント ご想像のとおり、技術図面は非構造化文書の典型的な例です。厳格な一連の標準に準拠しているにもかかわらず、厳格な構造がないため、各図面は互いに異なります。入力されたテキスト データと手書きのテキスト データ、特殊な記号、複雑なスプレッドシート、さまざまな注釈が混在する技術図面では、データを自動的に抽出することが非常に困難です。 技術図面は複雑な性質を持っているため、AI データ抽出に最適です。実際、ニューラル モデルを使用して図面からさまざまなデータを検出して抽出することが、図面の処理を自動化する唯一の方法です。最新のコンピューター ビジョン モデルと製品開発へのスマートなアプローチにより、あらゆる技術図面を迅速に処理できる強力なツールが生まれます。 既成ツールの問題 Google で簡単に検索すると、エンジニアリング図面を処理するためのソリューションが少なくとも 2 つは見つかります。そのほとんどすべてが幅広い機能を備えており、複雑なデータを迅速かつ正確に処理できます。 一見すると、月額サブスクリプション料金を支払ってエンジニアリング図面を高精度に処理できるというのは、非常に有望に思えるかもしれません。しかし、実際には物事はそれほどスムーズに進まないことがよくあります。 既製のツールでは、アルゴリズムが「共通分母」を処理するようにのみトレーニングされているため、回転した要素を検出して処理するのが難しいことがよくあります。この場合、共通分母とは、ラベルと注釈が水平に配置されたエンジニアリング図面です。 したがって、既製のソリューションの使用は、図面が比較的単純で、標準データのみが含まれている場合にのみ適しています。 「共通分母」からの逸脱は、既製のツールにとって課題となります。 エンジニアリング図面からの特徴抽出 まさにこの状況が、当社の顧客の 1 社で発生しました。市場にあるエンジニアリング図面を処理するソリューションでは、複雑な図面や非標準の図面を処理するニーズに応えられず、データ認識結果が不十分でした。  GD&T 注釈には、図面から抽出してさらに処理するために不可欠な非常に重要な情報が多数含まれていますが、ページ上の注釈の位置 (この場合、注釈が斜めに配置されているため) により、既製の AI ツールによる図面の分析プロセスが妨げられます。 ここでカスタム AI 開発が役立ちます。特定のドキュメントから情報を検出して抽出するようにトレーニングされた AI モデルは、既製のツールが解決できない (ほぼ) すべての課題を解決できます。 ここでは、カスタム AI モデル開発を使用してエンジニアリング図面を処理する際の課題の 1 つである、斜めに配置された GD&T 注釈の抽出を解決した方法を説明します。 ステップ1: 注釈の位置を検出する 最初のステップは、図面上の注釈の位置を特定することです。AI モデルは、注釈の位置や回転角度に関係なく、注釈の位置を検出するようにトレーニングできます。 注: 複数ページのドキュメントでは、ドキュメントをページに分割し、さまざまなエンジニアリング図面を区別するという追加の手順が必要です。各ページに複数の図面が含まれているドキュメントでも同様です。まずモデルを実行して各図面を検出し、ドキュメントから抽出する必要があります。 ステップ2: 回転角度を検出する ここで重要なのは、注釈がどのように回転しているかを検出することです。AI モデルは回転角度を計算し、注釈を水平になるように回転させる必要があります。切り取られた PNG は、その後の処理に渡されます。 ステップ3: 注釈からデータを抽出する すべての注釈が検出され、回転され、図面から抽出された後、それらはシンボル検出エンジンに通されます。Tesseract は認識精度が高く、複数行のテキストや高さの異なるシンボルを処理できるため、この目的に適しています。 まず、シンボル認識プロセスを改善するために、テキストが配置されている正確な領域を見つける必要があります。OpenCV はこれらのタスクを非常にうまく処理し、比較的簡単に操作できるため、OpenCV の使用をお勧めします。次に、検出されたテキスト領域が OCR エンジンに渡され、すべてのテキストとシンボルが抽出されます。 ステップ4: データの分析 人間やデータ管理システムが理解して処理できる「理解しやすい」データを提供するには、文字、数字、記号の配列を解釈する必要があります。検出された記号は、部品の寸法、許容差、フィット、半径を形成するグループに分けられます。 ステップ5: データ管理 AI システムによって抽出されるデータは、ニーズに応じて抽出する必要があります。   ：既存のソフトウェアにデータをインポートするのに最適です。 JSONファイル   : システム テストや少量のデータに最適な、読みやすいデータ形式です。 .XLSX ファイル : データは追加処理されてデジタル ドキュメント処理システムに直接送信されます。完全なソリューションを求めている方に最適です。  後処理 まとめ 市場には文書処理用の AI ツールが溢れていますが、それらは単純なファイルしかうまく処理できません。「標準」から外れたものは、カスタム ソリューションで処理した方がよいでしょう。 適切なアプローチと開発者のスキルがあれば、カスタム AI モデルは事実上すべてのデータ抽出タスクを処理できます。 私が書いた技術図面はエンジニアリング図面だけではありません。 。   AIが建築図面の処理にどのように役立つか

This story contains new, firsthand information uncovered by the writer.

Start working on your AI project

このオーディオは、ストーリーの元の言語で制作されています。

AI でエンジニアリング図面を処理する方法

About Author

コメント

ラベル

この記事は

Related Stories

AI の力を解き放つ。最先端技術の体系的レビュー: 概要と序論

フロキのヴァルハラがインドのスリランカツアーのアソシエイトスポンサーに加わる

クラウド移行を成功させるための完全ガイド: 戦略とベストプラクティス

フォーラムからフィードへ: ソーシャルメディアアルゴリズムがデジタルインタラクションを形作る仕組み

AI の力を解き放つ。最先端技術の体系的レビュー: 概要と序論

フロキのヴァルハラがインドのスリランカツアーのアソシエイトスポンサーに加わる

クラウド移行を成功させるための完全ガイド: 戦略とベストプラクティス

フォーラムからフィードへ: ソーシャルメディアアルゴリズムがデジタルインタラクションを形作る仕組み

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps