paint-brush
Yapay Zeka ile Mühendislik Çizimleri Nasıl İşlenirile@olegkokorin
Yeni tarih

Yapay Zeka ile Mühendislik Çizimleri Nasıl İşlenir

ile Oleg Kokorin5m2024/08/29
Read on Terminal Reader

Çok uzun; Okumak

Mühendislik çizimleri karmaşık, yapılandırılmamış belgelerdir ve bu da bunların dijital belgeleri işlemenin geleneksel yollarıyla işlenmesini zorlaştırır. Öte yandan AI, özellikle mühendislik çizimlerini işlemeye odaklanmış görünen hazır AI araçları, hızlı ve doğru veri çıkarmayı vaat eder. Ancak pratikte işler göründüğü kadar iyi değildir: mühendislik çizimleri, yapılandırılmamış yapıları nedeniyle önceden yapılmış AI sistemleri için önemli bir zorluk oluşturur. Bu makalede AI'nın yüksek doğrulukla gerçekten işlevsel bir mühendislik çizim işleme sistemi oluşturmak için nasıl kullanılabileceğini paylaşıyorum.
featured image - Yapay Zeka ile Mühendislik Çizimleri Nasıl İşlenir
Oleg Kokorin HackerNoon profile picture
0-item

Birçok teknik çizim işleme projesinde çalıştıktan sonra, bir mühendislik çizimi otomasyon projesinin elimize ulaşması an meselesiydi. Mühendislik çizimlerinde ne özeldir diye sorabilirsiniz?


Geometrik boyutlandırma ve tolerans açıklamaları (GD&T) sizin cevabınızdır. Bu can sıkıcı etiketler, bir sayfadaki konumları ve genel yapıları nedeniyle mühendislik çizimlerinden veri işlerken ve çıkarırken sıklıkla zorluk yaratır. Ancak endişelenmeyin — GD&T açıklamalarını yapay zeka ile mühendislik çizimlerinde nasıl işlediğimizi paylaşmak için buradayım. Yine de en baştan başlayalım.

Yapılandırılmamış Belgelerin İşlenmesi

Tüm dijital belgeler 2 türe ayrılabilir: yapılandırılmış ve yapılandırılmamış:


  • Yapılandırılmış belgeler önceden tanımlanmış bir yapıyı takip eder ve bu da bunların AI ile işlenmesini ve analiz edilmesini kolaylaştırır. Formlar, faturalar, makbuzlar, anketler ve sözleşmeler gibi belgelerin hepsi yapılandırılmış belgelerin örnekleridir.


  • Aksine, yapılandırılmamış belgeler tutarlı bir organizasyondan yoksundur ve bu da onları otomatik olarak işlemeyi doğal olarak zorlaştırır. Yapılandırılmamış belgelere örnek olarak gazeteler, araştırma makaleleri ve iş raporları verilebilir.


Tahmin edebileceğiniz gibi, teknik çizimler yapılandırılmamış bir belgenin klasik bir örneğidir: katı bir standart setine bağlı kalmalarına rağmen, her çizim katı bir yapıya sahip olmadıkları için diğerinden farklıdır. Yazılı ve elle yazılmış metin verileri, özel semboller, karmaşık elektronik tablolar ve çeşitli açıklamalarla bir araya geldiğinde, teknik çizimler verileri otomatik olarak çıkarmak için gerçek bir zorluk sunar.


Teknik çizimlerin karmaşık yapısı onları AI veri çıkarma için mükemmel bir aday yapar. Aslında, çizimlerden çeşitli verileri tespit etmek ve çıkarmak için sinir modellerini kullanmak, bunların işlenmesini otomatikleştirmenin tek yoludur. Modern bilgisayarlı görüş modelleri ve ürün geliştirmeye yönelik akıllı bir yaklaşım, herhangi bir teknik çizimin hızlı işlenmesi için güçlü bir araç sağlayabilir.

Hazır Araçlardaki Bir Sorun

Hızlı bir Google araması size mühendislik çizimlerini işlemek için en azından birkaç çözüm gösterecektir. Neredeyse hepsi geniş işlevsellik sunar ve karmaşık verilerin hızlı ve doğru bir şekilde işlenmesini vaat eder.


İlk bakışta bu çok umut verici gelebilir: Yüksek hassasiyetle mühendislik çizimlerini işlemek için aylık abonelik ücreti ödemek. Ancak pratikte işler çoğu zaman bu kadar pürüzsüz değildir.


Hazır araçlar, algoritmaları yalnızca "ortak paydayı" işlemek üzere eğitildiğinden, döndürülmüş öğeleri algılamakta ve işlemekte sıklıkla zorluk çekerler; bizim durumumuzda bu, yatay olarak konumlandırılmış etiketler ve açıklamalar içeren bir mühendislik çizimidir.

Bu nedenle hazır bir çözüm kullanmak yalnızca çizimleri nispeten basit olan ve yalnızca standart veriler içerenler için uygundur. "Ortak paydadan" herhangi bir sapma, hazır bir araç için bir zorluk oluşturacaktır.

Mühendislik Çizimlerinden Özellik Çıkarımı

Müşterilerimizden birinin başına tam olarak bu durum geldi: Piyasadaki mühendislik çizimlerinin işlenmesine yönelik çözümler, karmaşık veya standart dışı çizimlerin işlenmesine yönelik ihtiyaçları karşılamıyor ve bu da onların veri tanıma sonuçlarının zayıf olmasına neden oluyor.


GD&T ek açıklamaları, çizimden daha fazla işlem için çıkarılması hayati önem taşıyan çok sayıda önemli bilgi taşır; ancak sayfadaki konumları, bizim durumumuzda, açılı bir şekilde konumlandırılmış olmaları, önceden hazırlanmış bir yapay zeka aracıyla çizimleri analiz etme sürecine engel teşkil eder.


İşte tam bu noktada özel yapay zeka geliştirme devreye giriyor: Belirli belgenizden bilgi algılamak ve çıkarmak üzere eğitilen yapay zeka modelleri, hazır bir aracın uğraştığı (neredeyse) her türlü zorluğu çözebilir.


Özel yapay zeka modeli geliştirmeyle mühendislik çizimlerinin işlenmesindeki zorluklardan biri olan açılı olarak yerleştirilen GD&T açıklamalarının çıkarılması sorununu nasıl çözdüğümüzü anlatıyoruz.

Adım 1: Açıklama Pozisyonunu Algılama

İlk adım, çizimdeki açıklamaların konumunu belirlemektir. AI modelleri, açıklamaların konumunu, konumlarından veya dönüş açılarından bağımsız olarak algılamak üzere eğitilebilir.


Not: Çok sayfalı belgeler, belgeyi sayfalara bölme ve farklı mühendislik çizimleri arasında ayrım yapma gibi ek bir adım gerektirir. Aynısı, her sayfada birden fazla çizim bulunan belgeler için de geçerlidir: her çizimi algılamak ve bunları belgeden çıkarmak için önce bir model çalıştırmanız gerekir.

Adım 2: Dönüş Açısını Algıla

İşte önemli kısım: açıklamanın nasıl döndürüldüğünü tespit etmek. AI modelinin dönüş açısını hesaplaması ve açıklamayı yatay hale getirmek için döndürmesi gerekir. Kesilmiş PNG'ler daha sonra daha fazla işleme tabi tutulmak üzere aktarılır:

Adım 3: Açıklamalardan Veri Çıkarma

Tüm açıklamalar algılandıktan, döndürüldükten ve çizimden çıkarıldıktan sonra, bir sembol algılama motorundan geçirilirler. Tesseract bunun için iyi bir seçimdir çünkü yüksek tanıma doğruluğu sağlar ve farklı yüksekliklerdeki çok satırlı metin ve sembollerle çalışabilir.


İlk olarak, sembol tanıma sürecini iyileştirmek için metnin bulunduğu tam alanı bulmanız gerekir. Bu görevleri çok iyi hallettiği ve çalışması nispeten kolay olduğu için OpenCV'yi kullanmanızı öneririm. Sonra, algılanan metin alanı tüm metin ve sembolleri çıkarmak için OCR motoruna teslim edilir.

Adım 4: Verilerin Analizi

İnsanların veya bir veri yönetim sisteminin anlayabileceği ve işleyebileceği "sindirilebilir" veriler sağlamak için bir dizi harf, sayı ve sembolün yorumlanması gerekir. Algılanan semboller, parça boyutları, toleranslar, uyumlar ve yarıçaplar oluşturan gruplara ayrılır.

Adım 5: Veri Yönetimi

Bir yapay zeka sistemi tarafından çıkarılan verilerin ihtiyaçlarınıza göre çıkarılması gerekir:


  1. JSON dosyaları : Verileri mevcut yazılıma aktarmak için mükemmeldir.
  2. .XLSX dosyaları : Sistem testleri veya küçük veri grupları için mükemmel, okunması kolay bir veri biçimidir.
  3. Son işleme : Veriler ayrıca doğrudan dijital belge işleme sistemine gönderilmek üzere işlenir; eksiksiz bir çözüm arayanlar için harika bir çözümdür.

Özetle

  1. Piyasa, belgeleri işlemek için AI araçlarıyla dolu olsa da, bunlar yalnızca basit dosyaları iyi idare eder. "Norm"dan herhangi bir sapma, özel bir çözümle daha iyi işlenir.


  2. Doğru yaklaşım ve geliştirici becerileri sağlandığında, özel yapay zeka modelleri hemen hemen tüm veri çıkarma görevlerinin üstesinden gelebilir.


  3. Yazdığım tek teknik çizimler mühendislik çizimleri değil, şuraya göz atın: Yapay zekanın mimari çizimlerin işlenmesine nasıl yardımcı olabileceği burada .