Birçok teknik çizim işleme projesinde çalıştıktan sonra, bir mühendislik çizimi otomasyon projesinin elimize ulaşması an meselesiydi. Mühendislik çizimlerinde ne özeldir diye sorabilirsiniz?
Geometrik boyutlandırma ve tolerans açıklamaları (GD&T) sizin cevabınızdır. Bu can sıkıcı etiketler, bir sayfadaki konumları ve genel yapıları nedeniyle mühendislik çizimlerinden veri işlerken ve çıkarırken sıklıkla zorluk yaratır. Ancak endişelenmeyin — GD&T açıklamalarını yapay zeka ile mühendislik çizimlerinde nasıl işlediğimizi paylaşmak için buradayım. Yine de en baştan başlayalım.
Tüm dijital belgeler 2 türe ayrılabilir: yapılandırılmış ve yapılandırılmamış:
Tahmin edebileceğiniz gibi, teknik çizimler yapılandırılmamış bir belgenin klasik bir örneğidir: katı bir standart setine bağlı kalmalarına rağmen, her çizim katı bir yapıya sahip olmadıkları için diğerinden farklıdır. Yazılı ve elle yazılmış metin verileri, özel semboller, karmaşık elektronik tablolar ve çeşitli açıklamalarla bir araya geldiğinde, teknik çizimler verileri otomatik olarak çıkarmak için gerçek bir zorluk sunar.
Teknik çizimlerin karmaşık yapısı onları AI veri çıkarma için mükemmel bir aday yapar. Aslında, çizimlerden çeşitli verileri tespit etmek ve çıkarmak için sinir modellerini kullanmak, bunların işlenmesini otomatikleştirmenin tek yoludur. Modern bilgisayarlı görüş modelleri ve ürün geliştirmeye yönelik akıllı bir yaklaşım, herhangi bir teknik çizimin hızlı işlenmesi için güçlü bir araç sağlayabilir.
Hızlı bir Google araması size mühendislik çizimlerini işlemek için en azından birkaç çözüm gösterecektir. Neredeyse hepsi geniş işlevsellik sunar ve karmaşık verilerin hızlı ve doğru bir şekilde işlenmesini vaat eder.
İlk bakışta bu çok umut verici gelebilir: Yüksek hassasiyetle mühendislik çizimlerini işlemek için aylık abonelik ücreti ödemek. Ancak pratikte işler çoğu zaman bu kadar pürüzsüz değildir.
Hazır araçlar, algoritmaları yalnızca "ortak paydayı" işlemek üzere eğitildiğinden, döndürülmüş öğeleri algılamakta ve işlemekte sıklıkla zorluk çekerler; bizim durumumuzda bu, yatay olarak konumlandırılmış etiketler ve açıklamalar içeren bir mühendislik çizimidir.
Bu nedenle hazır bir çözüm kullanmak yalnızca çizimleri nispeten basit olan ve yalnızca standart veriler içerenler için uygundur. "Ortak paydadan" herhangi bir sapma, hazır bir araç için bir zorluk oluşturacaktır.
Müşterilerimizden birinin başına tam olarak bu durum geldi: Piyasadaki mühendislik çizimlerinin işlenmesine yönelik çözümler, karmaşık veya standart dışı çizimlerin işlenmesine yönelik ihtiyaçları karşılamıyor ve bu da onların veri tanıma sonuçlarının zayıf olmasına neden oluyor.
GD&T ek açıklamaları, çizimden daha fazla işlem için çıkarılması hayati önem taşıyan çok sayıda önemli bilgi taşır; ancak sayfadaki konumları, bizim durumumuzda, açılı bir şekilde konumlandırılmış olmaları, önceden hazırlanmış bir yapay zeka aracıyla çizimleri analiz etme sürecine engel teşkil eder.
İşte tam bu noktada özel yapay zeka geliştirme devreye giriyor: Belirli belgenizden bilgi algılamak ve çıkarmak üzere eğitilen yapay zeka modelleri, hazır bir aracın uğraştığı (neredeyse) her türlü zorluğu çözebilir.
Özel yapay zeka modeli geliştirmeyle mühendislik çizimlerinin işlenmesindeki zorluklardan biri olan açılı olarak yerleştirilen GD&T açıklamalarının çıkarılması sorununu nasıl çözdüğümüzü anlatıyoruz.
İlk adım, çizimdeki açıklamaların konumunu belirlemektir. AI modelleri, açıklamaların konumunu, konumlarından veya dönüş açılarından bağımsız olarak algılamak üzere eğitilebilir.
Not: Çok sayfalı belgeler, belgeyi sayfalara bölme ve farklı mühendislik çizimleri arasında ayrım yapma gibi ek bir adım gerektirir. Aynısı, her sayfada birden fazla çizim bulunan belgeler için de geçerlidir: her çizimi algılamak ve bunları belgeden çıkarmak için önce bir model çalıştırmanız gerekir.
İşte önemli kısım: açıklamanın nasıl döndürüldüğünü tespit etmek. AI modelinin dönüş açısını hesaplaması ve açıklamayı yatay hale getirmek için döndürmesi gerekir. Kesilmiş PNG'ler daha sonra daha fazla işleme tabi tutulmak üzere aktarılır:
Tüm açıklamalar algılandıktan, döndürüldükten ve çizimden çıkarıldıktan sonra, bir sembol algılama motorundan geçirilirler. Tesseract bunun için iyi bir seçimdir çünkü yüksek tanıma doğruluğu sağlar ve farklı yüksekliklerdeki çok satırlı metin ve sembollerle çalışabilir.
İlk olarak, sembol tanıma sürecini iyileştirmek için metnin bulunduğu tam alanı bulmanız gerekir. Bu görevleri çok iyi hallettiği ve çalışması nispeten kolay olduğu için OpenCV'yi kullanmanızı öneririm. Sonra, algılanan metin alanı tüm metin ve sembolleri çıkarmak için OCR motoruna teslim edilir.
İnsanların veya bir veri yönetim sisteminin anlayabileceği ve işleyebileceği "sindirilebilir" veriler sağlamak için bir dizi harf, sayı ve sembolün yorumlanması gerekir. Algılanan semboller, parça boyutları, toleranslar, uyumlar ve yarıçaplar oluşturan gruplara ayrılır.
Bir yapay zeka sistemi tarafından çıkarılan verilerin ihtiyaçlarınıza göre çıkarılması gerekir:
Piyasa, belgeleri işlemek için AI araçlarıyla dolu olsa da, bunlar yalnızca basit dosyaları iyi idare eder. "Norm"dan herhangi bir sapma, özel bir çözümle daha iyi işlenir.
Doğru yaklaşım ve geliştirici becerileri sağlandığında, özel yapay zeka modelleri hemen hemen tüm veri çıkarma görevlerinin üstesinden gelebilir.
Yazdığım tek teknik çizimler mühendislik çizimleri değil, şuraya göz atın: