Çok değişkenli zaman serisi anormallik tespiti, sağlık ve finanstan siber güvenlik ve endüstriyel gözetime kadar çeşitli alanlarda kritik öneme sahiptir. Bu anormalliklerin tespit edilmesi, sağlık koşulları, dolandırıcılık faaliyetleri, siber tehditler veya ekipman arızaları gibi önemli olayları ortaya çıkarabilir. IoT cihazları ve yüksek frekanslı veri toplama daha yaygın hale geldikçe, çok değişkenli zaman serileri için sağlam anormallik tespit modellerine olan ihtiyaç önemli hale geldi.
Derin öğrenme yöntemleri bu alanda önemli ilerlemeler kaydetmiştir. Otomatik Kodlayıcılar, Üretken Çekişmeli Ağlar (GAN'lar) ve Transformatörler, zaman serisi verilerindeki anormalliklerin belirlenmesinde etkinliğini gösteren yaklaşımlardan yalnızca birkaçıdır. Yakın zamanda paylaştığım bir yazıda "tersine çevrilmiş transformatörlerin" (iTransformers) zaman serisi analizinde yenilikçi uygulaması tartışıldı; hakkında daha fazla bilgi edinebilirsiniz
Ancak son buluşumla yeni bir gelişme ortaya çıktı:
Bu durum ilgi çekici bir soruyu gündeme getiriyor: Yayılma modelleri zaman serisi verilerini analiz etmede etkili olabilir mi? Bu yazı, bu soruyu ön plana çıkaran son makaleyi inceleyecek ve bu uzmanlık alanındaki yayılma modellerinin uygulanabilirliğini değerlendireceğiz. Başlayalım.
Anormallikleri tanımlamak için normal veri noktalarını bir karar sınırıyla çevreleyen bir makine öğrenme tekniği olan Tek Sınıf SVM'ler ve gözlemleri izole ederek aykırı değerleri tespit eden bir algoritma olan İzolasyon Ormanları gibi geleneksel anormallik tespit yöntemleri, bireysel veri noktalarını ayrı ayrı ele alma konusunda beceriklidir. . Ancak, veri kümesi içinde gelişen bağlamları anlamak için çok önemli olan, zaman içinde ortaya çıkan birbirine bağlı veri dizileri olan zamansal ilişkileri hesaba katmazlar.
Derin öğrenme modelleri tasarım gereği bu sıralı dinamiklere daha uyumludur. Örneğin otomatik kodlayıcılar, eğitim sırasında normal verileri kompakt bir gösterime yoğunlaştırmak ve ardından test sırasında yeniden yapılandırmak üzere eğitilmiş sinir ağlarıdır. Anormallikler, orijinal veriler ile otomatik kodlayıcıdan yeniden oluşturulmuş versiyonu arasındaki fark olan yeniden oluşturma hatası ölçülerek işaretlenir; Önemli bir hata, anormal bir olaya işaret eder.
İki sinir ağından (üretici ve ayırıcı) oluşan Üretken Rekabetçi Ağlar ( GAN'lar ), oyun benzeri bir ortamda rekabet eder. Jeneratör yeni veri örnekleri oluştururken, ayırıcı bunları değerlendirir ve bir veri örneğinin gerçek olma olasılığını yansıtan olasılık puanları atar. Ayrımcı, verilerin gerçek olmayabileceğini gösteren düşük olasılık puanları atadığında anormallikler tanımlanır.
Derin öğrenme cephaneliğine daha yeni bir eklenti olan Transformers, kişisel dikkat mekanizmalarından yararlanarak modelin, her bir parçanın ağırlığını ve önemini anlamak için tüm veri dizisini dikkate almasına olanak tanır. Bu yaklaşım, zaman serisi verileri içindeki karmaşık zamansal korelasyonların tanınmasında en gelişmiş sonuçların alınmasına yol açmıştır. Bununla birlikte, bu modeller bazen anormallikleri çok fazla doğrulukla yeniden oluşturabilir; bu da anormallikleri daha az fark edilebilir hale getirdiği için bir dezavantaj olabilir. Ek olarak, GAN'lar, jeneratörün sınırlı ve sıklıkla tekrarlanan çıktılar üretmeye başladığı ve modelin geniş bir anormallik aralığını genelleştirme ve tespit etme yeteneğini azalttığı modelin çökmesine karşı hassastır.
Verdikleri vaatlere rağmen, bu derin öğrenme teknikleri, zamansal bağımlılıkları modellemenin karmaşıklığı ve her bir yaklaşımın doğasında olan sınırlamalar nedeniyle, çeşitli veri kümelerindeki anormallikleri tutarlı bir şekilde tanımlama zorluğuyla karşı karşıyadır.
Difüzyon modelleri, başlangıçta ayrıntılı görüntüler oluşturmadaki becerileriyle tanınan, derin üretken modellerin yeni bir sınıfıdır. Yaklaşımları, verilere kademeli olarak gürültü eklenmesini gerektiriyor; model bunu tersine çevirmeyi öğrenerek gürültüyü etkili bir şekilde ortadan kaldırıyor ve yüksek çözünürlüklü örnekleri yeniden oluşturuyor.
Zaman serisi anormallik tespiti bağlamında, bu makale ilgi çekici bir hipotez ortaya koymaktadır: Yayılma süreçleri, anormalliklerdeki düzensizlikleri güçlendirirken normal kalıpları yumuşatmada özellikle etkili olabilir. Eğer bu geçerliyse, orijinal anormal diziler ile bunların yeniden oluşturulmuş versiyonları arasında daha büyük bir eşitsizlik ortaya çıkacak ve böylece anormalliklerin tanımlanması iyileşecektir.
Makaledeki bir diyagram, bu teoriyi görsel olarak açıklıyor ve yinelenen gürültü ekleme ve ardından çıkarma işlemleri yoluyla anormalliklerin, gürültüden arındırılmış versiyonlarıyla karşılaştırıldığında nasıl daha belirgin hale geldiğini gösteriyor. Bu amplifikasyon, anormal verilerin difüzyon sonrası normdan ayırt edilmesini kolaylaştırır.
Pratik uygulama için model, Gauss gürültüsüyle bozulmuş çok değişkenli zaman serisi verileri üzerinde eğitime tabi tutulur. Test aşamasında bu süreç, yeni giriş dizilerine gürültü eklenerek taklit edilir ve daha sonra modele gürültüyü giderme görevi verilir. Orijinal dizi ile onun gürültüden arındırılmış karşılığı arasındaki fark, bir anormallik puanı üretecek şekilde ölçülür.
Makalede zaman serisi verilerine uygulanan iki yayılma modeli çeşidi incelenmektedir:
Yayılma modelinin ham zaman serisi girişini işlediği basit bir uygulama.
Difüzyon prosesi için ön girdi olarak otomatik kodlayıcının çıktısını kullanan gelişmiş bir "DiffusionAE" modeli.
İkinci yaklaşım olan "DiffusionAE", otomatik kodlayıcının gürültüyü ön filtreleme yeteneğini kullanarak difüzyon modelinin verideki doğal gürültüye karşı sağlamlığını artırır. Kapsamlı metodoloji, gürültünün ortaya çıkmasından anormallik puanının oluşturulmasına kadar tüm hattın ana hatlarını çizen bir diyagramda gösterilmektedir.
Modeller, çeşitli anormallik türlerini içeren hem sentetik hem de orijinal çok değişkenli zaman serisi veri kümeleri üzerinde sıkı testlere tabi tutuldu.
Bu türler tanınmış bir taksonomiye göre sınıflandırıldı:
Nokta anormallikleri : Geri kalanıyla karşılaştırıldığında olağandışı olan tekil veri noktaları.
Bağlamsal anormallikler : Kendi özel bağlamları içinde ele alındığında anormal olan noktalar.
Mevsimsel anormallikler : Beklenen döngüsel eğilimleri bozan düzensiz desenler.
Shapelet anormallikleri : Zaman serisindeki bir alt dizi veya 'şekil' içindeki anormallikler.
Trend anormallikleri : Trendin yönünün yerleşik modelden keskin bir şekilde saptığı noktalar.
Sentetik veri kümeleri için, deneysel koşullar üzerinde kontrolü sürdürmek amacıyla anormallikler önceden belirlenmiş oranlarda enjekte edildi. Gerçek dünyadaki veri kümeleri, bir su arıtma tesisindeki sensörlerden kaydedilen verilerden oluşmakta ve analize bir karmaşıklık ve öngörülemezlik katmanı eklemektedir.
Nokta ayarlama protokolü gibi zaman serisi anormallik tespitine yönelik geleneksel değerlendirme yöntemleri, anormal bir segmentte yalnızca tek bir nokta tanımlansa bile yüksek F1 puanları üreterek sistemin performansını yanlış temsil edebilir. Bunu kabul eden araştırmacılar yakın tarihli bir makalede daha sıkı değerlendirme protokolleri önerdiler.
PA%K protokolü bir çözüm olarak ortaya çıkıyor; burada 'K', anormal bir segment içinde doğru tanımlanmış sayılması için tespit edilmesi gereken minimum nokta yüzdesini temsil ediyor. Bu yöntem, modellerin yalnızca anormallikleri tespit etmek için değil aynı zamanda tespit yeteneklerinin kapsamı açısından da tanınmasını sağlar.
Bunu temel alarak araştırmacılar, çeşitli 'K' seviyelerindeki F1 puanları eğrisinin altındaki alanı hesaplayan ve farklı tespit zorluklarında bir modelin hassasiyeti ve geri çağrılması hakkında kapsamlı bir bakış açısı sunan F1K-AUC metriğini tanıtıyor.
Değerlendirmeyi daha da iyileştirmek için makale, birden fazla tespit eşiği ve 'K' değeri boyunca doğru ve yanlış pozitif oranları hesaba katan değiştirilmiş bir ROC eğrisinin kullanılmasını önermektedir. Bu, eşik yanlılığının etkisi olmadan anormallik tespit modellerinin karşılaştırılmasını kolaylaştıran ROCK-AUC metriğinin ortaya çıkmasına neden olur.
Değerlendirme metriklerindeki bu değişim, anormallik tespitindeki yüksek puanların, değişen derecelerde anormallik tespit zorlukları karşısında gerçek, sağlam model performansının göstergesi olmasını sağlamayı amaçlamaktadır.
Makale, sağlık, finans, siber güvenlik ve endüstriyel izleme gibi çeşitli alanlarda giderek daha kritik hale gelen çok değişkenli zaman serisi verilerinde anormallik tespitinin derinlemesine bir analizini sunuyor. Anormallikleri tespit etmek, sağlık sorunlarından dolandırıcılığa, siber tehditlere ve ekipman arızalarına kadar önemli aksaklık yaratan olayların belirlenmesinde kilit öneme sahiptir. IoT'nin ve yüksek frekanslı veri toplamanın yükselişi göz önüne alındığında, çok değişkenli zaman serileri için etkili anormallik tespit modellerine olan talep her zamankinden daha acildir.
Makalenin önemli katkılarından biri, anormallikleri belirleme konusunda şimdiden umut vaat eden otomatik kodlayıcılar, GAN'lar ve Transformatörler dahil olmak üzere derin öğrenme yöntemlerinin araştırılmasıdır. Zaman serisi analizi için daha çok görüntü ve ses üretimiyle ilişkilendirilen yayılma modellerinin kullanımını önererek bunun üzerine kuruludur. Temel hipotez, difüzyon süreçlerinin anormallikleri normal kalıplara göre benzersiz şekilde artırabileceği ve tespit edilebilirliği artırabileceğidir.
Geleneksel değerlendirme yöntemlerinin yetersizliklerini gidermek için makale, F1K-AUC ve ROCK-AUC gibi daha sağlam ölçümler sunmaktadır. Bu ölçümler, anormallik tespit sisteminin yeteneklerine ilişkin daha doğru bir değerlendirme sunmayı amaçlayarak, yüksek puanların gerçekten üstün performansın göstergesi olmasını sağlar. Sentetik ve gerçek dünya veri kümeleri üzerinde yapılan testlerden elde edilen deneysel sonuçlar, bir otomatik kodlayıcıyı difüzyon süreçleriyle birleştiren DiffusionAE modelinin dikkate değer sağlamlık ve etkinlik sergilediğini göstermektedir.
Bu umut verici sonuçlara rağmen makale, yaklaşımın doğasında olan sınırlamalardan bahsetmiyor. Örneğin modeller, kontrollü sentetik verilerde başarılı olsa da, karmaşık gerçek dünya veri kümelerinde daha büyük zorluklarla karşılaşıyor. Bu, modellerin gerçek dünya senaryolarına uygulanabilirliğini arttırmak için daha fazla iyileştirme ihtiyacına işaret etmektedir.
Dahası, makale karmaşık değerlendirme ölçütlerini savunurken, bunlar kendi karmaşıklıklarını da beraberinde getiriyor ve bilimsel topluluk içinde daha geniş bir doğrulama gerektirebilir. Bir başka endişe verici nokta da modellerin farklı alanlara ve anormallik türlerine genellenebilirliğidir; bu, makine öğreniminde yaygın bir engeldir. Son olarak, yayılma modellerinin hesaplama yoğunluğu, bunların büyük ölçekli veya gerçek zamanlı uygulamalarda kullanımını potansiyel olarak sınırlayabilir.
Özet olarak makale, zaman serisi anormallik tespitinin manzarasını dönüştürmede difüzyon tabanlı modellerin potansiyelinin altını çiziyor ve bu modelleri pratik, çeşitli uygulamalar için optimize etmek için sürekli araştırma yapılması çağrısında bulunuyor. Ayrıca anormallik tespit sistemlerinin performansını gerçek anlamda ölçmek ve anlamak için gelişmiş değerlendirme ölçümlerinin benimsenmesinin gerekliliğini de vurguluyor.
Burada da yayınlandı.