paint-brush
Како (К-)СИФ надмашује ФИФ у откривању аномалија у реалним подацимаод стране@computational

Како (К-)СИФ надмашује ФИФ у откривању аномалија у реалним подацима

од стране Computational Technology for All2m2024/11/21
Read on Terminal Reader

Предуго; Читати

(К-)СИФ показује јасне предности у перформансама у односу на ФИФ у откривању аномалија у стварним подацима, посебно са Брауновским речником. СИФ се показао као најробуснији метод, који постиже најбоље резултате на пет скупова података без ослањања на осетљиве параметре.
featured image - Како (К-)СИФ надмашује ФИФ у откривању аномалија у реалним подацима
Computational Technology for All HackerNoon profile picture
0-item

Аутори:

(1) Гуиллауме Стаерман, ИНРИА, ЦЕА, Унив. Парис-Сацлаи, Француска;

(2) Марта Цампи, ЦЕРИАХ, Институт де л'Аудитион, Институт Пастеур, Француска;

(3) Гаретх В. Петерс, Департмент оф Статистицс & Апплиед Пробабилити, Университи оф Цалифорниа Санта Барбара, САД.

Табела веза

Апстракт и 1. Увод

2. Позадина и прелиминаре

2.1. Функционална изолациона шума

2.2. Тхе Сигнатуре Метход

3. Сигнатуре Исолатион Форест Метход

4. Нумерички експерименти

4.1. Анализа осетљивости параметара

4.2. Предности (К-)СИФ у односу на ФИФ

4.3. Бенцхмарк за откривање аномалија у реалним подацима

5. Дискусија и закључак, изјаве о утицају и референце


Додатак

А. Додатне информације о потпису

Б. К-СИФ и СИФ алгоритми

Ц. Додатни нумерички експерименти

4.3. Бенцхмарк за откривање аномалија у реалним подацима

Да бисмо проценили ефикасност предложених (К-)СИФ алгоритама и обезбедили поређење са ФИФ, извршили смо компаративну анализу користећи десет скупова података за детекцију аномалија конструисаних у Стаерман ет ал. (2019) и преузето из УЦР репозиторијума (Цхен ет ал., 2015). За разлику од Стаерман ет ал. (2019), не користимо део за обуку/тестирање јер се ознаке не користе за обуку и обучавамо и процењујемо моделе само на подацима о обуци. Процењујемо перформансе алгоритама квантификовањем АУЦ испод РОЦ криве.



Табела 1: АУЦ различитих метода детекције аномалија израчунате на тест сету. Подебљани бројеви одговарају најбољем резултату.


С једне стране, слика 4 илуструје диспаритет перформанси између ФИФ и К-СИФ користећи Браунов речник. Посебно, К-СИФ показује значајну предност у перформансама у односу на ФИФ. Ово запажање наглашава ефикасност језгра потписа у побољшању перформанси ФИФ-а у већини скупова података, наглашавајући предности његовог коришћења у односу на једноставан унутрашњи производ. С друге стране, с обзиром на замршеност функционалних података, не очекује се да ће јединствени метод надмашити друге на универзалан начин.


Међутим, СИФ показује снажне перформансе у већини случајева, постижући најбоље резултате за пет скупова података. За разлику од ФИФ-а и К-СИФ-а, он показује робусност на различите скупове података, док на њега драстично не утиче избор параметара укључених у ФИФ (речник и унутрашњи производ) и К-СИФ (речник).


Овај рад је доступан на аркив под лиценцом ЦЦ БИ 4.0 ДЕЕД.


L O A D I N G
. . . comments & more!

About Author

Computational Technology for All HackerNoon profile picture
Computational Technology for All@computational
Computational: We take random inputs, follow complex steps, and hope the output makes sense. And then blog about it.

ХАНГ ТАГС

ОВАЈ ЧЛАНАК ЈЕ ПРЕДСТАВЉЕН У...