Аутори:
(1) Гуиллауме Стаерман, ИНРИА, ЦЕА, Унив. Парис-Сацлаи, Француска;
(2) Марта Цампи, ЦЕРИАХ, Институт де л'Аудитион, Институт Пастеур, Француска;
(3) Гаретх В. Петерс, Департмент оф Статистицс & Апплиед Пробабилити, Университи оф Цалифорниа Санта Барбара, САД.
2.1. Функционална изолациона шума
3. Сигнатуре Исолатион Форест Метход
4.1. Анализа осетљивости параметара
4.2. Предности (К-)СИФ у односу на ФИФ
4.3. Бенцхмарк за откривање аномалија у реалним подацима
5. Дискусија и закључак, изјаве о утицају и референце
Додатак
А. Додатне информације о потпису
Ц. Додатни нумерички експерименти
Да бисмо проценили ефикасност предложених (К-)СИФ алгоритама и обезбедили поређење са ФИФ, извршили смо компаративну анализу користећи десет скупова података за детекцију аномалија конструисаних у Стаерман ет ал. (2019) и преузето из УЦР репозиторијума (Цхен ет ал., 2015). За разлику од Стаерман ет ал. (2019), не користимо део за обуку/тестирање јер се ознаке не користе за обуку и обучавамо и процењујемо моделе само на подацима о обуци. Процењујемо перформансе алгоритама квантификовањем АУЦ испод РОЦ криве.
С једне стране, слика 4 илуструје диспаритет перформанси између ФИФ и К-СИФ користећи Браунов речник. Посебно, К-СИФ показује значајну предност у перформансама у односу на ФИФ. Ово запажање наглашава ефикасност језгра потписа у побољшању перформанси ФИФ-а у већини скупова података, наглашавајући предности његовог коришћења у односу на једноставан унутрашњи производ. С друге стране, с обзиром на замршеност функционалних података, не очекује се да ће јединствени метод надмашити друге на универзалан начин.
Међутим, СИФ показује снажне перформансе у већини случајева, постижући најбоље резултате за пет скупова података. За разлику од ФИФ-а и К-СИФ-а, он показује робусност на различите скупове података, док на њега драстично не утиче избор параметара укључених у ФИФ (речник и унутрашњи производ) и К-СИФ (речник).
Овај рад је доступан на аркив под лиценцом ЦЦ БИ 4.0 ДЕЕД.