Sztuczna Inteligencja w AML – Rola AI w systemach Anty-fraudowych

Zastosowanie sztucznej inteligencji (AI) w procesach Anti-Fraud (w tym AML)

W erze zaawansowanych systemów informatycznych wspomagających pracę w wielu dziedzinach związanych z przetwarzaniem danych nie sposób wyobrazić sobie wydajnego narzędzia klasy Anti-fraud (w tym AML) działającego bez zastosowania zaawansowanych metod analitycznych.

Rozważając metody i narzędzia IT używane do usprawniania i automatyzacji procesów związanych z wykrywaniem transakcji przestępczych w tym transakcji noszących znamiona pieniędzy czy finansowania terroryzmu na myśl zazwyczaj przychodzą nam metody statystyczne związane z analizą transakcji .

Klasyczne metody statystyczne używane w szeroko w rozmaitych zastosowaniach np. marketing, planowanie sprzedaży, analiza wartościowa czy przedmiotowa analiza transakcji pod kątem Anti-fraud lub AML – tworzone są w oparciu o klasyczne algorytmy bazujące na z góry określonych (pre-definiowanych) regułach analiz.

Analityk systemowy ma do dyspozycji pewną pulę reguł, które mogą być konfigurowane za pomocą paramentów (parametryzacja reguł) w celu osiągnięcia oczekiwanych rezultatów. W przypadku analizy transakcji przykładami takich reguł mogą być:

  • Odchylenie standardowe kwoty transakcji
  • Dynamika zmiany częstotliwości transakcji
  • Odpowiednio duża bezwzględna wartość kwotowa transakcji w przedziale czasu
  • Średnia częstotliwość wykonywania transakcji (ilościowa)

Proces konfiguracji zestawy reguł analizy transakcji można podzielić na następujące etapy

  1. Wybór pasujących reguł
  2. Ustalenie wartości parametrów dla reguł transakcji.
  3. Ustaleniu wag dla wybranych reguł transakcji.

Na czym polega dobór właściwych reguł analizy transakcji ?

Już w pierwszym etapie, jakim jest dobór reguł wchodzących w skład analizy transakcji niezbędna jest szeroka wiedza ekspercka na temat charakteru danych transakcji jakie znajdują się w rejestrze transakcji.

W zależności od rodzaju działalności zestaw reguł się zmienia. W klasycznym banku gdzie analizie podglądają przelewy bankowe zestaw reguł będzie wyglądał zupełnie inaczej niż np. u brokera giełdowego, firmy faktoringowej, ubezpieczeniowej czy towarzystwa funduszy inwestycyjnych.

Dlaczego proces konfiguracji wartości parametrów reguł analizy transakcji jest tak ważny ?

Po ustaleniu zestawu reguł jakimi będziemy się posługiwać w procesie analizy transakcji, konieczne jest ustalenie wartości paramentów dla każdej z reguł.

Prawidłowy dobór wartości parametrów nie zależy już tylko od charakteru przedsiębiorstwa,ale również jego wielkości, lokalizacji, rodzaju klientów, produktów mówiąc ogólnie – od faktycznych danych jakie podlegają analizie.

Łatwo wyobrazić sobie, że zupełnie inne parametry reguł zostaną dobrane dla dużego banku inwestycyjnego niż banku oferującego bankowość detaliczną.

W obu przypadkach kwoty i wolumen transakcji są diametralnie różne: Obrót dziesiątkami milionów dolarów w banku inwestycyjnym nikogo nie dziwi, natomiast w niewielkim banku detalicznym – już powinien podnieść alarm.

Celem jaki powinien przyświecać analitykowi na tym etapie jest::

  1. Wyeliminowanie lub redukcja zjawiska false positive
  2. Zapobieganie przejściu transakcji przestępczej (fraud) lub grupy transakcji przez filtry AML (false-negative)

Czym jest zjawisko false positive w AML ?

Zjawisko false positive polega na niesłusznym zakwalifikowaniu transakcji jako podejrzana (possible fraud) mimo, ze jest to operacja właściwa, zgodna z prawem i nie nosi miana prania pieniędzy. Zbyt duża ilość transakcji tego typu niesie za sobą negatywne konsekwencje dla instytucji:

  • duże obciążenie dla działów compliance, które muszą manualnie weryfikować takie alerty.
  • negatywne opinie klientów na temat działania instytucji, która niesłusznie zablokowała środki bądź wstrzymała wykonanie transakcji
  • narażenie się na procesy cywilne i utratę reputacji

Jaka jest przyczyna zjawiska false positive w procesie analizy transakcji ?

Przyczyna zjawiska false-posivite jest najczęściej zbyt ostrożny dobór wartości paramentów dla reguł. Gdy wartość parametru reguły ustawiana jest niewłaściwe (np. kwota progu jest zbyt niska) – będziemy mieć do czynienia ze zbyt dużą ilością transakcji trafiających w regułę filtru, co skutkować będzie licznymi typowaniami tych transakcji jako podejrzane.

W tym miejscu warto zwrócić uwagę na fakt, że parametry reguł mogą być zarówno względne (procentowe) jak i bezwzględne (np. kwoty). W przypadku reguł zagnieżdżonych (agregacji reguł) czy multi-reguł – mogą to być również znormalizowane wielkości abstrakcyjne – np. wartości punktowe)

Jak zapobiegać przejściu transakcji przestępczej przez filtry anty-faudowe – redukcja false-negative

Zjawiskiem odwrotnym do false-positive jest false-negative – sytuacja , w której wartości parametrów reguł były dobrane zbyt optymistycznie (np. za duże kwoty bezwzględne, za duże wartości odchylenia standardowego, czy zbyt niskie progi częstotliwościowe) co powoduje, że transakcja o charakterze przestępczym, która była praniem pieniędzy lub miała innych charakter przestępczy – nie została zakwalifikowania jako podejrzana.

Nasze doświadczenie pokazuje, że sam proces doboru wartości tych parametrów nie jest zadaniem łatwym i często wymaga wielokrotnych poprawek i usprawnień już po wdrożeniu rozwiązania klasy Anti-Fraud czy AML.

Agregacja reguł i ustalenie wag dla wyniku analizy transakcji

Ostatnim etapem konfiguracji reguł transakcji jest dobór wag (mocy) poszczególnych reguł. Proces ten jest kluczowy, gdyż przekłada się na ostateczny wynik analizy danej transakcji.

Zadaniem analityka jest takie dobranie wag dla każdej z reguł, aby zapewniały wszechstronne one spojrzenie na transakcję i zakwalifikowanie jej jako podejrzana bez względu na metodologię działania przestępcy.

Konfiguracja wag jest de facto procesem konfiguracji paramentów wyższego poziomu. Nieumiejętny dobór wag do reguł może spowodować identyczne negatywne zjawiska jak nieprawidłowy dobór parametrów pojedynczych reguł analizy transakcji. .

Podsumowanie metod klasycznych analiz transakcji.

Podsumowując rozważania na temat klasycznych metod analizowania transakcji warto zwrócić uwagę na to, że nawet doskonałe narzędzie anty-fraudowe służące do wyłapywania transakcji podejrzanych, może okazać się bezużyteczne, jeżeli jego konfiguracja nie zostania przeprowadzona w sposób uwzględniający indywidualny charakter przedsiębiorstwa czy instytucji.

Rola algorytmów sztucznej inteligencji w nowoczesnych systemach analitycznych.

Rozważając metody analizy w oparciu o Algorytmy sztucznej inteligencji zazwyczaj myślimy o mechanizmach wykorzystującej uczenie maszynowe (machine learning). Istotną cechą tych mechanizmów , odróżniającą je od metod klasycznych opartych na z góry określonych regułach jest zastosowanie zbiorów uczących, bez specyfikowania reguł którymi mają być analizowane transakcje czy inne zdarzenia podlegające analizie.

Przewaga działania algorytmów ML nad algorytmami klasycznymi

W celu przybliżenia tych różnic warto posłużyć się analogią do gry w szachy realizowanej przez program komputerowy. W ujęciu klasycznym z zastosowaniem drzew decyzyjnych to programista musi zaprogramować wszystkie sztywne reguły poruszania się poszczególnych figur i formacji. Algorytm znając zbiór reguł którym podlega gra w szachy stara się „przewidzieć” ruch przeciwnika i podejmuje takie ruchy aby nie dopuścić do przegranej a w drugiej kolejności doprowadzić do wygranej, względnie remisu.

Budowanie scenariusza odbywa się poprzez stworzenie struktury drzewiastej na której rozpięte wszystkie możliwe ruchy przeciwnika pewną ilością kolejek/tur gry w przód.

Ograniczeniem jest tu moc obliczeniowa maszyny, która nie może przewidywać ruchów w nieskończonej ilości. Drzewo decyzyjne zawsze jest w takiej sytuacji ograniczone do pewnej głębokości, która wprost odpowiada ilości ruchów „w przyszłości” branych przez algorytm pod uwagę. Warto wspomnieć, że wzrost potrzebnej mocy obliczeniowej i pamięci rośnie nie liniowo a wykładniczo co stwarza wiele problemów optymalizacyjnych.

Docelowo podejście oparte na drzewie decyzyjnym jest zawsze pewnym kompromisem pomiędzy ilością potrzebnych zasobów a skutecznością samego algorytmu.

Zastosowanie sztucznej inteligencji w algorytmach gry w szachy polega w uproszczeniu na uczeniu się skutecznej gry poprzez obserwację swoich własnych postępów. Algorytm początkowo jest bardzo nieporadny (w sensie nieskuteczny), podobnie jak dziecko uczące się podstawowych czynności motorycznych czy mowy. Z czasem jednak , w setkach czy tysiącach kolejnych iteracji algorytm zdobywa zdolność nieporównywalnie lepszą od algorytmu klasycznego.

Dziś już z całą pewnością wiemy, że najlepsze klasyczne algorytmy do gry w szachy przegrywają z nowoczesnymi algorytmami opartymi na AI.

Rodzaje sieci neuronowych wykorzystywanych do analizy danych (w tym analizy transakcji)

Sercem każdego algorytmu wykorzystującego uczenie maszynowe jest sieć neuronowa odpowiedniego typu. Obecnie oprócz standardowych sieci neuronowych uczonych wprost, opracowanych jest kilka zaawansowanych typów sieci neuronowych np. Convolutional Neural Network (CNN) czy Long short-term memory (LSTM) w których występują sprzężenia zwrotne.

Generalnie, nie wdając się w szczegóły techniczne, dobór typu sieci zależy od charakteru danych wejściowych, od tego czy dane wchodzące (input data) są sekwencyjne, czy zależą od siebie czy są niezależne, czy występuje sprzężenie zwrotne pomiędzy wejściem a wyjściem itd.

W dzisiejszych czasach problemy rozwiązywane za pomocą AI obejmują obecnie bardzo szerokie dziedziny takie jak: rozpoznawanie dźwięku (mowy), obrazu, wykrywanie wzorców, klasyfikacja, predykcja zachowań, detekcja anomalii itd.

Cześć druga – Zalety i zagrożenia nowoczesnych systemu klasy Anti-Fraud i AML

(c) Machine Mind Ltd – Wszelkie prawa zastrzeżone