Структурированный блокнот   
 Машинное обучение (Machine Learning, обучающиеся алгоритмы) →  Обучение без учителя (Unsupervised learning) →  Поиск аномалий →  Многомерный случай →  

Простейший подход

По каждой оси независимо считается среднее и дисперсию. Дальше составляем функцию, описывающую, насколько данные значения обычны. Обычно берётся гаусова функция.
Пусть мы имеем m параметров x1, x2, ... xm. Их средние значения M1, M2, ... Mm, а дисперсии D1, D2,... Dm.
Тогда F(x1, ... , xm) = Пi ( exp ( - (xi - Mi)*(xi - Mi) / (Di * Di) )), где Пi -- это произведение по всем значениям i от 1 до m.
Таким образом эта функция максимальна, когда xi совпадают с соответствующими средними значениями (Mi). В этом случае она равна 1. По мере отклонения значений xi от среднего функция "обычности" данных падает.

Аномалией же считается такое значение x, когда значение F(x) падает ниже установленного порога epsilon, т.е. если F(x) < epsilon , то x -- аномалия.
Поиск по записям: только в текущем разделе.