Машинное обучение (Machine Learning, обучающиеся алгоритмы)

Машинное обучение (Machine Learning, обучающиеся алгоритмы) → Статистика →

Погрешность измерения, доверительный интервал, проверка гипотез

Коротко:
Проводим N измерений.
Считаем среднее m
Считаем ошибку S, как корень из среднего (Xi-m)^2
Это оценка измеряемой величины: среднее и разброс её параметров.
Но нас должно интересовать, насколько точно мы измерили среднее, ведь из-за случайной природы измеряемой величины, вполне вероятна ошибка. Особенно важен этот вопрос, когда мы хотим понять, например, а правда ли, что измеренная нами величина в среднем больше нуля: вот мы получили m=0,3 и S=0,6 -- значит ли это, что в среднем она гарантированно выше нуля? Или может быть просто нам повезло, и в нашу выборку попали такие значения, но среднее по генеральной совокупности меньше нуля?
Для этого нам нужно посчитать оценку, насколько вероятно, что среднее по генеральной совокупности далеко от среднего по выборке. Ответ таков: считаем s = S / корень(N). С вероятностью 95% математическо ожидание лежит в интервале между (m-2s; m+2s), с вероятностью 99,7% в интервале (m-3s; m+3s).
Вернёмся к примеру выше. Если мы провели 100 измерений (N=100) и получили m=0,3 и S=0,6 -- тогда s = S / Корень(100) = 0,06. Получаем, что среднее по генеральной совокупности с вероятностью 99,7% лежит в интервале от от 0,3-0,18 до 0,3+0,18, т.е. в интервале (0,12; 0,48), а значит мы можем уверенно говорить, что среднее по всей генеральной совокупности больше нуля.

Поиск по записям: только в текущем разделе.