Как оценить статистическую значимость
Статистическая значимость - это число, называемое Р-значением, которое соответствует вероятности данного события при предположении, что некоторое утверждение (нулевая гипотеза) истинно. Если Р-значение достаточно мало, экспериментатор может смело заключить, что нулевая гипотеза неверна.
Шаги
-
1
Выберите эксперимент, который вы хотели бы провести, и определитесь, что вы хотели бы установить этим экспериментом. Предположим, например, что вы приобрели доску в магазине пиломатериалов. Продавец сказал вам, что эта доска имеет длину 2,4 м (8 футов) (обозначим длину как L=8). Вы подозреваете, что продавец обманул вас, и длина доски меньше 2,4 м (8 футов, L<8). Это и будет вашей альтернативной гипотезой HA.
-
2
Сформулируйте нулевую гипотезу. Чтобы доказать, что L<8, мы должны продемонстрировать, что, исходя из полученных экспериментальных данных, не следует полагать, что L>=8. Таким образом, в качестве нулевой гипотезы мы предполагаем, что длина доски больше или равна 2,4 м (8 футов), или H0: L>=8.
-
3
Определитесь, при каком процентном соотношении ваши данные будут считаться статистически значимыми. Многие статистики в качестве минимального значения берут 95%, то есть нулевая гипотеза считается неверной, если как минимум 95% данных не согласуются с ней (при этом Р-значение равно 0,05). Это называется доверительным уровнем. Более высокий доверительный уровень (и, соответственно, меньшее Р-значение) означает, что результаты имеют большую значимость. Обратите внимание, что при доверительном уровне 95% из 20 измерений (экспериментов) лишь 1 покажет не то значение, которое ожидается.
-
4
Наберите данные. Большинство из нас, обнаружив после первого измерения, что доска короче 2,4 м (8 футов), прекратили бы дальнейшие измерения и обратились к продавцу с требованием заменить доску. Однако, в науке требуются намного более веские доказательства, чем результат одного измерения. Поскольку производственный процесс несовершенен, при среднем размере 2,4 м (8 футов) всегда найдутся немного более длинные и короткие доски. Чтобы учесть это, необходимо провести множество измерений, использовав их результаты для определения Р-значения.
-
5
Вычислите среднее значение по вашим данным. Обозначим его μ.
- Просуммируйте результаты всех измерений
- Поделите полученную величину на число измерений (n).
-
6
Найдите стандартное отклонение выборки. Обозначим его s.
- Вычтите среднее значение μ из результата каждого измерения.
- Возведите полученные значения в квадрат.
- Просуммируйте их.
- Поделите на n-1.
- Извлеките квадратный корень из полученной величины.
-
7
Переведите полученные средние в стандартные нормальные величины (Z-значения). Обозначим их Z.
- Вычтите значение H0 (8) из средней величины μ.
- Разделите результат на величину стандартного отклонения выборки s.
-
8
Сравните это значение Z с величиной Z для вашего доверительного уровня. Последнюю величину можно получить из таблицы для нормального распределения. Ее определение выходит за рамки данной статьи, но если найденное вами значение Z меньше чем -1,645, то вы можете считать, что ваша доска короче 2,4 м (8 футов) с вероятностью (доверительным уровнем) более чем 95%. Это называется опровержением нулевой гипотезы, а также означает, что наблюдаемое среднее значение μ статистически значимо (при том, что оно отличается от первоначально заявленной длины). Если найденное значение Z не ниже чем -1,645, тогда вы не можете опровергнуть нулевую гипотезу H0. Обратите внимание, что в этом случае вы не доказали истинность H0; у вас всего лишь не достаточно данных о том, что она неверна.
-
9
Продолжайте исследования. Большее количество измерений или более точный измерительный прибор позволят вам увеличить доверительный уровень и сделать более точные выводы.
Советы
- Статистика - обширная и сложная наука, и для глубокого понимания (в том числе и предмета данной статьи) этой науки желательно окончить курс, преподаваемый в каком-либо вузе.
Предупреждения
- Приведенный анализ был сделан для конкретного случая, и его ход может меняться в зависимости от сделанной вами гипотезы.
- Мы сделали множество предположений, которые не обсуждались. Курсы по статистике помогут вам намного глубже понять ход рассуждений, приведенных выше.
|