Статистика и котики - Владимир Савельев
Шрифт:
Интервал:
Чтобы разобраться во всех этих влияниях, статистики пользуются многофакторным дисперсионным анализом. Простейший из них — двухфакторный — разбивает дисперсию на четыре части. Первая отвечает за влияние вида на размер, вторая — за влияние диеты, третья — за взаимодействие этих факторов, а последняя определяется всякими левыми причинами.
Проверяем мы аж три нулевые гипотезы.
1. Биологический вид не связан с размером.
2. Диета не связана с размером.
3. Диета действует на всех животных одинаково.
Соответственно, для каждой из них считается свой критерий Фишера. И — как и в однофакторном дисперсионном анализе — чем его значение больше, тем больше влияние того или иного фактора.
Для интерпретации результатов двухфакторного дисперсионного анализа легче всего воспользоваться вот такими графиками. Они отражают и средние значения, и дисперсию, и влияние каждого фактора, и их взаимодействие.
В частности из этого графика мы можем сделать следующие выводы.
1. В среднем самые большие животные — слоники, а самые маленькие — котики.
2. Диета по-разному влияет на животных в зависимости от вида. Котики, будучи облигатными хищниками, лучше растут при мясной диете, слоники — наоборот, а вот песикам по большому счету все равно, что есть.
3. Если не учитывать влияние вида, то разные формы диеты не влияют на средний размер животных. Если бы такое влияние существовало, то и котики, и песики, и слоники вырастали бы больше при употреблении мяса, чем при употреблении капусты.
Дисперсионные анализы для трех и более факторов строятся подобным образом: мы проверяем влияние каждого фактора, а также все возможные взаимодействия между ними.
НЕМАЛОВАЖНО ЗНАТЬ!
Сколько нужно котиков?
К настоящему моменту мы продвинулись довольно-таки далеко в вопросах применения статистических критериев для изучения особенностей котиков и других видов животных. Однако за бортом остался очень важный вопрос: сколько котиков необходимо измерить, чтобы критерии давали надежный результат?
Дело в том, что, если вы измерите слишком мало котиков, песиков и слоников, вы можете не зафиксировать даже ощутимые различия. Это может произойти, например, если вам случайно попались очень большие котики и очень маленькие слоники, что при маленьких выборках время от времени случается.
В то же самое время, если вы наберете слишком большую выборку, то даже минимальное отклонение от нулевой гипотезы будет давать значимый результат.
Поэтому котиков должно быть не слишком много и не слишком мало. И чтобы определить, сколько их должно быть, проводятся специальные вычисления.
Оптимальный размер выборки зависит от нескольких факторов, главными из которых являются критический p-уровень значимости (как правило, 0,05 или 0,01) и показатель мощности критерия. Последняя определяется как вероятность того, что этот критерий найдет значимые различия там, где они действительно есть. Оптимальным считается показатель мощности в 0,8. Соответственно, в оставшихся 20% случаев критерий пропустит значимые различия.
Оставшиеся факторы определяются самой природой критерия.
В некоторых статистических программах есть специальные калькуляторы мощности. Выбрав необходимый критерий, задав p
Поделиться книгой в соц сетях:
Обратите внимание, что комментарий должен быть не короче 20 символов. Покажите уважение к себе и другим пользователям!