Голая статистика. Самая интересная книга о самой скучной науке - Чарльз Уилан
Шрифт:
Интервал:
Скептицизм – вполне разумная первая реакция. В начале главы я написал, что невозможность человека в достаточной степени влиять на содержание, способы и условия выполнения своей работы отрицательно сказывается на его здоровье. Это может быть (или не быть) синонимом пребывания работника на нижних ступенях административной иерархии. Дальнейшее исследование, в ходе которого использовалась вторая выборка из 10 308 британских государственных служащих, было призвано более глубоко уяснить эту разницу{74}. Работников еще раз разделили на административные ранги – высокий, промежуточный и низкий, – но на сей раз предложили заполнить анкету из пятнадцати пунктов, чтобы оценить уровень «диапазона принятия решений или контроля» работника. Анкета содержала вопросы типа: «Можете ли вы выбирать, как именно будете выполнять порученную вам работу?»; кроме того, предлагались разные варианты ответа (от «никогда» до «часто») на утверждения наподобие: «Я могу самостоятельно решать, когда устроить себе перерыв». Исследователи пришли к выводу, что за время проведения эксперимента у работников с «низким уровнем контроля» риск развития сердечно-сосудистых заболеваний был значительно выше, чем у работников с «высоким уровнем контроля». Вместе с тем ученые обнаружили, что риск развития сердечно-сосудистых заболеваний у служащих с жесткими требованиями к выполняемой работе ничуть не выше, чем у работников с низким уровнем социальной поддержки на работе. Похоже, что невозможность человека в достаточной степени влиять на содержание, способы и условия выполнения поставленных задач убивает его в буквальном смысле этого слова.
Упомянутое нами исследование британских служащих обладает двумя характеристиками, типичными для таких солидных экспериментов. Во-первых, его результаты подтверждены аналогичными исследованиями в других странах. В медицинской литературе представление о «низком контроле» (то есть недостаточной возможности человека влиять на содержание, способы и условия выполнения своей работы) привело к появлению термина «переутомление на работе», который характеризует должности с «высокой психологической нагрузкой» и «недостаточностью полномочий для принятия решений». В период с 1981 по 1993 год были опубликованы результаты тридцати шести исследований по этому вопросу; в большинстве из них найдена значительная положительная взаимосвязь между переутомлением на работе и развитием сердечно-сосудистых заболеваний{75}.
Во-вторых, исследователи выявили дополнительные биологические свидетельства, объясняющие механизм, посредством которого этот особый вид стресса на работе приводит к ухудшению здоровья работника. Условия работы, предусматривающие строгие требования, но не позволяющие человеку влиять на процесс выполнения поставленных задач, могут вызывать физиологические реакции (например выделение гормонов, связанных со стрессом), повышающие риск развития сердечно-сосудистых заболеваний в долгосрочной перспективе. Раскрыть этот механизм помогают даже опыты над животными: у обезьян и павианов, занимающих низкий статус (и имеющих немало общего с мелкими государственными служащими), есть физиологические отличия от их высокостатусных сородичей, причем эти отличия обусловливают их большую склонность к сердечно-сосудистым заболеваниям{76}.
При прочих равных условиях лучше, конечно, не становиться низкостатусным павианом (именно эту мысль я пытаюсь как можно чаще доносить до сознания своих детей – особенно сына). Более значительный месседж заключается в том, что регрессионный анализ, пожалуй, – самый важный из имеющихся в распоряжении исследователей инструментов для поиска значимых закономерностей и связей в крупных совокупностях данных. Как правило, у нас нет возможности проводить управляемые эксперименты для получения данных о дискриминации на работе или выявления факторов, вызывающих развитие сердечно-сосудистых заболеваний. Источником наших представлений об этих и многих других социально значимых проблемах являются статистические инструменты, о которых шла речь в этой главе. В сущности, не будет преувеличением сказать, что значительная часть всех важных исследований, выполненных в области социальных наук за последние полстолетия (особенно после появления сравнительно недорогих компьютеров), проводилась с применением регрессионного анализа.
Регрессионный анализ представляет собой важную разновидность научного метода исследований; благодаря ему мы стали более здоровыми, защищенными и информированными людьми.
Какие же потенциальные ловушки подстерегают нас при использовании столь мощного и впечатляющего инструмента? Об этом я расскажу в следующей главе.
Жизнь несколько усложняется при выполнении регрессионного анализа (или других видов статистического вывода) с малой выборкой данных. Допустим, нам нужно проанализировать зависимость между весом и ростом на основе выборки, состоящей всего из 25 взрослых, вместо того чтобы использовать огромный набор данных, как в исследовании Americans’ Changing Lives. Логика подсказывает, что надо с меньшей уверенностью обобщать полученные результаты на все взрослое население, если выборка состоит не из 3000 взрослых, а лишь из 25. Одно из положений, которые неоднократно подчеркивались в этой книге, заключается в том, что меньшие выборки, как правило, порождают больший разброс исходов. Выборка из 25 взрослых по-прежнему обеспечивает значимые результаты, как обеспечивала бы выборка из 10 и даже 5 человек, но насколько значимыми они являются?
На этот вопрос ответит t-распределение. При анализе зависимости между ростом и весом для нескольких выборок из 25 взрослых уже нельзя исходить из того, что разные коэффициенты регрессии, которые мы получаем, будут распределены по нормальному закону вблизи «истинного» коэффициента регрессии для взрослого населения в целом. Они по-прежнему будут распределяться вблизи «истинного» коэффициента для взрослого населения в целом, но формой этого распределения уже не будет хорошо нам знакомая колоколообразная кривая нормального распределения. Вместо этого мы должны предположить, что многие выборки, состоящие лишь из 25 взрослых, будут порождать больший разброс вблизи истинного коэффициента совокупности и, следовательно, это распределение будет с «более толстыми хвостами». А многие выборки из 10 взрослых будут порождать еще больший разброс и, соответственно, распределение с еще более толстыми хвостами. По сути, t-распределение представляет собой некую совокупность, или «семейство», функций плотности вероятности, которые варьируются в зависимости от величины выборки. В частности, чем больше данных содержится в выборке, тем больше «степеней свободы»[64] у нас имеется при определении подходящего распределения, которое служит нам эталоном для оценки результатов. Если вы решите изучать более продвинутый курс статистики, то узнаете, как именно вычисляются степени свободы; пока же можем считать, что они примерно равны количеству наблюдений в выборке. Например, регрессионный анализ с выборкой, размер которой составляет 10, и с единственной объясняющей переменной, имеет 9 степеней свободы. Чем больше степеней свободы, тем больше уверенность, что выборка представляет истинную совокупность, и тем «плотнее» будет распределение, как следует из приведенной ниже диаграммы[65].
Поделиться книгой в соц сетях:
Обратите внимание, что комментарий должен быть не короче 20 символов. Покажите уважение к себе и другим пользователям!