Как не ошибаться. Сила математического мышления - Джордан Элленберг
Шрифт:
Интервал:
На самом деле практически все жизненные обстоятельства, которые сопряжены со случайными колебаниями во времени, могут быть подвержены влиянию регрессии. Вы когда-либо садились на абрикосовую и сырную диету? Теряли на ней около полутора килограммов? Вспомните тот момент, когда вы решили похудеть. Скорее всего, это произошло в тот момент, когда ваш вес находился в верхней части обычного диапазона колебаний веса, поскольку именно в таких случаях вы смотрите на весы или на свою талию и говорите себе: черт, с этим надо что-то делать. Но, если все происходит именно так, вы вполне могли бы потерять полтора килограмма без всяких диет в тот период, когда ваш вес вернулся бы к нормальному значению. Следовательно, такая потеря веса ничего не говорит об эффективности диеты.
Эту задачу можно попытаться решить методом случайной выборки: выберите случайным образом две сотни пациентов, определите, у кого из них избыточный вес, а затем посадите этих людей на диеты. Но затем вы будете делать то, что сделал в свое время Секрист. Сегмент населения с избыточным весом во многом напоминает верхний секстиль компаний. Эти люди страдают избыточным весом с большей вероятностью, чем среднестатистический человек. Однако в их случае более высока и вероятность того, что в день взвешивания они окажутся в верхней части своего диапазона веса. Подобно тому как компании Секриста опускались со временем до среднего уровня, пациенты с избыточным весом также будут терять вес, независимо от эффективности диеты. Именно поэтому лучшие исследования в области диет не изучают результаты только одной диеты; они сравнивают две диеты, чтобы понять, какая из них приводит к большей потере веса. Регрессия к среднему значению должна в равной степени воздействовать на каждую группу людей, придерживающихся диеты, с тем чтобы сравнение было достоверным.
Почему второй роман блестяще начавшего писателя или второй альбом внезапно прославившейся группы так редко бывает столь же хорошим, что и первый? Не потому или не совсем потому, что большинство творческих людей могут сказать миру что-то лишь единожды. Причина в том, что творческий успех, так же как и все остальное в жизни, представляет собой сочетание таланта и удачи, а значит, подвержен влиянию регрессии к среднему значению[250].
Раннинбеки[251], подписывающие крупные долгосрочные контракты, как правило, пробегают меньше ярдов во время следующего сезона[252]. Некоторые специалисты утверждают, будто это объясняется тем, что у них уже нет финансовых стимулов прилагать усилия, чтобы пробежать больше ярдов, а также что здесь играет роль психологический фактор. Однако не менее важно другое: подписание крупного контракта стало результатом очень результативного года. Было бы странно, если в следующем сезоне эти спортсмены не вернулись бы к обычному уровню результативности.
Я пишу эти строки в апреле, в начале бейсбольного сезона, когда каждый год нам преподносят целый букет информационных материалов, повествующих, какие игроки «близки» к достижению невообразимых рекордных результатов. Сегодня из передачи на канале ESPN я узнал, что Мэтт Кемп «готов к яркому началу, обеспечив среднюю результативность отбивания 0,460 и будучи близким к достижению таких показателей, как 86 хоумранов[253], 210 ранов по его удару (RBI) и 172 засчитанные пробежки»{211}. Данные показатели – совершенно поразительные, поскольку никто за всю историю Главной лиги бейсбола не выбивал больше 73 хоумранов за один сезон, – типичный пример ложной линейности. Это напоминает такую текстовую задачу: «Если Марсия может покрасить 9 домов за 17 дней и у нее есть 162 дня на то, чтобы покрасить как можно больше домов…»
Кемп выбил девять хоумранов в первых семнадцати матчах команды «Доджерс»[254], что составило 9/17 ранов на один матч. Таким образом, даже алгебраист-любитель мог бы записать следующее линейное уравнение:
H = G × (9 / 17),
где H – количество хоумранов, которые делает Кемп за весь сезон, а G – количество матчей, которые проводит его команда. Бейсбольный сезон состоит из 162 матчей. Следовательно, если G равно 162, получится 86 (или скорее 85,7647, но 86 – самое близкое целое число).
Однако не все линии прямые. Мэтт Кемп не выбьет 86 хоумранов в текущем году. И именно регрессия к среднему объясняет почему. В любой момент сезона лучший игрок лиги по количеству хоумранов скорее всего действительно хорошо выбивает хоумран. На самом деле по истории игры Мэтта Кемпа мы можем судить, что ему присущи врожденные качества, позволяющие постоянно отбивать бейсбольный мяч с поразительной силой. Однако, по всей вероятности, лучшему игроку лиги по количеству хоумранов порой просто везет, поэтому, какой бы ни была его результативность в лиге, можно предположить, что на протяжении сезона она может упасть.
По правде сказать, на канале ESPN никто не считает, что Мэтт Кемп выбьет 86 хоумранов. Все эти заявления о близости к рекордным показателям, сделанные в апреле, обычно озвучиваются в полушутливом тоне: «Разумеется, он этого не сделает, но что если бы он попытался?» Однако по мере того, как лето проходит, таких разговоров становится все больше, пока посередине сезона люди не начинают вполне серьезно относиться к использованию линейного уравнения для прогнозирования статистических показателей игрока к концу года.
Однако это ошибочный подход. Если существует регрессия к среднему в апреле, то будет регрессия к среднему и в июле.
Поделиться книгой в соц сетях:
Обратите внимание, что комментарий должен быть не короче 20 символов. Покажите уважение к себе и другим пользователям!