А мне помогло. Как ориентироваться в море информации о здоровье и осознанно принимать решения - Алия Сарманова
Шрифт:
Интервал:
Когда вы покупаете в магазине 1 кг сахара, то предполагаете, что в измерении веса могут быть погрешности – там на самом деле может быть 1010 граммов, или 997 граммов, или даже 975. Если бы это было научное исследование, в результатах ученые бы написали: средний вес этой упаковки сахара составляет 1000 граммов (95 % ДИ 990 до 1010). И здесь важно отметить, что доверительный интервал показывает не диапазон значений отдельных измерений, а диапазон, в котором ожидается обобщающий показатель – среднее значение (или другой обобщающий показатель) при повторении эксперимента.
Доверительный интервал рассчитывается не только для средних значений (как в примере с сахаром), но и для разности показателей в сравниваемых группах. В таком случае доверительный интервал разности дает понимание, насколько в реальности эти группы различаются. Когда доверительный интервал пересекает 0, это означает, что существует вероятность, что исследуемый эффект или разница между группами может быть как положительной, так и отрицательной. Иными словами, результаты исследования не являются однозначными и не позволяют нам сделать окончательный вывод о наличии или отсутствии эффекта. Для получения более точных и надежных результатов требуется дальнейший анализ или сбор дополнительных данных.
Доверительный интервал также рассчитывается для показателей размера эффекта – отношение шансов, отношение рисков и т. д. Ранее в 5-й главе мы говорили, что если ОШ = 1 или ОР = 1, то это означает, что шансы или риск одинаковы для обеих групп, и это справедливо не только для самого показателя, но и для его доверительного интервала. Так и на рисунке внизу мы видим, что лечение А и Б пересекают линию неэффективности, а лечение В и Г – нет. Отсюда делаем вывод: эффект первых двух препаратов статистически незначим.
Рисунок 25. Как интерпретировать эффективность вмешательства с помощью доверительного интервала
Повторим все, что мы изучили в этом параграфе главы на примере РКИ эффективности диеты, богатой омега‐3 кислотами, у пациентов с мигренью, о котором мы говорили ранее. Помните, там было 3 группы, которым прописали либо диету, богатую только омега‐3 (вторая группа), либо диету, богатую и омега‐3, и омега‐6 (третья группа), либо диету, в которой содержание омега кислот соответствовало среднестатистической диете (контроль). В качестве конечных точек ученые выбрали содержание 17‐гидроксидокозагексаеновой кислоты (17-HDHA) в плазме крови (суррогатная конечная точка) и результаты теста из 6 вопросов о том, как головная боль влияет на жизнь пациента, под названием HIT‐6 (твердая, или жесткая, конечная точка). Показатели измерили в начале исследования и спустя 4 месяца.
17-HDHA – предшественник оксилипинов, которые вырабатываются из омега‐3 кислот и показали обезболивающий эффект в лабораторных исследованиях. Обе диеты, богатые омега‐3, действительно смогли повысить исходный уровень 17-HDHA в крови: средняя разница с поправкой на исходный уровень во второй группе равнялась 1,4 нг/мл (95 % ДИ 1,2 до 1,6), в третьей – 1,2 нг/мл (95 % ДИ 1,0 до 1,5), тогда как в контрольной был всего 0,7 нг/мл (95 % ДИ 0,4 до 0,9). Предполагалось, что изменения в лабораторных анализах крови отразятся на влиянии мигрени на жизнь пациента, которое оценивали с помощью теста HIT‐6. Например, один из вопросов теста звучал так: «За последние 4 недели как часто вы чувствовали себя сытым по горло и раздраженным из-за головных болей?» – и общий результат варьировался между 36 и 78 баллами (чем выше балл, тем сильнее влияние мигрени на жизнь пациента). Это как раз то, что важно для врача и пациента. Но, как оказалось, ни одна из диет не смогла уменьшить этот показатель. Разница между второй и контрольной группой с поправкой на исходные значения составила –1,5 балла, а в целом сравнение с исходным уровнем («до и после») показало, что если в начале исследования участники оценили влияние мигрени на их жизнь на 62,7 балла, то после 4 недель диеты группы диеты, богатой только омега‐3, этот показатель снизился до 58,4 балла. «Ну хоть какое-то улучшение» – возможно, подумают некоторые. Однако взглянем на доверительный интервал разности до и после от –4,2 до 1,2 – а это значит, что при повторении эксперимента 100 раз на разных, но таких же выборках пациентов разница средних значений составит для некоторых пациентов –4,2, а для некоторых +1,2 балла. Примерно такой же показатель получили в третьей группе: –1,6 (95 % ДИ от –4,2 до 1,0). Заметьте, мы в первую очередь ориентировались на разницу с контрольной группой, поскольку в ней на среднестатистической диете тоже было улучшение с 62,3 балла до 59,9 (95 % ДИ от 58,0 до 61,8).
Незначительное улучшение все-таки было. Помимо первичных конечных точек (17-HDHA и HIT‐6), ученые оценивали среднее количество часов головной боли в день. И здесь показатели между группами действительно отличались: если в контрольной группе в среднем голова болела в течение 2,1 часа, то во второй группе всего 1,4 часа, а в третьей – 1,3 часа. То есть разница составила –0,7 часа (95 % ДИ от –1,1 до –0,3) и –0,8 (от –1,2 до –0,4). Также улучшение отметили в количестве дней с головной болью за месяц – приступы мигрени стали реже.
Этот пример с исследованием эффективности диеты, богатой омега‐3, в лечении мигрени еще раз напоминает нам о важности твердых точек (так как показатели 17-HDHA улучшились, а результат HIT‐6 теста нет), о важности контрольной группы (ведь им тоже стало лучше), а также о том, что нужно обязательно взглянуть на цифры и их доверительные интервалы, чтобы понять, что кроется за словами «стало лучше» и «помогло» ли вмешательство.
А дальше остановимся еще на одном показателе, который часто встречается в результатах научных исследований как подтверждение эффективности, но не всегда таковым является.
2.4 Не все то золото, что блестит: Значимость в научных исследованиях
Когда вы читаете результаты клинических испытаний, в глаза часто бросается слово «значимый» – значимый результат, значимый положительный ответ, значимое улучшение. Многие из нас приравнивают «значимость» к буквальному значению «важности», то есть «значимые результаты» равно «важные результаты». Однако в клинических исследованиях значимость бывает двух видов: «статистическая значимость» и «клиническая значимость». И то и другое – значимость, но это не одно и то же.
Статистическая значимость отвечает на вопрос: «Возможно ли, что результаты могут быть случайными?» Клиническая значимость отвечает на вопрос: «Будут ли результаты иметь значение для пациентов?»
Статистически значимая разница означает, что статистический тест показал различия между группами, которые не были вызваны исключительно случайностью. Тогда как клинически значимая разница означает
Поделиться книгой в соц сетях:
Обратите внимание, что комментарий должен быть не короче 20 символов. Покажите уважение к себе и другим пользователям!