Некоторые примеры регрессии к среднему значению

Некоторые примеры регрессии к среднему значению

(Bland JM, Altman DG. Some examples of regression towards the mean. BMJ September 1994; v.309, p.780)

Ранее мы показали [1], что регрессия к среднему значению происходит всякий раз, когда мы выбираем крайнюю группу, основаясь на значениях некоторой переменной, и затем измеряем другую переменную для этой группы. Второе среднее будет ближе к общему среднему значению (по всем реализациям), чем первое. Причем, чем слабее корреляция между этими двумя переменными, тем больше эффект регрессии. Регрессия к среднему значению наблюдается во многих исследованиях. Приведенный пример с наследственностью лишь один из многих. Как только мы познакомимся с эффектом регрессии поближе, мы поймем, что она повсюду. Ниже приводится несколько примеров.

Лечение, снижающее высокие показатели. В клинической практике много измерений, таких как вес, концентрация холестерола или давление крови, для которых высокие или низкие показатели являются признаками заболевания или указывают на риск заболевания. Люди с критическими показателями, например, очень высоким давлением крови, обычно подвергаются лечению с целью привести их значения в норму (ближе к среднестатистическим значениям). При повторном замере тех же показателей обнаруживается, что на этот раз среднее значение для критической группы ближе к среднему значению для всей популяции - то есть уменьшилось. Тем не менее, интерпретировать это как результат лечения было бы неверно. Даже если пациенты не подвергались лечению, вычисленное среднее давление крови понизится, вследствие регрессии к среднему значению. Первое и второе измерения будут иметь взаимную корреляцию r < 1 из-за неизбежных погрешностей измерения и биологических колебаний. Разность между вторым средним значением для подгруппы и средним по популяции будет приблизительно в r раз меньше разности между первым средним значением и средним по популяции. Необходимо отличать любые истинные улучшения в результате лечения от регрессии к среднему значению. В наилучшем случае следует использовать рандомизированную контрольную группу, но можно произвести и теоретическую оценку. [2]

Соотношение изменения и начальной величины. Иногда нас интересует соотношение между начальным значением некоторой величины и её изменением через некоторое время. Например, при испытаниях анти-гипертонического препарата, можно предположить, что эффективность препарата различна для пациентов с разным исходным уровнем кровяного давления. Это разумный вопрос, но, к сожалению, эффект регрессии к среднему значению будет наибольшим для пациентов с наивысшим начальным значением давления, так что мы будем наблюдать искомый результат даже на пациентах, не подвергавшихся лечению. [3]

Оценка клинических решений. Правильность клинических решений иногда оценивается комиссией экспертов, которые знакомятся с историей болезни и высказывают свое мнение, согласны они с принятым решением или нет. Поскольку полное согласие между экспертами довольно редко, ряд клинических решений наверняка будут признаны «неправильными». Например, Барретт [4] проанализировал случаи проведения кесарева сечения в связи с патологией плода. Количество членов комиссии, согласных с проведением кесарева сечения, колебалось от 60% до 82.5%. Считалось, что клиническое решение было «правильным», если с ним согласны четыре из пяти членов комиссии. Поскольку согласие среди членов комиссии было слабым, выводы членов комиссии и акушеров, принимавших решения, также были плохо связаны и не все проведенные операции были одобрены комиссией. Авторы сделали вывод, что 30% проведенных кесаревых сечений были излишни, но что действительно показало данное исследование, так это то, что решение о срочной операции при патологии плода является сложным и в среде акушеров существуют разногласия на этот счет.

Сравнение двух методов измерения. При сравнении двух методов измерения одной и той же величины исследователи иногда пытаются провести регрессионный анализ двух методов. Ошибочно считается, что если результаты измерений согласуются, наклон регрессионной прямой должен быть равен 1. Из-за эффекта регрессии к среднему значению следует ожидать, что наклон будет меньше 1, даже если оба метода дают близкие результаты. Например, в двух схожих исследованиях значение веса пациентов было получено в результате опроса пациентов, а также путем взвешивания. [6, 7] Был произведен регрессионный анализ, в котором сообщенный вес использовался как выходная величина, а измеренный вес -- как предсказываемая переменная. Наклон регрессии был меньше 1 в обеих исследованиях. Согласно уравнению регрессии, средний сообщенный вес для тяжелых пациентов был меньше, чем их средний измеренный вес, а средний сообщенный вес легких пациентов был больше, чем их средний измеренный вес. В результате мы имеем простую и привлекательную, но неверную трактовку результатов: пациенты с избытком веса, имеют тенденцию недооценивать свой вес, а чрезмерно худые пациенты обычно переоценивают свой вес. Фактически же, всегда следует ожидать наклон меньше 1, из-за регрессии к среднему значению. Даже если бы сообщенный и измеренный вес были бы в равной степени хорошими показателями истинного веса пациента, то и тогда наклон прямой регрессии сообщенного веса к измеренному будет меньше, чем 1. В то же время, наклон прямой регрессии измеренного веса к сообщенному будет также меньше 1. В результате мы получим прямо противоположный вывод: люди, которые много весят оценивают слишком высоко свой вес и люди, которые весят мало, недооценивают его. В [8] мы описываем лучший подход к подобным данным.

Выбор статей для публикации - Rousseeuw заметил, что рецензии на статьи, представленные к публикации не всегда согласуются с тем, которые из них затем были приняты в печать. [9] Поскольку суждения рецензентов о качестве статьи также бывают ошибочны, они не могут полностью коррелировать с любым другим критерием качества статьи. Поэтому, когда редактор отбирает «наилучшие» статьи для публикации, среднее качество этого выбора будет ниже, чем того хотел бы редактор, а среднее качество отвергнутых статей, будет выше, чем о них думает редактор. В следующий раз, когда Ваша статья будет отвергнута журналом BMJ, не слишком расстраивайтесь. Это может быть лишь еще одним примером регрессии к среднему значению.

  1. Bland JM, Altman DG. Regression towards the mean. BMJ 1994; 308:1499
  2. Davis CE. The effect of regression to the mean in epidemiologic and clinical studies. Am.J.Epidemiol 1976; 104:493-8
  3. Hayes RJ. Methods for accessing whether change depends on initial value. Statistics in Medicine 1988; 7:915-27
  4. Barrett JFR,Jarvis GJ, Macdonald HN, Buchan PC, Tyrrell SN, Litford RJ. Inconsistencies in clinical decision making in obstetrics. Lancet 1990; 336:549-51
  5. Esmail A, Bland M. Caesarian section for fetal distress. Lancet 1990; 336:819
  6. Kuskowska-Wolk A, Karsson P, Stolt M, Rossner S. The predictive values of body mass index based on reported weight and height. Int. J. Obesity 1989; 13:441-3
  7. Schlichting P, Hoilund-Carlsen, Quaade F. Comparison of self reported height and weight with controlled height and weight on women and men. Int. J. Obesity 1981; 5:67-76
  8. Bland JM, Altman DG. Statistical methods for accessing agreement between two methods of clinical measurenment. Lancet 1986; 1:307-10
  9. Rousseeuw PJ. Why the wrong papers get published. Chance 1991;4:41-3
Comments