Регрессия к среднему значениюСтатистический термин «регрессия», происходящий от латинского корня «возвращение», был впервые использован Франсисом Галтоном в 1886 году в его статье "Regression towards Mediocrity in Hereditary Stature"1. Галтон исследовал взаимосвязь роста детей со средним ростом их родителей, названным Галтоном средне-родительской высотой (см. рисунок). Дети и родители имели одинаковый средний рост 68.2 дюйма. Разброс значений, однако, различался, поскольку средне-родительская высота вычисляется как среднее по двум наблюдениям и, следовательно, имеет меньший разброс. Для примера рассмотрим родителей имеющих средний рост от 70 до 71 дюйма. Средний рост их детей - 69.5 дюймов. Это значение ближе к средней высоте всех детей (68.2 дюйма), чем средняя высота их родителей к средней высоте всех родителей. Галтон назвал это явление "регрессия к посредственности", позднее оно получило название "регрессия к среднему значению". То же самое получится, если мы начнем с детей.Для детей с ростом от 70 до 71 дюйма, средняя высота их родителей составит 69.0 дюймов. Таким образом, регрессия к среднему - статистическое, а не генетическое явление. Если мы выделим несколько диапазонов значений средне-родительского роста и рассчитаем среднюю высоту их детей, то полученные значения будут лежать почти на прямой линии. Эта линия была названа линией регрессии, а сам процесс нахождения этой линии также получил название "регрессия". В математических терминах, если переменные X и Y имеют стандартные отклонения SX и SY соответственно и корреляцию r, то наклон всем известной линии регрессии, рассчитываемой по методу наименьших квадратов, может быть записан как r*SY/SX. Т.е., при перемещении вдоль оси X на одно стандартное отклонение, величина Y изменяется на r стандартных отклонений. До тех пор пока X и Y не связаны строго линейно, т.е. все точки находятся на прямой линии, величина r меньше 1. Это означает, что для данного значения X предсказанное значение Y, выраженное в единицах стандартного отклонения от среднего, всегда меньшее, чем соответствующее отклонение X от среднего значения. "Регрессия к среднему значению" происходит вплоть до идеальной корреляции (r = 1), т.е. всегда наблюдается на практике. Некоторые примеры подобной регрессии будут даны далее. ![]() Данные Галтона, показывающие соотношения между ростом детей (вертикальная ось) и их родителей (горизонтальная ось), с линией регрессии. |
Книги > Заметки по медицинской статистике >