КОРРЕЛЯЦИЯ - связь между двумя переменными, которая характеризуется их совместной вариацией (коваріацією) - изменение значения одной переменной связано с изменением значений второй. Как правило, о корреляции говорят, если обе переменные являются метрическими или порядковыми (в этом, втором, случае говорят о корреляции рангов или ранговую корреляцию). Относительно номинальных переменных чаще употребляют термины "ассоциация" или "связь".
Если между двумя переменными существует корреляционная связь, то определенному значению одной переменной соответствует не одно, а ціло-совокупность (распределение) значений второй переменной. Это распределение можно заменить соответствующей мерой центральной тенденции (напр., средним значением). Если увеличение значения первой переменной приводит, как правило (то есть как тенденция), к увеличению соответствующего среднего второй переменной, то говорят о положительной или прямую корреляцию. Если же увеличение первого признака связано с уменьшением среднего значения второго признака, то говорят об отрицательной или обратную корреляцию.
Для количественного оценивания корреляционной связи между признаками, измеренными по разным шкалам, существует большое количество коэффициентов корреляции. Так, напр., для двух метрических переменных чаще всего используется коэффициент корреляции Пїрсона (другое название - коэффициент произведения моментов) и корреляционное отношение (другое название - коэффициент eta), для двух порядковых переменных - коэффициенты ранговой корреляции Спирмена и Кендала для двух номинальных переменных коэффициенты Чупрова, Крамера, Гудмана и др. (их часто наз. мерами ассоциации).
Наличие корреляции еще не означает причинной связи между переменными. Возможно, одна из переменных является частичной или исчерпывающей причиной второй, а возможно, обе эти переменные являются следствием одной или нескольких причин (в таком случае говорят о корреляции, приведенную другими признаками). Так, напр., если зафиксирована корреляция между уровнем образования (измеренного как количество лет обучения) мужа и жены в семье, то нельзя сказать, какая из двух переменных является причиной, а какая следствием.
Рассмотрим другой пример. Пусть зафиксирован интенсивный корреляционная связь между ростом братьев и сестер в семье. Ни одна из этих двух признаков (рост ребенка и рост второго ребенка) не может рассматриваться как причина второго признака. Более того, обе они в значительной мере является проявлением других признаков, а именно: роста отца и матери. Если вычислить корреляцию роста детей для семей с одинаковым ростом родителей, то показатель корреляции будет намного меньше. Связь между ростом детей в семье является примером корреляции, обусловленной другими признаками - ростом родителей. Итак, анализ корреляции всегда должен опираться на специфику конкретной задачи, которая решается исследователем Необходимость удаления влияния других признаков приводит к понятию частичной корреляции и соответствующих показателей коэффициентов частичной корреляции. Удаление влияния других признаков может привести как к уменьшению, так и к увеличению значения показателя корреляции.
Анализ корреляционных связей между переменными связан не только с вычислением соответствующих коэффициентов корреляции и мер ассоциации, но и с построением уравнений регрессии.
См. Коэффициент корреляции Пирсона, Меры вариации, регрессионный Анализ.