Коэффициент корреляции Спирмена: Формула + расчет

Коэффициент корреляции Спирмена: Определение

Коэффициент ранговой корреляции Спирмена или коэффициент корреляции Спирмена - это непараметрическая мера ранговой корреляции (статистической зависимости рангов между двумя переменными).

Названный в честь Чарльза Спирмена, он часто обозначается греческой буквой 'p' (rho) и используется в основном для анализа данных.

Он измеряет силу и направление связи между двумя ранжированными переменными. Но прежде чем говорить о коэффициенте корреляции Спирмена, важно сначала понять, что такое корреляция Пирсона. Корреляция Пирсона - это статистическая мера силы линейной связи между парными данными.

Для расчета и проверки значимости ранговой переменной необходимо, чтобы следующие предположения о данных были верны:

  • Интервал или уровень отношения
  • Линейно связанные
  • Бивариантно распределенные

Если ваши данные не удовлетворяют вышеуказанным предположениям, то вам понадобится коэффициент Спирмена. Для понимания коэффициента корреляции Спирмена необходимо знать, что такое монотонная функция. Монотонная функция - это функция, которая либо никогда не уменьшается, либо никогда не увеличивается по мере увеличения независимой переменной. Монотонную функцию можно объяснить с помощью изображения ниже:

Коэффициент корреляции Спирмена Ран

Изображение объясняет три понятия в монотонной функции:

  1. Монотонно возрастающая: Когда переменная 'x' увеличивается, а переменная 'y' никогда не уменьшается.
  2. Монотонно убывающая: Когда переменная 'x' увеличивается, а переменная 'y' никогда не увеличивается
  3. Не монотонно: Когда переменная 'x' увеличивается, а переменная 'y' иногда увеличивается, а иногда уменьшается.

Монотонная зависимость является менее ограничительной по сравнению с линейной зависимостью, которая используется в коэффициенте Пирсона. Хотя монотонность не является конечным требованием для коэффициента корреляции Спирмена, не имеет смысла добиваться корреляции Спирмена без фактического определения силы и направления монотонной связи, если уже было известно, что связь между переменными немонотонна.

Коэффициент корреляции Спирмена: Формула и расчет на примере

Коэффициент ранговой корреляции Спирмена

Здесь,

n= количество точек данных двух переменных

di = разность рангов "i-го" элемента

Коэффициент Спирмена, может принимать значение от +1 до -1, где,

  • Значение p равное +1 означает идеальную связь рангов
  • Значение p равное 0 означает отсутствие связи рангов
  • Значение p равное -1 означает идеальную отрицательную связь между рангами.

Чем ближе значение p к 0, тем слабее связь между двумя рангами.

Прежде чем приступить к расчету коэффициента ранговой корреляции Спирмена, мы должны уметь ранжировать данные. Важно наблюдать, если при увеличении одной переменной другая переменная следует монотонной зависимости.

На каждом уровне необходимо сравнить значения двух переменных. Вот как происходят вычисления:

Оценки 9 учеников по истории и географии приведены в таблице ниже.

Шаг 1- Создайте таблицу полученных данных.

Шаг 2- Начните с ранжирования двух наборов данных. Ранжирование данных может быть достигнуто путем присвоения рейтинга "1" самому большому числу в столбце, "2" - второму по величине числу и так далее. Наименьшее значение обычно получает самый низкий рейтинг. Это нужно сделать для обоих наборов измерений.

Шаг 3 Добавьте к набору данных третий столбец d, d здесь обозначает разницу между рангами. Например, если ранг первого студента по физике равен 3, а по математике - 5, то разница в рангах равна 3. В четвертом столбце возведите в квадрат значения d.

История Ранг География Ранг d d квадрат
35 3 30 5 2 4
23 5 33 3 2 4
47 1 45 2 1 1
17 6 23 6 0 0
10 7 8 8 1 1
43 2 49 1 1 1
9 8 12 7 1 1
6 9 4 9 0 0
28 4 31 4 0 0
          12

Шаг 4- Сложите все ваши квадратные значения d, что составляет 12 (d квадрат)

Шаг 5- Подставьте эти значения в формулу

Коэффициент ранговой корреляции Спирмена

=1-(6*12)/(9(81-1))

=1-72/720

=1-01

=0.9

Ранговая корреляция Спирмена для этих данных равна 0,9, и, как было сказано выше, если значение p приближается к +1, то у них идеальная ранговая связь.

В приведенном выше примере коэффициент корреляции Спирмена используется для выявления связи между двумя переменными - опытом работы и ежемесячным доходом. Согласно общему представлению, ежемесячный доход должен увеличиваться с ростом опыта работы, а значит, между двумя переменными должна существовать положительная связь, что подтверждается значением rs, равным 0,97

Рубрика: 
Ключевые слова: 
Автор: 
Источник: 
  • questionpro
Перевод: 
  • Valeratal

Поделиться