Коэффициент корреляции Пирсона: Определение, формула и расчет, примеры

Коэффициент корреляции Пирсона

Обычно принято количественно оценивать линейные связи с помощью коэффициента корреляции Пирсона. Чтобы указать силу и направление связи между двумя переменными, он принимает значение от -1 до 1.

Это может помочь инвесторам в диверсификации. Расчеты по диаграммам рассеяния исторических доходностей между парами активов, такими как акции-облигации, акции-товары, облигации-недвижимость и т.д., помогут инвесторам строить портфели риск-доходность.

Теперь мы познакомимся с коэффициентом корреляции Пирсона и узнаем, как с его помощью измерить связь между двумя связанными переменными.

Что такое коэффициент корреляции Пирсона?

Коэффициент корреляции Пирсона r Пирсона определяется в статистике как измерение силы связи между двумя переменными и их ассоциации друг с другом.

Проще говоря, коэффициент корреляции Пирсона рассчитывает эффект изменения одной переменной при изменении другой переменной.

Например: До определенного возраста (в большинстве случаев) рост ребенка будет увеличиваться по мере увеличения его возраста. Конечно, его рост зависит от различных факторов, таких как гены, местоположение, диета, образ жизни и т.д.

Этот подход основан на ковариации и, таким образом, является лучшим методом для измерения взаимосвязи между двумя переменными.

Что делает тест коэффициента корреляции Пирсона?

Коэффициент корреляции Пирсона имеет высокую статистическую значимость. Он рассматривает взаимосвязь между двумя переменными. Он стремится провести линию через данные двух переменных, чтобы показать их взаимосвязь. Связь между переменными измеряется с помощью калькулятора коэффициента корреляции Пирсона. Эта линейная связь может быть положительной или отрицательной.

Коэффициент корреляции Пирсона типы линейной связи

Например:

  • Положительная линейная связь: В большинстве случаев, универсально, доход человека увеличивается по мере увеличения его возраста.
  • Отрицательная линейная зависимость: Если автомобиль увеличивает скорость, время, затраченное на поездку, уменьшается, и наоборот.

Из приведенного выше примера видно, что коэффициент корреляции Пирсона, r, пытается выяснить две вещи - силу и направление связи при заданных объемах выборки.

Коэффициент корреляции Пирсона формула и расчет

Формула коэффициента корреляции выявляет связь между переменными. Она возвращает значения от -1 до 1. Используйте приведенный ниже калькулятор корреляции коэффициента Пирсона для измерения силы связи между двумя переменными.

Формула коэффициента корреляции Пирсона:

pearson formula

Где:
N = количество пар оценок
?xy = сумма произведений парных оценок
?x = сумма оценок x
?y = сумма оценок y
?x2 = сумма квадратов оценок x
?y2 = сумма квадратов оценок y

Расчет

Здесь представлено пошаговое руководство по расчету коэффициента корреляции Пирсона:

Шаг первый: Создайте таблицу коэффициентов корреляции.
Постройте график данных, включив в него обе переменные. Пометьте эти переменные 'x' и 'y'. Добавьте три дополнительных столбца - (xy), (x^2) и (y^2). Обратитесь к этой простой диаграмме данных.

pearson table

Шаг второй: Используйте базовое умножение для завершения таблицы.

pearson table

Шаг третий: Сложите все колонки снизу вверх.

pearson table

Шаг четвертый: Подставьте значения в формулу корреляции.

Если результат отрицательный, то между двумя переменными существует отрицательная корреляционная связь. Если результат положительный, между переменными существует положительная корреляционная связь. Результаты также могут определять силу линейной связи, т.е, сильная положительная связь, сильная отрицательная связь, средняя положительная связь и так далее.

Определение силы коэффициента продукционно-моментной корреляции Пирсона.

Коэффициент продукционно-моментной корреляции Пирсона, или просто коэффициент корреляции Пирсона или коэффициент корреляции r, определяет силу линейной связи между двумя переменными.

Чем сильнее связь между двумя переменными, тем ближе ваш ответ будет склоняться к 1 или -1. Значения 1 или -1 означают, что все точки данных расположены на прямой линии "наилучшего соответствия". Это означает, что изменение факторов какой-либо переменной не ослабляет корреляцию с другой переменной. Чем ближе ваш ответ лежит к 0, тем больше разброс в переменных.

Как интерпретировать коэффициент корреляции Пирсона

Ниже приведены предлагаемые рекомендации по интерпретации корреляции коэффициента Пирсона:
Корреляция Пирсона
Обратите внимание, что сила связи переменных зависит от того, что вы измеряете, и от объема выборки.

На графике можно заметить связь между переменными и сделать предположения еще до их расчета. Графики рассеяния, если они расположены близко к линии, показывают сильную связь между переменными.

Чем ближе графики рассеяния лежат к линии, тем сильнее связь между переменными. Чем дальше они удаляются от линии, тем слабее взаимосвязь. Если линия почти параллельна оси x из-за беспорядочного расположения точек разброса на графике, можно предположить, что корреляция между двумя переменными отсутствует.

Что означают термины сила и направление?

Термины "сила" и "направление" имеют статистическое значение. Вот прямое объяснение этих двух слов:

  • Сила: Сила означает корреляцию отношений между двумя переменными. Она означает, насколько последовательно будет изменяться одна переменная в результате изменения другой. Значения, близкие к +1 или -1, указывают на сильную взаимосвязь. Эти значения достигаются, если точки данных лежат на линии или очень близко к ней.

    Чем дальше удаляются точки данных, тем слабее сила линейной зависимости. Когда нет практического способа провести прямую линию, потому что точки данных разбросаны, сила линейной зависимости самая слабая.

  • Направление: Направление линии указывает на положительную линейную или отрицательную линейную связь между переменными. Если линия имеет восходящий наклон, переменные имеют положительную связь.

    Это означает, что увеличение значения одной переменной приведет к увеличению значения другой переменной. Отрицательная корреляция показывает нисходящий наклон. Это означает, что увеличение значения одной переменной приводит к уменьшению значения другой переменной.

Примеры коэффициента корреляции Пирсона

Рассмотрим несколько наглядных примеров, которые помогут вам интерпретировать таблицу коэффициента корреляции:

Большая положительная корреляция

pearson correlation coefficient

  • На рисунке выше показана корреляция почти +1.
  • Трассы рассеяния почти выстроены в прямую линию.
  • Наклон положительный, что означает, что если одна переменная увеличивается, другая переменная также увеличивается, показывая положительную линейную линию.
  • Это означает, что изменение одной переменной прямо пропорционально изменению другой переменной.
  • Примером большой положительной корреляции может быть: "По мере роста детей увеличиваются размеры их одежды и обуви".

Средняя положительная корреляция

pearson's r

  • На рисунке выше изображена положительная корреляция.
  • Корреляция выше +0,8, но ниже 1+.
  • Она показывает довольно сильный линейный восходящий паттерн.
  • Примером средней положительной корреляции может быть - По мере увеличения количества автомобилей увеличивается спрос на топливо.

Малая отрицательная корреляция

Коэффициент корреляции Пирсона

  • На рисунке выше графики рассеяния не так близки к прямой линии по сравнению с предыдущими примерами
  • Она показывает отрицательную линейную корреляцию приблизительно -0.5
  • Изменение одной переменной обратно пропорционально изменению другой переменной, так как наклон отрицательный.
  • Примером небольшой отрицательной корреляции может быть - Чем больше кто-то ест, тем меньше он голоден.

Слабая корреляция / отсутствие корреляции

pearson's r

  • Площадки рассеяния находятся далеко от линии.
  • Трудно провести линию практически.
  • Корреляция приблизительно равна +0.15
  • Невозможно утверждать, что изменение одной переменной прямо пропорционально или обратно пропорционально другой переменной.
  • Примером слабой/отсутствующей корреляции может быть - Повышение цен на топливо приводит к тому, что меньше людей заводят домашних животных.

Заключение

Коэффициент корреляции Пирсона можно определить, собрав данные о двух интересующих вас переменных с помощью опроса. С его помощью можно узнать, является ли корреляция между двумя переменными положительной или отрицательной и насколько она сильна.

Рубрика: 
Ключевые слова: 
Автор: 
Источник: 
  • questionpro
Перевод: 
  • Дмитрий Л

Поделиться