Непараметрический коэффициент ранговой корреляции спирмена. Коэффициент ранговой корреляции спирмена


This calculator below calculates Spearman"s rank correlation coefficient between two random variables. The theoretical part is traditional below the calculator.

add import_export mode_edit delete

Changes of random variables

arrow_upward arrow_downward arrow_upward arrow_downward
Items per page: 5 10 20 50 100 chevron_left chevron_right

Changes of random variables

Import data Import error

"One of the following characters is used to separate data fields: tab, semicolon (;) or comma(,)" Sample: -50.5;-50.5

Import Back Cancel

Digits after the decimal point: 4

Calculate

Spearman"s correlation coefficient

Save share extension

The method of Spearman"s rank correlation coefficient calculation is actually pretty simple. It"s like the Pearson correlation coefficient , but designed not for measurements of random variables only but for their ranking values .

We have only to understand what is the rank value and why all this is necessary.

If the elements of a variational series arranged in ascending or descending order, that rank of the element will be his number in ordered series.

For example, we have a variational series {17,26,5,14,21}. Let"s sort it"s elements in a descending order {26,21,17,14,5}. 26 has a rank of 1, 21 - rank of 2 and so on, Variational series of ranking values will look like this {3,1,5,4,2}.

I.e. when calculating Spearman"s coefficient initial variation series are converted into variational series of ranking values and then Pearson"s formula is applied to them.
.
There is one subtlety - the rank of the repeating values is taken as the average of the ranks. That is, for a series {17, 15, 14, 15}ranking series will look like {1, 2.5, 4, 2.5}, as the first element is 15 has a rank of 2, and the second - rank of 3, and.

If you don"t have the repeating values, that is, all the values of ranking series - the numbers between 1 and n, the Pearson"s formula can be simplified to

By the way, this formula is often given as the formula for calculating the Spearman"s coefficient.

What is the essence of the transition from the values themselves to their rank value?
When investigating the correlation of ranking values you can find how well the dependence of the two variables is described by a monotonic function.

The sign of the coefficient indicates the direction of the relationship between variables. If the sign is positive the values of Y has a tendency to increase with the increasement of X. If the sign is negative the values of Y has a tendency to decrease with the increasement of X. If the coefficient is 0 there is no tendency then. If the coefficient equals 1 or -1, the relationship between X and Y has an appearance of monotonic function, i.e. with the increasement of X, Y also increases and vice versa.

That is, unlike the Pearson"s correlation coefficient, which can detect only the linear relationship of one variable from another, Spearman"s correlation coefficient can detect monotonic dependence, where the direct linear relationship cannot be revealed.

Here"s an example.
Поясню на примере. Let"s suppose,we examine the function y=10/x.
We have the following measurements of X and Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
For this data, Pearson correlation coefficient is equal to -0.4686, i.e. the relationship is weak or absent. And Spearman"s correlation coefficient is strictly equal to -1, as if it"s hints to the researcher that Y has strongly negative monotonic dependence from X.

Студента-психолога (социолога, менеджера, управленца и др.) нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых группах.

В математике для описания связей между переменными величинами используют понятие функции F, которая ставит в соответствие каждому определенному значению независимой переменной X определенное значение зависимой переменной Y. Полученная зависимость обозначается как Y=F(X).

При этом виды корреляционных связей между измеренными признаками могут быть различны: так, корреляция бывает линейной и нелинейной, положительной и отрицательной. Она линейна - если с увеличением или уменьшением одной переменной X,вторая переменная Y в среднем либо также растет, либо убывает. Она нелинейна, если при увеличении одной величины характер изменения второй не линеен, а описывается другими законами.

Корреляция будет положительной, если с увеличением переменной X переменная Y в среднем также увеличивается, а если с увеличением X переменная Y имеет в среднем тенденцию к уменьшению, то говорят о наличии отрицательной корреляции. Возможна ситуация, когда между переменными невозможно установить какую-либо зависимость. В этом случае говорят об отсутствии корреляционной связи.

Задача корреляционного анализа сводится к установлению направления (положительное или отрицательное) и формы (линейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.

Коэффициент корреляции рангов, предложенный К. Спирменом, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин.

Ранговый коэффициент линейной корреляции Спирмена подсчитывается по формуле:

где n - количество ранжируемых признаков (показателей, испытуемых);
D - разность между рангами по двум переменным для каждого испытуемого;
D2 - сумма квадратов разностей рангов.

Критические значения коэффициента корреляции рангов Спирмена представлены ниже:

Величина коэффициента линейной корреляции Спирмена лежит в интервале +1 и -1. Коэффициент линейной корреляции Спирмена может быть положительным и отрицательным, характеризуя направленность связи между двумя признаками, измеренными в ранговой шкале.

Если коэффициент корреляции по модулю оказывается близким к 1, то это соответствует высокому уровню связи между переменными. Так, в частности, при корреляции переменной величины с самой собой величина коэффициента корреляции будет равна +1. Подобная связь характеризует прямо пропорциональную зависимость. Если же значения переменной X будут распложены в порядке возрастания, а те же значения (обозначенные теперь уже как переменная Y) будут располагаться в порядке убывания, то в этом случае корреляция между переменными Х и Y будет равна точно -1. Такая величина коэффициента корреляции характеризует обратно пропорциональную зависимость.

Знак коэффициента корреляции очень важен для интерпретации полученной связи. Если знак коэффициента линейной корреляции - плюс, то связь между коррелирующими признаками такова, что большей величине одного признака (переменной) соответствует большая величина другого признака (другой переменной). Иными словами, если один показатель (переменная) увеличивается, то соответственно увеличивается и другой показатель (переменная). Такая зависимость носит название прямо пропорциональной зависимости.

Если же получен знак минус, то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости. При этом выбор переменной, которой приписывается характер (тенденция) возрастания - произволен. Это может быть как переменная X, так и переменная Y. Однако если считается, что увеличивается переменная X, то переменная Y будет соответственно уменьшаться, и наоборот.

Рассмотрим пример корреляции Спирмена.

Психолог выясняет, как связаны между собой индивидуальные показатели готовности к школе, полученные до начала обучения в школе у 11 первоклассников и их средняя успеваемость в конце учебного года.

Для решения этой задачи были проранжированы, во-первых, значения показателей школьной готовности, полученные при поступлении в школу, и, во-вторых, итоговые показатели успеваемости в конце года у этих же учащихся в среднем. Результаты представим в таблице:

Подставляем полученные данные в вышеприведенную формулу, и производим расчет. Получаем:

Для нахождения уровня значимости обращаемся к таблице «Критические значения коэффициента корреляции рангов Спирмена,» в которой приведены критические значения для коэффициентов ранговой корреляции.

Строим соответствующую «ось значимости»:

Полученный коэффициент корреляции совпал с критическим значением для уровня значимости в 1%. Следовательно, можно утверждать, что показатели школьной готовности и итоговые оценки первоклассников связаны положительной корреляционной зависимостью - иначе говоря, чем выше показатель школьной готовности, тем лучше учится первоклассник. В терминах статистических гипотез психолог должен отклонить нулевую (Н0) гипотезу о сходстве и принять альтернативную (Н1) о наличии различий, которая говорит о том, что связь между показателями школьной готовности и средней успеваемостью отлична от нуля.

Корреляция спирмена. Корреляционный анализ по методу спирмена. Ранги спирмена. Коэффициент корреляции Спирмена. Ранговая корреляция Спирмена

Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и направление корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков.

Для подсчета ранговой корреляции необходимо располагать двумя рядами значений,

которые могут быть проранжированы. Такими рядами значений могут быть:

1) два признака, измеренные в одной и той же группе испытуемых;

2) две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков;

3) две групповые иерархии признаков,

4) индивидуальная и групповая иерархии признаков.

Вначале показатели ранжируются отдельно по каждому из признаков.

Как правило, меньшему значению признака начисляется меньший ранг.

В первом случае (два признака) ранжируются индивидуальные значения по первому признаку, полученные разными испытуемыми, а затем индивидуальные значения по второму признаку.

Если два признака связаны положительно, то испытуемые, имеющие низкие ранги по одному из них, будут иметь низкие ранги и по другому, а испытуемые, имеющие высокие ранги по

одному из признаков, будут иметь по другому признаку также высокие ранги. Для подсчета rs необходимо определить разности (d) между рангами, полученными данным испытуемым по обоим признакам. Затем эти показатели d определенным образом преобразуются и вычитаются из 1. Чем

меньше разности между рангами, тем больше будет rs, тем ближе он будет к +1.

Если корреляция отсутствует, то все ранги будут перемешаны и между ними не будет

никакого соответствия. Формула составлена так, что в этом случае rs окажется близким к 0.

В случае отрицательной корреляции низким рангам испытуемых по одному признаку

будут соответствовать высокие ранги по другому признаку, и наоборот. Чем больше несовпадение между рангами испытуемых по двум переменным, тем ближе rs к -1.

Во втором случае (два индивидуальных профиля), ранжируются индивидуальные

значения, полученные каждым из 2-х испытуемым по определенному (одинаковому для них обоих) набору признаков. Первый ранг получит признак с самым низким значением; второй ранг – признак с более высоким значением и т.д. Очевидно, что все признаки должны быть измерены в одних и тех же единицах, иначе ранжирование невозможно. Например, невозможно проранжировать показатели по личностному опроснику Кеттелла (16PF), если они выражены в "сырых" баллах, поскольку по разным факторам диапазоны значений различны: от 0 до 13, от 0 до

20 и от 0 до 26. Мы не можем сказать, какой из факторов будет занимать первое место по выраженности, пока не приведем все значения к единой шкале (чаще всего это шкала стенов).

Если индивидуальные иерархии двух испытуемых связаны положительно, то признаки, имеющие низкие ранги у одного из них, будут иметь низкие ранги и у другого, и наоборот. Например, если у одного испытуемого фактор Е (доминантность) имеет самый низкий ранг, то и у другого испытуемого он должен иметь низкий ранг, если у одного испытуемого фактор С

(эмоциональная устойчивость) имеет высший ранг, то и другой испытуемый должен иметь по

этому фактору высокий ранг и т.д.

В третьем случае (два групповых профиля), ранжируются среднегрупповые значения, полученные в 2-х группах испытуемых по определенному, одинаковому для двух групп, набору признаков. В дальнейшем линия рассуждений такая же, как и в предыдущих двух случаях.

В случае 4-ом (индивидуальный и групповой профили), ранжируются отдельно индивидуальные значения испытуемого и среднегрупповые значения по тому же набору признаков, которые получены, как правило, при исключении этого отдельного испытуемого – он не участвует в среднегрупповом профиле, с которым будет сопоставляться его индивидуальный профиль. Ранговая корреляция позволит проверить, насколько согласованы индивидуальный и групповой профили.

Во всех четырех случаях значимость полученного коэффициента корреляции определяется по количеству ранжированных значений N. В первом случае это количество будет совпадать с объемом выборки n. Во втором случае количеством наблюдений будет количество признаков, составляющих иерархию. В третьем и четвертом случае N – это также количество сопоставляемых признаков, а не количество испытуемых в группах. Подробные пояснения даны в примерах. Если абсолютная величина rs достигает критического значения или превышает его, корреляция достоверна.

Гипотезы.

Возможны два варианта гипотез. Первый относится к случаю 1, второй – к трем остальным случаям.

Первый вариант гипотез

H0: Корреляция между переменными А и Б не отличается от нуля.

H1: Корреляция между переменными А и Б достоверно отличается от нуля.

Второй вариант гипотез

H0: Корреляция между иерархиями А и Б не отличается от нуля.

H1: Корреляция между иерархиями А и Б достоверно отличается от нуля.

Ограничения коэффициента ранговой корреляции

1. По каждой переменной должно быть представлено не менее 5 наблюдений. Верхняя граница выборки определяется имеющимися таблицами критических значений.

2. Коэффициент ранговой корреляции Спирмена rs при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпадающих значений. В случае, если это условие не соблюдается, необходимо вносить поправку на одинаковые ранги.

Коэффициент ранговой корреляции Спирмена подсчитывается по формуле:

Если в обоих сопоставляемых ранговых рядах присутствуют группы одинаковых рангов, перед подсчетом коэффициента ранговой корреляции необходимо внести поправки на одинаковые ранги Та и Тв:

Та = Σ (а3 – а)/12,

Тв = Σ (в3 – в)/12,

где а – объем каждой группы одинаковых рангов в ранговом ряду А, в – объем каждой

группы одинаковых рангов в ранговом ряду В.

Для подсчета эмпирического значения rs используют формулу:

Расчет коэффициента ранговой корреляции Спирмена rs

1. Определить, какие два признака или две иерархии признаков будут участвовать в

сопоставлении как переменные А и В.

2. Проранжировать значения переменной А, начисляя ранг 1 наименьшему значению, в соответствии с правилами ранжирования (см. П.2.3). Занести ранги в первый столбец таблицы по порядку номеров испытуемых или признаков.

3. Проранжировать значения переменной В, в соответствии с теми же правилами. Занести ранги во второй столбец таблицы по порядку номеров испытуемых или признаков.

5. Возвести каждую разность в квадрат: d2. Эти значения занести в четвертый столбец таблицы.

Та = Σ (а3 – а)/12,

Тв = Σ (в3 – в)/12,

где а – объем каждой группы одинаковых рангов в ранговом ряду А; в – объем каждой группы

одинаковых рангов в ранговом ряду В.

а) при отсутствии одинаковых рангов

rs  1 − 6 ⋅

б) при наличии одинаковых рангов

Σd 2  T  T

r  1 − 6 ⋅ a в,

где Σd2 – сумма квадратов разностей между рангами; Та и Тв – поправки на одинаковые

N – количество испытуемых или признаков, участвовавших в ранжировании.

9. Определить по Таблице (см. Приложение 4.3) критические значения rs для данного N. Если rs, превышает критическое значение или, по крайней мере, равен ему, корреляция достоверно отличается от 0.

Пример 4.1.При определении степени зависимости реакции употребления алкоголя на глазодвигательную реакцию в испытуемой группе были получены данные до употребления алкоголя и после употребления. Зависит ли реакция испытуемого от состояния опьянения?

Результаты эксперимента:

До:16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. После: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Сформулируем гипотезы:

Н0: корреляция между степенью зависимости реакции до употребления алкоголя и после не отличается от нуля.

Н1: корреляция между степенью зависимости реакции до употребления алкоголя и после достоверно отличается от нуля.

Таблица 4.1. Расчет d2 для рангового коэффициента корреляции Спирмена rs при сопоставлении показателей глазодвигательной реакции до эксперимента и после (N=17)

значения

значения

Так как, мы имеем повторяющиеся ранги, то в данном случае будем применять формулу с поправкой на одинаковые ранги:

Та= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Тb =((23-2)+(23-2)+(33-3))/12=3

Найдем эмпирическое значение коэффициента Спирмена:

rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

По таблице (приложение 4.3) находим критические значения коэффициента корреляции

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Получаем

rs=0,05∠rкр(0,05)=0,48

Вывод: Н1гипотеза отвергается и принимается Н0. Т.е. корреляция между степенью

зависимости реакции до употребления алкоголя и после не отличается от нуля.

​ Коэффициент ранговой корреляции Спирмена – это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

1. История разработки коэффициента ранговой корреляции

Данный критерий был разработан и предложен для проведения корреляционного анализа в 1904 году Чарльзом Эдвардом Спирменом , английским психологом, профессором Лондонского и Честерфилдского университетов.

2. Для чего используется коэффициент Спирмена?

Коэффициент ранговой корреляции Спирмена используется для выявления и оценки тесноты связи между двумя рядами сопоставляемых количественных показателей . В том случае, если ранги показателей, упорядоченных по степени возрастания или убывания, в большинстве случаев совпадают (большему значению одного показателя соответствует большее значение другого показателя - например, при сопоставлении роста пациента и его массы тела ), делается вывод о наличии прямой корреляционной связи. Если ранги показателей имеют противоположную направленность (большему значению одного показателя соответствует меньшее значение другого - например, при сопоставлении возраста и частоты сердечных сокращений ), то говорят об обратной связи между показателями.

    Коэффициент корреляции Спирмена обладает следующими свойствами:
  1. Коэффициент корреляции может принимать значения от минус единицы до единицы, причем при rs=1 имеет место строго прямая связь, а при rs= -1 – строго обратная связь.
  2. Если коэффициент корреляции отрицательный, то имеет место обратная связь, если положительный, то – прямая связь.
  3. Если коэффициент корреляции равен нулю, то связь между величинами практически отсутствует.
  4. Чем ближе модуль коэффициента корреляции к единице, тем более сильной является связь между измеряемыми величинами.

3. В каких случаях можно использовать коэффициент Спирмена?

В связи с тем, что коэффициент является методом непараметрического анализа , проверка на нормальность распределения не требуется.

Сопоставляемые показатели могут быть измерены как в непрерывной шкале (например, число эритроцитов в 1 мкл крови), так и в порядковой (например, баллы экспертной оценки от 1 до 5).

Эффективность и качество оценки методом Спирмена снижается, если разница между различными значениями какой-либо из измеряемых величин достаточно велика. Не рекомендуется использовать коэффициент Спирмена, если имеет место неравномерное распределение значений измеряемой величины.

4. Как рассчитать коэффициент Спирмена?

Расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:

5. Как интерпретировать значение коэффициента Спирмена?

При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее - показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.

Статистическая значимость полученного коэффициента оценивается при помощи t-критерия Стьюдента. Если расчитанное значение t-критерия меньше табличного при заданном числе степеней свободы, статистическая значимость наблюдаемой взаимосвязи - отсутствует. Если больше, то корреляционная связь считается статистически значимой.

- это количественная оценка статистического изучения связи между явлениями, используемая в непараметрических методах.

Показатель показывает, как отличается полученная при наблюдении сумма квадратов разностей между рангами от случая отсутствия связи.

Назначение сервиса . С помощью данного онлайн-калькулятора производится:

  • расчет коэффициента ранговой корреляции Спирмена;
  • вычисление доверительного интервала для коэффициента и оценка его значимости;

Коэффициент ранговой корреляции Спирмена относится к показателям оценки тесноты связи. Качественную характеристику тесноты связи коэффициента ранговой корреляции, как и других коэффициентов корреляции, можно оценить по шкале Чеддока .

Расчет коэффициента состоит из следующих этапов:

Свойства коэффициента ранговой корреляции Спирмена

Область применения . Коэффициент корреляции рангов используется для оценки качества связи между двумя совокупностями. Кроме этого, его статистическая значимость применяется при анализе данных на гетероскедастичность .

Пример . По выборке данных наблюдаемых переменных X и Y:

  1. составить ранговую таблицу;
  2. найти коэффициент ранговой корреляции Спирмена и проверить его значимость на уровне 2a
  3. оценить характер зависимости
Решение. Присвоим ранги признаку Y и фактору X .
X Y ранг X, d x ранг Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Матрица рангов.
ранг X, d x ранг Y, d y (d x - d y) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Проверка правильности составления матрицы на основе исчисления контрольной суммы:

Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.
По формуле вычислим коэффициент ранговой корреляции Спирмена.


Связь между признаком Y и фактором X сильная и прямая
Значимость коэффициента ранговой корреляции Спирмена
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе H i . p ≠ 0, надо вычислить критическую точку:

где n - объем выборки; ρ - выборочный коэффициент ранговой корреляции Спирмена: t(α, к) - критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости α и числу степеней свободы k = n-2.
Если |p| < Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| > T kp - нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.
По таблице Стьюдента находим t(α/2, k) = (0.1/2;12) = 1.782

Поскольку T kp < ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.
Выбор редакции
Денежная единица РФ "...Статья 27. Официальной денежной единицей (валютой) Российской Федерации является рубль. Один рубль состоит из 100...

Техника "100 желаний" Научиться исполнять желания может каждый. Для этого нужно всего лишь договориться со своим подсознанием! А как это...

Получив атеистическое воспитание, я долгое время не испытывал интереса, а уж тем более священного трепета от религиозных святынь да...

Скакать во сне на белой лошади - прекрасный знак. В первую очередь он сулит Вам прочность дружеских связей и радость встреч с товарищами...
Заранее говорю, никогда не пробовала делать с другим сыром, только с твердыми сортами. В данном рецепте я использовала остатки трех...
Будьте чуткими к изменениям настроения любимых людей! Помните: мы получаем от мира ровно то, что ему даем. Хотите, чтобы окружающие...
Татуировка - практически такое же древнее явление, как и существование человечества. Тату были обнаружены даже на телах мумий, найденных...
Святой Спиридон Тримифунтский - очень почитаемый подвижник во всем христианском мире. К его мощам, на острове Корфу в Греции, постоянно...
Праздники, кто же их не любит? А что же легло в основу праздника День Народного Единства в России ? Праздник единства подчеркивает: какой...