Coeficiente de correlación de rango de Spearman no paramétrico. Métodos de comparación de datos paramétricos.


Un estudiante de psicología (sociólogo, directivo, directivo, etc.) suele estar interesado en cómo se relacionan dos o más variables entre sí en uno o más grupos que se estudian.

En matemáticas, para describir las relaciones entre cantidades variables se utiliza el concepto de función F, que asocia cada valor específico de la variable independiente X con un valor específico de la variable dependiente Y. La dependencia resultante se denota como Y=F( X).

Al mismo tiempo, los tipos de correlaciones entre las características medidas pueden ser diferentes: por ejemplo, la correlación puede ser lineal y no lineal, positiva y negativa. Es lineal: si al aumentar o disminuir una variable X, la segunda variable Y, en promedio, también aumenta o disminuye. Es no lineal si, con un aumento en una cantidad, la naturaleza del cambio en la segunda no es lineal, sino que está descrita por otras leyes.

La correlación será positiva si, con un aumento de la variable X, la variable Y en promedio también aumenta, y si, con un aumento de X, la variable Y tiende a disminuir en promedio, entonces hablamos de la presencia de una correlación negativa. correlación. Es posible que sea imposible establecer alguna relación entre variables. En este caso, dicen que no hay correlación.

La tarea del análisis de correlación se reduce a establecer la dirección (positiva o negativa) y la forma (lineal, no lineal) de la relación entre diferentes características, medir su cercanía y, finalmente, verificar el nivel de significancia de los coeficientes de correlación obtenidos.

El coeficiente de correlación de rangos, propuesto por K. Spearman, se refiere a una medida no paramétrica de la relación entre variables medidas en una escala de rangos. Al calcular este coeficiente, no se requieren suposiciones sobre la naturaleza de las distribuciones de características en la población. Este coeficiente determina el grado de cercanía de la conexión entre las características ordinales, que en este caso representan los rangos de las cantidades comparadas.

El coeficiente de correlación lineal de rango de Spearman se calcula mediante la fórmula:

donde n es el número de características clasificadas (indicadores, temas);
D es la diferencia entre los rangos de dos variables para cada materia;
D2 es la suma de diferencias de rangos al cuadrado.

Los valores críticos del coeficiente de correlación de rango de Spearman se presentan a continuación:

El valor del coeficiente de correlación lineal de Spearman se encuentra en el rango de +1 y -1. El coeficiente de correlación lineal de Spearman puede ser positivo o negativo y caracteriza la dirección de la relación entre dos rasgos medidos en una escala de rango.

Si el coeficiente de correlación en valor absoluto es cercano a 1, esto corresponde a un alto nivel de conexión entre las variables. Entonces, en particular, cuando una variable está correlacionada consigo misma, el valor del coeficiente de correlación será igual a +1. Esta relación caracteriza una dependencia directamente proporcional. Si los valores de la variable X están ordenados en orden ascendente y los mismos valores (ahora designados como variable Y) están ordenados en orden descendente, entonces, en este caso, la correlación entre las variables X e Y será exactamente -1. Este valor del coeficiente de correlación caracteriza una relación inversamente proporcional.

El signo del coeficiente de correlación es muy importante para interpretar la relación resultante. Si el signo del coeficiente de correlación lineal es positivo, entonces la relación entre las características correlacionadas es tal que un valor mayor de una característica (variable) corresponde a un valor mayor de otra característica (otra variable). En otras palabras, si un indicador (variable) aumenta, el otro indicador (variable) aumenta en consecuencia. Esta dependencia se llama dependencia directamente proporcional.

Si se recibe un signo menos, entonces un valor mayor de una característica corresponde a un valor menor de otra. En otras palabras, si hay un signo menos, un aumento en una variable (signo, valor) corresponde a una disminución en otra variable. Esta dependencia se llama dependencia inversamente proporcional. En este caso, la elección de la variable a la que se le asigna el carácter (tendencia) de aumento es arbitraria. Puede ser la variable X o la variable Y. Sin embargo, si se considera que la variable X aumenta, entonces la variable Y disminuirá en consecuencia, y viceversa.

Veamos el ejemplo de la correlación de Spearman.

El psicólogo descubre cómo los indicadores individuales de preparación para la escuela, obtenidos antes del inicio de la escuela entre 11 alumnos de primer grado, se relacionan entre sí y con su rendimiento promedio al final del año escolar.

Para solucionar este problema, clasificamos, en primer lugar, los valores de los indicadores de preparación escolar obtenidos al ingreso a la escuela y, en segundo lugar, los indicadores finales de rendimiento académico al final del año para estos mismos estudiantes en promedio. Presentamos los resultados en la tabla:

Sustituimos los datos obtenidos en la fórmula anterior y realizamos el cálculo. Obtenemos:

Para encontrar el nivel de significancia, nos referimos a la tabla “Valores críticos del coeficiente de correlación de rangos de Spearman”, que muestra los valores críticos para los coeficientes de correlación de rangos.

Construimos el correspondiente “eje de significancia”:

El coeficiente de correlación resultante coincidió con el valor crítico para el nivel de significancia del 1%. En consecuencia, se puede argumentar que los indicadores de preparación escolar y las calificaciones finales de los estudiantes de primer grado están conectados por una correlación positiva; en otras palabras, cuanto mayor es el indicador de preparación escolar, mejores son los estudios de los estudiantes de primer grado. En términos de hipótesis estadísticas, el psicólogo debe rechazar la hipótesis nula (H0) de similitud y aceptar la alternativa (H1) de diferencias, lo que sugiere que la relación entre los indicadores de preparación escolar y el rendimiento académico promedio es diferente de cero.

Correlación de Spearman. Análisis de correlación mediante el método de Spearman. Rangos de lancero. Coeficiente de correlación de Spearman. Correlación de rango de Spearman

Es una evaluación cuantitativa del estudio estadístico de la relación entre fenómenos, utilizada en métodos no paramétricos.

El indicador muestra cómo la suma de las diferencias al cuadrado entre los rangos obtenidos durante la observación difiere del caso de no conexión.

Objeto del servicio. Usando esta calculadora en línea usted puede:

  • cálculo del coeficiente de correlación de rangos de Spearman;
  • calcular el intervalo de confianza del coeficiente y evaluar su importancia;

Coeficiente de correlación de rangos de Spearman se refiere a indicadores para evaluar la cercanía de la comunicación. La característica cualitativa de la cercanía de la conexión del coeficiente de correlación de rango, así como otros coeficientes de correlación, se puede evaluar utilizando la escala de Chaddock.

Cálculo del coeficiente consta de los siguientes pasos:

Propiedades del coeficiente de correlación de rangos de Spearman

Área de aplicación. Coeficiente de correlación de rango Se utiliza para evaluar la calidad de la comunicación entre dos poblaciones. Además, su significación estadística se utiliza al analizar datos de heterocedasticidad.

Ejemplo. Basado en una muestra de variables observadas X e Y:

  1. crear una tabla de clasificación;
  2. Encuentre el coeficiente de correlación de rangos de Spearman y verifique su significancia en el nivel 2a.
  3. evaluar la naturaleza de la dependencia
Solución. Asignemos rangos a la característica Y y al factor X.
XYrango X, dxrango Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Matriz de rangos.
rango X, dxrango Y, d y(d x - d y) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Comprobación de la exactitud de la matriz basándose en el cálculo de la suma de comprobación:

La suma de las columnas de la matriz es igual entre sí y la suma de verificación, lo que significa que la matriz está compuesta correctamente.
Usando la fórmula, calculamos el coeficiente de correlación de rango de Spearman.


La relación entre el rasgo Y y el factor X es fuerte y directa.
Importancia del coeficiente de correlación de rangos de Spearman
Para probar la hipótesis nula en el nivel de significancia α, el coeficiente de correlación general de rango de Spearman es igual a cero bajo la hipótesis competitiva Hi. p ≠ 0, necesitamos calcular el punto crítico:

donde n es el tamaño de la muestra; ρ es el coeficiente de correlación de rango de Spearman muestral: t(α, k) es el punto crítico de la región crítica bilateral, que se encuentra en la tabla de puntos críticos de la distribución de Student, según el nivel de significancia α y el número de grados de libertad k = n-2.
Si |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp: se rechaza la hipótesis nula. Existe una correlación de rango significativa entre las características cualitativas.
Usando la tabla de Student encontramos t(α/2, k) = (0.1/2;12) = 1.782

Desde Tkp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

La disciplina “matemáticas superiores” causa rechazo entre algunos, ya que realmente no todos pueden entenderla. Pero aquellos que tienen la suerte de estudiar este tema y resolver problemas utilizando diversas ecuaciones y coeficientes pueden presumir de tener un conocimiento casi completo del mismo. En la ciencia psicológica no sólo existe un enfoque humanitario, sino también ciertas fórmulas y métodos para la verificación matemática de las hipótesis planteadas durante la investigación. Para ello se utilizan varios coeficientes.

Coeficiente de correlación de Spearman

Esta es una medida común para determinar la fuerza de la relación entre dos características cualesquiera. El coeficiente también se llama método no paramétrico. Muestra estadísticas de comunicación. Es decir, sabemos, por ejemplo, que en un niño la agresión y la irritabilidad están interconectadas, y el coeficiente de correlación de rangos de Spearman muestra la relación matemática estadística entre estas dos características.

¿Cómo se calcula el coeficiente de clasificación?

Naturalmente, todas las definiciones o cantidades matemáticas tienen sus propias fórmulas mediante las cuales se calculan. El coeficiente de correlación de Spearman también lo tiene. Su fórmula es la siguiente:

A primera vista la fórmula no es del todo clara, pero si nos fijamos, todo es muy fácil de calcular:

  • n es el número de características o indicadores que se clasifican.
  • d es la diferencia entre ciertos dos rangos correspondientes a dos variables específicas para cada tema.
  • ∑d 2: la suma de todas las diferencias al cuadrado entre los rangos de una característica, cuyos cuadrados se calculan por separado para cada rango.

Ámbito de aplicación de la medida matemática de conexión.

Para aplicar el coeficiente de ranking es necesario que los datos cuantitativos del atributo estén clasificados, es decir, se les asigna un número determinado dependiendo del lugar donde se ubique el atributo y de su valor. Se ha demostrado que dos series de características expresadas en forma numérica son algo paralelas entre sí. El coeficiente de correlación de rangos de Spearman determina el grado de este paralelismo, la cercanía de la conexión entre las características.

Para la operación matemática de calcular y determinar la relación de características utilizando el coeficiente especificado, es necesario realizar algunas acciones:

  1. A cada valor de cualquier tema o fenómeno se le asigna un número en orden: un rango. Puede corresponder al valor de un fenómeno en orden ascendente o descendente.
  2. A continuación, se comparan los rangos del valor de las características de dos series cuantitativas para determinar la diferencia entre ellas.
  3. Para cada diferencia obtenida, su cuadrado se escribe en una columna separada de la tabla y los resultados se resumen a continuación.
  4. Luego de estos pasos, se aplica una fórmula para calcular el coeficiente de correlación de Spearman.

Propiedades del coeficiente de correlación

Las principales propiedades del coeficiente de Spearman incluyen las siguientes:

  • Valores de medición entre -1 y 1.
  • No hay signo del coeficiente de interpretación.
  • La estanqueidad de la conexión está determinada por el principio: cuanto mayor sea el valor, más estrecha será la conexión.

¿Cómo comprobar el valor recibido?

Para comprobar la relación entre los signos, es necesario realizar determinadas acciones:

  1. Se plantea una hipótesis nula (H0), que también es la principal, luego se formula otra alternativa a la primera (H 1). La primera hipótesis será que el coeficiente de correlación de Spearman es 0; esto significa que no habrá relación. El segundo, por el contrario, dice que el coeficiente no es igual a 0, entonces hay conexión.
  2. El siguiente paso es encontrar el valor observado del criterio. Se encuentra utilizando la fórmula básica del coeficiente de Spearman.
  3. A continuación, se encuentran los valores críticos del criterio dado. Esto solo se puede hacer usando una tabla especial, que muestra varios valores para indicadores dados: el nivel de significancia (l) y el número definitorio (n).
  4. Ahora es necesario comparar los dos valores obtenidos: el observable establecido y el crítico. Para ello, es necesario construir una región crítica. Es necesario trazar una línea recta, marcar en ella los puntos del valor crítico del coeficiente con el signo "-" y con el signo "+". A la izquierda y a la derecha de los valores críticos, las áreas críticas se trazan en semicírculos desde los puntos. En el medio, combinando dos valores, está marcado con un semicírculo de OPG.
  5. Luego de esto, se llega a una conclusión sobre la estrecha relación entre ambas características.

¿Cuál es el mejor lugar para utilizar este valor?

La primera ciencia en la que se utilizó activamente este coeficiente fue la psicología. Después de todo, esta es una ciencia que no se basa en números, pero para probar hipótesis importantes sobre el desarrollo de las relaciones, los rasgos de carácter de las personas y el conocimiento de los estudiantes, se requiere una confirmación estadística de las conclusiones. También se utiliza en economía, en particular en transacciones de divisas. Aquí las características se evalúan sin estadísticas. El coeficiente de correlación de rangos de Spearman es muy conveniente en esta área de aplicación porque la evaluación se realiza independientemente de la distribución de las variables, ya que se reemplazan por un número de rango. El coeficiente de Spearman se utiliza activamente en la banca. La sociología, las ciencias políticas, la demografía y otras ciencias también lo utilizan en sus investigaciones. Los resultados se obtienen de la forma más rápida y precisa posible.

Es conveniente y rápido utilizar el coeficiente de correlación de Spearman en Excel. Aquí hay funciones especiales que le ayudarán a obtener rápidamente los valores necesarios.

¿Qué otros coeficientes de correlación existen?

Además de lo que aprendimos sobre el coeficiente de correlación de Spearman, también existen varios coeficientes de correlación que nos permiten medir y evaluar características cualitativas, la relación entre características cuantitativas y la cercanía de la conexión entre ellas, presentadas en una escala de clasificación. Estos son coeficientes como biserial, rango biserial, contingencia, asociación, etc. El coeficiente de Spearman muestra con mucha precisión la cercanía de la relación, a diferencia de todos los demás métodos de determinación matemática.

El coeficiente de correlación de rangos, propuesto por K. Spearman, se refiere a una medida no paramétrica de la relación entre variables medidas en una escala de rangos. Al calcular este coeficiente, no se requieren suposiciones sobre la naturaleza de las distribuciones de características en la población. Este coeficiente determina el grado de cercanía de la conexión entre las características ordinales, que en este caso representan los rangos de las cantidades comparadas.

El coeficiente de correlación de Spearman también se encuentra en el rango de +1 y -1. Al igual que el coeficiente de Pearson, puede ser positivo y negativo y caracteriza la dirección de la relación entre dos características medidas en una escala de rango.

En principio, el número de características clasificadas (cualidades, rasgos, etc.) puede ser cualquiera, pero el proceso de clasificar más de 20 características es difícil. Es posible que esta sea la razón por la que la tabla de valores críticos del coeficiente de correlación de rango se calculó solo para cuarenta características clasificadas (n< 40, табл. 20 приложения 6).

El coeficiente de correlación de rangos de Spearman se calcula mediante la fórmula:

donde n es el número de características clasificadas (indicadores, temas);

D es la diferencia entre los rangos de dos variables para cada materia;

Suma de diferencias de rango al cuadrado.

Utilizando el coeficiente de correlación de rango, considere el siguiente ejemplo.

Ejemplo: Un psicólogo descubre cómo los indicadores individuales de preparación para la escuela, obtenidos antes del inicio de la escuela entre 11 alumnos de primer grado, se relacionan entre sí y con su rendimiento promedio al final del año escolar.

Para solucionar este problema, clasificamos, en primer lugar, los valores de los indicadores de preparación escolar obtenidos al ingreso a la escuela y, en segundo lugar, los indicadores finales de rendimiento académico al final del año para estos mismos estudiantes en promedio. Presentamos los resultados en la tabla. 13.

Tabla 13

Estudiante no.

Rangos de indicadores de preparación escolar

Rangos de desempeño anual promedio

Sustituimos los datos obtenidos en la fórmula y realizamos el cálculo. Obtenemos:

Para encontrar el nivel de significancia, consulte la tabla. 20 del Apéndice 6, que muestra los valores críticos para los coeficientes de correlación de rango.

Lo destacamos en la tabla. 20 del Apéndice 6, como en la tabla de correlación lineal de Pearson, todos los valores de los coeficientes de correlación se dan en valor absoluto. Por tanto, el signo del coeficiente de correlación sólo se tiene en cuenta a la hora de interpretarlo.

La búsqueda de niveles de significancia en esta tabla se realiza mediante el número n, es decir, por el número de sujetos. En nuestro caso n = 11. Para este número encontramos:

0,61 para P 0,05

0,76 para P 0,01

Construimos el correspondiente ``eje de significancia'':

El coeficiente de correlación resultante coincidió con el valor crítico para el nivel de significancia del 1%. En consecuencia, se puede argumentar que los indicadores de preparación escolar y las calificaciones finales de los estudiantes de primer grado están conectados por una correlación positiva; en otras palabras, cuanto mayor es el indicador de preparación escolar, mejores son los estudios de los estudiantes de primer grado. En términos de hipótesis estadísticas, el psicólogo debe rechazar la hipótesis nula de similitud y aceptar la hipótesis alternativa de diferencias, que sugiere que la relación entre los indicadores de preparación escolar y el rendimiento académico promedio es diferente de cero.

El caso de rangos idénticos (iguales)

Si hay rangos idénticos, la fórmula para calcular el coeficiente de correlación lineal de Spearman será ligeramente diferente. En este caso, se añaden dos nuevos términos a la fórmula para calcular los coeficientes de correlación, teniendo en cuenta los mismos rangos. Se denominan correcciones de igual rango y se suman al numerador de la fórmula de cálculo.

donde n es el número de rangos idénticos en la primera columna,

k es el número de rangos idénticos en la segunda columna.

Si hay dos grupos de rangos idénticos en cualquier columna, entonces la fórmula de corrección se vuelve algo más complicada:

donde n es el número de rangos idénticos en el primer grupo de la columna clasificada,

k es el número de rangos idénticos en el segundo grupo de la columna clasificada. La modificación de la fórmula en el caso general es la siguiente:

Ejemplo: Un psicólogo, utilizando una prueba de desarrollo mental (MDT), realiza un estudio de inteligencia en 12 estudiantes de noveno grado. Al mismo tiempo, pide a los profesores de literatura y matemáticas que clasifiquen a esos mismos estudiantes según indicadores de desarrollo mental. La tarea es determinar cómo se relacionan entre sí los indicadores objetivos del desarrollo mental (datos SHTUR) y las evaluaciones de expertos de los docentes.

Presentamos los datos experimentales de este problema y las columnas adicionales necesarias para calcular el coeficiente de correlación de Spearman en forma de tabla. 14.

Tabla 14

Estudiante no.

Rangos de prueba usando SHTURA

Evaluaciones de expertos de profesores de matemáticas.

Evaluaciones de expertos de profesores sobre literatura.

D (segunda y tercera columnas)

D (segunda y cuarta columnas)

(segunda y tercera columnas)

(segunda y cuarta columnas)

Dado que se utilizaron las mismas clasificaciones en la clasificación, es necesario verificar la exactitud de la clasificación en la segunda, tercera y cuarta columnas de la tabla. La suma de cada una de estas columnas da el mismo total: 78.

Comprobamos utilizando la fórmula de cálculo. El cheque da:

Las columnas quinta y sexta de la tabla muestran los valores de la diferencia de rangos entre las evaluaciones de expertos del psicólogo en la prueba SHTUR para cada estudiante y los valores de las evaluaciones de expertos de los profesores, respectivamente, en matemáticas y literatura. La suma de los valores de diferencia de rango debe ser igual a cero. La suma de los valores D en las columnas quinta y sexta dio el resultado deseado. Por tanto, la resta de rangos se realizó correctamente. Se debe realizar una verificación similar cada vez que se realicen tipos de clasificación complejos.

Antes de comenzar a calcular utilizando la fórmula, es necesario calcular las correcciones para los mismos rangos para la segunda, tercera y cuarta columnas de la tabla.

En nuestro caso, en la segunda columna de la tabla hay dos rangos idénticos, por lo tanto, según la fórmula, el valor de la corrección D1 será:

La tercera columna contiene tres rangos idénticos, por lo tanto, según la fórmula, el valor de la corrección D2 será:

En la cuarta columna de la tabla hay dos grupos de tres rangos idénticos, por lo tanto, según la fórmula, el valor de la corrección D3 será:

Antes de continuar con la solución del problema, recordemos que el psicólogo aclara dos preguntas: cómo se relacionan los valores de los rangos en la prueba SHTUR con las evaluaciones de expertos en matemáticas y literatura. Por eso el cálculo se realiza dos veces.

Calculamos el primer coeficiente de clasificación teniendo en cuenta los aditivos según la fórmula. Obtenemos:

Calculemos sin tener en cuenta el aditivo:

Como podemos ver, la diferencia en los valores de los coeficientes de correlación resultó ser muy insignificante.

Calculamos el segundo coeficiente de clasificación teniendo en cuenta los aditivos según la fórmula. Obtenemos:

Calculemos sin tener en cuenta el aditivo:

Una vez más, las diferencias fueron muy pequeñas. Dado que el número de alumnos en ambos casos es el mismo, según Tabla. 20 del Apéndice 6 encontramos los valores críticos en n = 12 para ambos coeficientes de correlación a la vez.

0,58 para P 0,05

0,73 para P 0,01

Trazamos el primer valor en el ``eje de significancia'':

En el primer caso, el coeficiente de correlación de rango obtenido se encuentra en la zona de significancia. Por tanto, el psicólogo debe rechazar la hipótesis nula de que el coeficiente de correlación es similar a cero y aceptar la hipótesis alternativa de que el coeficiente de correlación es significativamente diferente de cero. En otras palabras, el resultado obtenido sugiere que cuanto más altas sean las valoraciones expertas de los estudiantes en la prueba SHTUR, mayores serán sus valoraciones expertas en matemáticas.

Trazamos el segundo valor en el ``eje de significancia'':

En el segundo caso, el coeficiente de correlación de rango se encuentra en la zona de incertidumbre. Por lo tanto, un psicólogo puede aceptar la hipótesis nula de que el coeficiente de correlación es similar a cero y rechazar la hipótesis alternativa de que el coeficiente de correlación es significativamente diferente de cero. En este caso, el resultado obtenido sugiere que las evaluaciones de expertos de los estudiantes en la prueba SHTUR no están relacionadas con las evaluaciones de expertos en literatura.

Para aplicar el coeficiente de correlación de Spearman se deben cumplir las siguientes condiciones:

1. Las variables que se comparan deben obtenerse en una escala ordinal (de rango), pero también se pueden medir en una escala de intervalo y de razón.

2. No importa la naturaleza de la distribución de cantidades correlacionadas.

3. El número de características variables en las variables comparadas X e Y debe ser el mismo.

Las tablas para determinar los valores críticos del coeficiente de correlación de Spearman (Tabla 20, Apéndice 6) se calculan a partir del número de características igual a n = 5 a n = 40, y con un mayor número de variables comparadas, la tabla para el Se debe utilizar el coeficiente de correlación de Pearson (Tabla 19, Apéndice 6). La búsqueda de valores críticos se realiza en k = n.

En los casos en que las mediciones de las características en estudio se realizan en una escala de orden, o la forma de la relación difiere de la lineal, el estudio de la relación entre dos variables aleatorias se lleva a cabo utilizando coeficientes de correlación de rango. Considere el coeficiente de correlación de rangos de Spearman. Al calcularlo, es necesario clasificar (ordenar) las opciones de muestra. La clasificación es la agrupación de datos experimentales en un orden determinado, ya sea ascendente o descendente.

La operación de clasificación se realiza según el siguiente algoritmo:

1. A un valor más bajo se le asigna un rango más bajo. Al valor más alto se le asigna una clasificación correspondiente al número de valores clasificados. Al valor más pequeño se le asigna el rango 1. Por ejemplo, si n=7, entonces el valor más grande recibirá el rango 7, excepto en los casos previstos en la segunda regla.

2. Si varios valores son iguales, entonces se les asigna un rango que es el promedio de los rangos que recibirían si no fueran iguales. Como ejemplo, considere una muestra en orden ascendente que consta de 7 elementos: 22, 23, 25, 25, 25, 28, 30. Los valores 22 y 23 aparecen una vez cada uno, por lo que sus rangos son respectivamente R22=1, y R23=2. El valor 25 aparece 3 veces. Si estos valores no se repitieran, entonces sus rangos serían 3, 4, 5. Por lo tanto, su rango R25 es igual a la media aritmética de 3, 4 y 5: . Los valores 28 y 30 no se repiten, por lo que sus rangos son respectivamente R28=6 y R30=7. Finalmente tenemos la siguiente correspondencia:

3. La suma total de rangos debe coincidir con la calculada, que viene determinada por la fórmula:

donde n es el número total de valores clasificados.

Una discrepancia entre las sumas de rangos reales y calculadas indicará un error cometido al calcular los rangos o resumirlos. En este caso, debe encontrar y corregir el error.

El coeficiente de correlación de rangos de Spearman es un método que permite determinar la fuerza y ​​la dirección de la relación entre dos rasgos o dos jerarquías de rasgos. El uso del coeficiente de correlación de rango tiene una serie de limitaciones:

  • a) La dependencia de correlación asumida debe ser monótona.
  • b) El volumen de cada muestra debe ser mayor o igual a 5. Para determinar el límite superior de la muestra se utilizan tablas de valores críticos (Tabla 3 del Apéndice). El valor máximo de n en la tabla es 40.
  • c) Durante el análisis, es probable que surjan un gran número de rangos idénticos. En este caso, se debe hacer una modificación. El caso más favorable es cuando ambas muestras en estudio representan dos secuencias de valores divergentes.

Para realizar un análisis de correlación, el investigador debe tener dos muestras que puedan clasificarse, por ejemplo:

  • - dos características medidas en el mismo grupo de sujetos;
  • - dos jerarquías individuales de rasgos identificados en dos sujetos utilizando el mismo conjunto de rasgos;
  • - dos jerarquías grupales de características;
  • - jerarquías de características individuales y grupales.

Comenzamos el cálculo clasificando los indicadores estudiados por separado para cada una de las características.

Analicemos un caso con dos signos medidos en el mismo grupo de sujetos. Primero, los valores individuales obtenidos por diferentes sujetos se clasifican según la primera característica, y luego los valores individuales se clasifican según la segunda característica. Si los rangos más bajos de un indicador corresponden a rangos más bajos de otro indicador, y los rangos más altos de un indicador corresponden a rangos más altos de otro indicador, entonces las dos características están relacionadas positivamente. Si los rangos más altos de un indicador corresponden a rangos más bajos de otro indicador, entonces las dos características están relacionadas negativamente. Para encontrar rs, determinamos las diferencias entre los rangos (d) para cada tema. Cuanto menor sea la diferencia entre los rangos, más cerca estará el coeficiente de correlación de rango rs de “+1”. Si no hay relación, entonces no habrá correspondencia entre ellos, por lo que rs será cercano a cero. Cuanto mayor sea la diferencia entre los rangos de sujetos en dos variables, más cercano a “-1” será el valor del coeficiente rs. Por tanto, el coeficiente de correlación de rangos de Spearman es una medida de cualquier relación monótona entre las dos características en estudio.

Consideremos el caso de dos jerarquías individuales de rasgos identificados en dos sujetos utilizando el mismo conjunto de rasgos. En esta situación, los valores individuales obtenidos por cada uno de los dos sujetos se clasifican según un determinado conjunto de características. A la característica con el valor más bajo se le debe asignar el primer rango; la característica con mayor valor es la de segundo rango, etc. Se debe tener especial cuidado para garantizar que todos los atributos se midan en las mismas unidades. Por ejemplo, es imposible clasificar los indicadores si se expresan en diferentes puntos de "precio", ya que es imposible determinar cuál de los factores ocupará el primer lugar en términos de gravedad hasta que todos los valores se lleven a una sola escala. Si las características que tienen rangos bajos en uno de los sujetos también lo tienen en otro, y viceversa, entonces las jerarquías individuales están relacionadas positivamente.

En el caso de dos jerarquías de características grupales, los valores grupales promedio obtenidos en dos grupos de sujetos se clasifican de acuerdo con el mismo conjunto de características para los grupos estudiados. A continuación, seguimos el algoritmo dado en casos anteriores.

Analicemos un caso con una jerarquía de características individual y grupal. Se comienza clasificando por separado los valores individuales del sujeto y los valores promedio grupales según el mismo conjunto de características que se obtuvieron, excluyendo al sujeto que no participa en la jerarquía promedio grupal, ya que su jerarquía individual será comparado con él. La correlación de rangos nos permite evaluar el grado de coherencia de la jerarquía de rasgos individual y grupal.

Consideremos cómo se determina la importancia del coeficiente de correlación en los casos enumerados anteriormente. En el caso de dos características, vendrá determinado por el tamaño de la muestra. En el caso de dos jerarquías de características individuales, la importancia depende del número de características incluidas en la jerarquía. En los dos últimos casos, la significancia está determinada por el número de características estudiadas y no por el número de grupos. Por tanto, la importancia de rs en todos los casos está determinada por el número de valores clasificados n.

Al verificar la significancia estadística de rs, se utilizan tablas de valores críticos del coeficiente de correlación de rango, compiladas para diferentes números de valores clasificados y diferentes niveles de significancia. Si el valor absoluto de rs alcanza o excede un valor crítico, entonces la correlación es confiable.

Al considerar la primera opción (un caso con dos signos medidos en el mismo grupo de sujetos), son posibles las siguientes hipótesis.

H0: La correlación entre las variables xey no es diferente de cero.

H1: La correlación entre las variables xey es significativamente diferente de cero.

Si trabajamos con cualquiera de los tres casos restantes, entonces es necesario plantear otro par de hipótesis:

H0: La correlación entre las jerarquías xey no es diferente de cero.

H1: La correlación entre las jerarquías xey es significativamente diferente de cero.

La secuencia de acciones al calcular el coeficiente de correlación de rango de Spearman rs es la siguiente.

  • - Determinar qué dos características o dos jerarquías de características participarán en la comparación como variables x e y.
  • - Ordenar los valores de la variable x, asignando el rango 1 al valor más pequeño, de acuerdo con las reglas de ranking. Coloque los rangos en la primera columna de la tabla en orden de sujetos de prueba o características.
  • - Ordenar los valores de la variable y. Coloque los rangos en la segunda columna de la tabla en orden de sujetos de prueba o características.
  • - Calcular las diferencias d entre los rangos xey para cada fila de la tabla. Coloque los resultados en la siguiente columna de la tabla.
  • - Calcular las diferencias al cuadrado (d2). Coloque los valores resultantes en la cuarta columna de la tabla.
  • - ¿Calcular la suma de diferencias al cuadrado? d2.
  • - Si se producen rangos idénticos, calcular las correcciones:

donde tx es el volumen de cada grupo de rangos idénticos en la muestra x;

ty es el volumen de cada grupo de rangos idénticos en la muestra y.

Calcule el coeficiente de correlación de rangos dependiendo de la presencia o ausencia de rangos idénticos. Si no hay rangos idénticos, calcule el coeficiente de correlación de rangos rs usando la fórmula:

Si hay rangos idénticos, calcule el coeficiente de correlación de rangos rs usando la fórmula:

donde?d2 es la suma de las diferencias al cuadrado entre rangos;

Tx y Ty: correcciones para rangos iguales;

n es el número de sujetos o características que participan en el ranking.

Determine los valores críticos de rs de la Tabla 3 del Apéndice para un número determinado de sujetos n. Se observará una diferencia significativa desde cero del coeficiente de correlación siempre que rs no sea menor que el valor crítico.



¿Te gustó el artículo? ¡Compartir con tus amigos!