Una correlación positiva lo demuestra. ¿Qué significa el concepto de correlación en palabras simples?

¿Qué es la correlación? El significado de la palabra "Correlación" en diccionarios y enciclopedias populares, ejemplos del uso del término en la vida cotidiana.

Correlación canónica

Una generalización de la correlación por pares utilizada para determinar la relación entre dos grupos de rasgos. Kanonich. El análisis, es decir, el método para encontrar K.k., se basa en la construcción de combinaciones lineales de características de uno y otro grupo que el coeficiente de correlación por pares habitual entre estas combinaciones alcanza su mayor valor. Este coeficiente máximo se llama primer canónico. coeficiente de correlación, y se denominan las combinaciones lineales correspondientes de dos grupos de características. el primer canónico cantidades. Véase Kendall M.J., Stewart A. Análisis estático multivariado y series de tiempo. M., 1976; Vold G. Modelos de ruta con variables latentes // Matemáticas en sociología: modelado y procesamiento de información M., 1977; Bolch B., Huan K.J. Métodos estadísticos multivariados para economía. M., 1979; Dubrovsky S.A. Análisis estadístico multivariado aplicado 1982; Lipovetsky S.S. Algunos modelos del análisis de Gunner como extremos de formas cuadráticas y bilineales//Aplicación integral de métodos matemáticos en la investigación sociológica. M., 1983; Van den Wollenberg A.L. Redundancia: una alternativa para el análisis de correlación canónica//Psychometrica. 1977. vol. 42, núm. 2. CC Lipovetsky, L.G. Badalyan.

Fecha de publicación: 03/09/2017 13:01

El término “correlación” se utiliza activamente en humanidades y medicina; aparece a menudo en los medios. Las correlaciones juegan un papel clave en la psicología. En particular, el cálculo de correlaciones es una etapa importante en la implementación de la investigación empírica al escribir tesis sobre psicología.

Los materiales sobre correlaciones en Internet son demasiado científicos. Es difícil para un no especialista entender las fórmulas. Al mismo tiempo, comprender el significado de las correlaciones es necesario para un especialista en marketing, un sociólogo, un médico, un psicólogo, cualquiera que realice investigaciones sobre personas.

En este artículo, explicaremos en un lenguaje sencillo la esencia de la correlación, los tipos de correlaciones, los métodos de cálculo, las características del uso de la correlación en la investigación psicológica, así como al escribir disertaciones en psicología.

Contenido

¿Qué es la correlación?

La correlación es conexión. Pero no cualquiera. ¿Cuál es su peculiaridad? Veamos un ejemplo.

Imagina que estás conduciendo un coche. Presionas el pedal del acelerador y el auto va más rápido. Bajas el acelerador y el coche frena. Incluso una persona que no esté familiarizada con la estructura de un automóvil dirá: “Existe una conexión directa entre el pedal del acelerador y la velocidad del automóvil: cuanto más fuerte se pisa el pedal, mayor es la velocidad”.

Ésta es una relación funcional: la velocidad es una función directa del pedal del acelerador. El especialista explicará que el pedal controla el suministro de combustible a los cilindros, donde se quema la mezcla, lo que conlleva un aumento de potencia al eje, etc. Esta conexión es rígida, determinista y no permite excepciones (siempre que la máquina funcione correctamente).

Ahora imagina que eres el director de una empresa cuyos empleados venden productos. Decide aumentar las ventas aumentando los salarios de los empleados. Aumentas tu salario en un 10% y las ventas promedio de la empresa aumentan. Después de un tiempo, lo aumentas otro 10% y nuevamente hay crecimiento. Luego otro 5% y nuevamente hay un efecto. La conclusión se sugiere por sí sola: existe una relación directa entre las ventas de la empresa y los salarios de los empleados: cuanto más altos son los salarios, mayores son las ventas de la organización. ¿Es esta la misma conexión que existe entre el pedal del acelerador y la velocidad del coche? ¿Cuál es la diferencia clave?

Así es, la relación entre salario y ventas no es estricta. Esto significa que algunas de las ventas de los empleados podrían incluso disminuir, a pesar del aumento salarial. Algunas permanecerán sin cambios. Pero, en promedio, las ventas de la empresa han aumentado y decimos que existe una conexión entre las ventas y los salarios de los empleados, y es correlacional.

La conexión funcional (acelerador - velocidad) se basa en una ley física. La base de la relación de correlación (ventas - salario) es la simple coherencia de los cambios en dos indicadores. No existe ninguna ley (en el sentido físico de la palabra) detrás de la correlación. Sólo existe un patrón probabilístico (estocástico).

Expresión numérica de la dependencia de la correlación.

Entonces, la relación de correlación refleja la dependencia entre fenómenos. Si estos fenómenos pueden medirse, entonces reciben una expresión numérica.

Por ejemplo, se está estudiando el papel de la lectura en la vida de las personas. Los investigadores tomaron un grupo de 40 personas y midieron dos indicadores para cada sujeto: 1) cuánto tiempo lee por semana; 2) en qué medida se considera próspero (en una escala del 1 al 10). Los científicos ingresaron estos datos en dos columnas y utilizaron un programa estadístico para calcular la correlación entre lectura y bienestar. Digamos que obtuvieron el siguiente resultado -0,76. ¿Pero qué significa este número? ¿Cómo interpretarlo? Vamos a resolverlo.

El número resultante se llama coeficiente de correlación. Para interpretarlo correctamente es importante considerar lo siguiente:

El signo “+” o “-” refleja la dirección de la dependencia.
El valor del coeficiente refleja la fuerza de la dependencia.

Directo y reverso

El signo más delante del coeficiente indica que la relación entre fenómenos o indicadores es directa. Es decir, cuanto mayor es un indicador, mayor es el otro. Un salario más alto significa mayores ventas. Esta correlación se llama directa o positiva.

Si el coeficiente tiene un signo menos, significa que la correlación es inversa o negativa. En este caso, cuanto mayor es un indicador, menor es el otro. En el ejemplo de lectura y bienestar, encontramos -0,76, lo que significa que cuanto más leen las personas, menor es su nivel de bienestar.

Fuerte y débil

Una correlación en términos numéricos es un número en el rango de -1 a +1. Denotado por la letra "r". Cuanto mayor sea el número (ignorando el signo), más fuerte será la correlación.

Cuanto menor sea el valor numérico del coeficiente, menor será la relación entre fenómenos e indicadores.

La fuerza de dependencia máxima posible es 1 o -1. ¿Cómo entender y presentar esto?

Veamos un ejemplo. Tomaron a 10 estudiantes y midieron su nivel de inteligencia (CI) y rendimiento académico durante el semestre. Dispuso estos datos en forma de dos columnas.

Sujeto	coeficiente intelectual	Rendimiento académico (puntos)

Mire atentamente los datos de la tabla. De 1 a 10 aumenta el nivel de coeficiente intelectual del sujeto de prueba. Pero el nivel de logros también está aumentando. De dos estudiantes cualesquiera, el que tenga mayor coeficiente intelectual obtendrá mejores resultados. Y no habrá excepciones a esta regla.

A continuación se muestra un ejemplo de un cambio completo y 100% consistente en dos indicadores de un grupo. Y este es un ejemplo de la mayor relación positiva posible. Es decir, la correlación entre inteligencia y rendimiento académico es igual a 1.

Veamos otro ejemplo. A los mismos 10 estudiantes se les evaluó mediante una encuesta en qué medida se sienten exitosos en la comunicación con el sexo opuesto (en una escala de 1 a 10).

Sujeto	coeficiente intelectual	Éxito en la comunicación con el sexo opuesto (puntos)

Miremos detenidamente los datos de la tabla. De 1 a 10 aumenta el nivel de coeficiente intelectual del sujeto de prueba. Al mismo tiempo, en la última columna el nivel de éxito en la comunicación con el sexo opuesto disminuye constantemente. De dos estudiantes cualesquiera, el que tenga el coeficiente intelectual más bajo tendrá más éxito en comunicarse con el sexo opuesto. Y no habrá excepciones a esta regla.

Este es un ejemplo de total coherencia en los cambios de dos indicadores de un grupo: la máxima relación negativa posible. La correlación entre el coeficiente intelectual y el éxito en la comunicación con el sexo opuesto es -1.

¿Cómo podemos entender el significado de una correlación igual a cero (0)? Esto significa que no hay conexión entre los indicadores. Volvamos una vez más a nuestros estudiantes y consideremos otro indicador medido por ellos: la longitud de su salto de pie.

Sujeto	coeficiente intelectual	Longitud del salto de pie (m)

No se observa coherencia entre la variación de persona a persona en el coeficiente intelectual y la longitud del salto. Esto indica la ausencia de correlación. El coeficiente de correlación entre el coeficiente intelectual y la longitud del salto de pie entre los estudiantes es 0.

Hemos analizado casos extremos. En mediciones reales, los coeficientes rara vez son exactamente iguales a 1 o 0. Se adopta la siguiente escala:

si el coeficiente es superior a 0,70, la relación entre los indicadores es fuerte;
de 0,30 a 0,70 - conexión moderada,
menos de 0,30: la relación es débil.

Si evaluamos la correlación entre lectura y bienestar que obtuvimos anteriormente en esta escala, resulta que esta relación es fuerte y negativa -0,76. Es decir, existe una fuerte relación negativa entre ser culto y bienestar. Lo que confirma una vez más la sabiduría bíblica sobre la relación entre la sabiduría y el dolor.

La gradación dada proporciona estimaciones muy aproximadas y rara vez se utiliza en investigaciones de esta forma.

Se utilizan con mayor frecuencia gradaciones de coeficientes según niveles de significancia. En este caso, el coeficiente realmente obtenido puede ser significativo o no. Esto se puede determinar comparando su valor con el valor crítico del coeficiente de correlación tomado de una tabla especial. Además, estos valores críticos dependen del tamaño de la muestra (cuanto mayor sea el volumen, menor será el valor crítico).

Análisis de correlación en psicología.

El método de correlación es uno de los principales en la investigación psicológica. Y esto no es casualidad, porque la psicología aspira a ser una ciencia exacta. ¿Está funcionando?

¿Cuáles son las peculiaridades de las leyes en las ciencias exactas? Por ejemplo, la ley de la gravedad en física actúa sin excepción: cuanto mayor es la masa de un cuerpo, más fuerte atrae a otros cuerpos. Esta ley física refleja la relación entre la masa corporal y la gravedad.

En psicología la situación es diferente. Por ejemplo, los psicólogos publican datos sobre la conexión entre las relaciones cálidas con los padres en la infancia y el nivel de creatividad en la edad adulta. ¿Significa esto que alguno de los sujetos que tuvieron una relación muy cálida con sus padres en la infancia tendrá capacidades creativas muy altas? La respuesta es clara: no. No hay ley como la física. No existe ningún mecanismo para la influencia de la experiencia infantil en la creatividad adulta. ¡Estas son nuestras fantasías! Hay coherencia de datos (relaciones - creatividad), pero no hay ninguna ley detrás. Pero sólo hay una correlación. Los psicólogos a menudo llaman a las relaciones identificadas patrones psicológicos, enfatizando su naturaleza probabilística, no rigidez.

El ejemplo del estudio de un estudiante de la sección anterior ilustra bien el uso de correlaciones en psicología:

Análisis de la relación entre indicadores psicológicos. En nuestro ejemplo, el coeficiente intelectual y el éxito en la comunicación con el sexo opuesto son parámetros psicológicos. Identificar la correlación entre ellos amplía la comprensión de la organización mental de una persona, las relaciones entre los distintos aspectos de su personalidad, en este caso, entre el intelecto y la esfera de la comunicación.
El análisis de la relación entre el coeficiente intelectual y el rendimiento académico y el salto es un ejemplo de la conexión entre un parámetro psicológico y otros no psicológicos. Los resultados obtenidos revelan las características de la influencia de la inteligencia en las actividades educativas y deportivas.

Así es como se vería un resumen del estudio estudiantil elaborado:

Se reveló una relación positiva significativa entre la inteligencia de los estudiantes y su rendimiento académico.
Existe una relación significativa negativa entre el coeficiente intelectual y el éxito en la comunicación con el sexo opuesto.
No hubo conexión entre el coeficiente intelectual de los estudiantes y la capacidad de saltar.

Así, el nivel de inteligencia de los estudiantes actúa como un factor positivo en su rendimiento académico, al mismo tiempo que afecta negativamente las relaciones con el sexo opuesto y no tiene un impacto significativo en el éxito deportivo, en particular, la capacidad de saltar.

Como vemos, la inteligencia ayuda a los estudiantes a aprender, pero les impide entablar relaciones con el sexo opuesto. Sin embargo, esto no afecta su éxito deportivo.

La ambigua influencia de la inteligencia en la personalidad y la actividad de los estudiantes refleja la complejidad de este fenómeno en la estructura de las características personales y la importancia de continuar la investigación en esta dirección. En particular, parece importante analizar la relación entre la inteligencia y las características y actividades psicológicas de los estudiantes, teniendo en cuenta su género.

Coeficientes de Pearson y Spearman

Consideremos dos métodos de cálculo.

El coeficiente de Pearson es un método especial para calcular la relación entre indicadores y la severidad de los valores numéricos en un grupo. Muy simple, se reduce a lo siguiente:

Se toman los valores de dos parámetros en un grupo de sujetos (por ejemplo, agresión y perfeccionismo).
Se encuentran los valores promedio de cada parámetro del grupo.
Se encuentran las diferencias entre los parámetros de cada sujeto y el valor promedio.
Estas diferencias se sustituyen en una forma especial para calcular el coeficiente de Pearson.

El coeficiente de correlación de rangos de Spearman se calcula de manera similar:

Se toman los valores de dos indicadores del grupo de asignaturas.
Se encuentran los rangos de cada factor en el grupo, es decir, el lugar en la lista en orden ascendente.
Las diferencias de rango se encuentran, se elevan al cuadrado y se suman.
A continuación, las diferencias de rango se sustituyen en una forma especial para calcular el coeficiente de Spearman.

En el caso de Pearson, el cálculo se realizó utilizando el valor medio. En consecuencia, los valores atípicos aleatorios en los datos (diferencias significativas con respecto al promedio), por ejemplo debido a errores de procesamiento o respuestas poco confiables, pueden distorsionar significativamente el resultado.

En el caso de Spearman, los valores absolutos de los datos no influyen, ya que sólo se tienen en cuenta sus posiciones relativas entre sí (rangos). Es decir, los datos atípicos u otras imprecisiones no tendrán un impacto grave en el resultado final.

Si los resultados de la prueba son correctos, entonces las diferencias entre los coeficientes de Pearson y Spearman son insignificantes, mientras que el coeficiente de Pearson muestra un valor más preciso de la relación entre los datos.

Cómo calcular el coeficiente de correlación

Los coeficientes de Pearson y Spearman se pueden calcular manualmente. Esto puede ser necesario para un estudio en profundidad de los métodos estadísticos.

Sin embargo, en la mayoría de los casos, al resolver problemas aplicados, incluso en psicología, es posible realizar cálculos utilizando programas especiales.

Cálculo utilizando hojas de cálculo de Microsoft Excel.

Volvamos nuevamente al ejemplo con los estudiantes y consideremos datos sobre su nivel de inteligencia y la longitud de su salto de pie. Ingresemos estos datos (dos columnas) en una tabla de Excel.

Moviendo el cursor a una celda vacía, haga clic en la opción "Insertar función" y seleccione "CORRECCIÓN" en la sección "Estadística".

El formato de esta función implica la selección de dos matrices de datos: CORREL (matriz 1; matriz"). Resaltamos la columna con IQ y la longitud del salto en consecuencia.

Las hojas de cálculo de Excel solo implementan una fórmula para calcular el coeficiente de Pearson.

Cálculo mediante el programa STATISTICA.

Ingresamos datos sobre inteligencia y saltamos de longitud al campo de datos inicial. A continuación, seleccione la opción “Pruebas no paramétricas”, “Spearman”. Seleccionamos los parámetros para el cálculo y obtenemos el siguiente resultado.

Como puede ver, el cálculo arrojó un resultado de 0,024, que difiere del resultado de Pearson: 0,038, obtenido anteriormente usando Excel. Sin embargo, las diferencias son menores.

Uso del análisis de correlación en disertaciones de psicología (ejemplo)

La mayoría de los temas de los trabajos finales de calificación en psicología (diplomados, trabajos de curso, maestría) implican la realización de investigaciones de correlación (el resto está relacionado con la identificación de diferencias en indicadores psicológicos en diferentes grupos).

El término "correlación" rara vez se escucha en los nombres de los temas; se esconde detrás de las siguientes formulaciones:

“La relación entre el sentimiento subjetivo de soledad y la autorrealización en mujeres en edad madura”;
“Características de la influencia de la resiliencia de los directivos en el éxito de su interacción con los clientes en situaciones de conflicto”;
"Factores personales de resistencia al estrés de los empleados del Ministerio de Situaciones de Emergencia".

Por tanto, las palabras “relación”, “influencia” y “factores” son señales seguras de que el método de análisis de datos en un estudio empírico debe ser el análisis de correlación.

Consideremos brevemente las etapas de su implementación al escribir una tesis en psicología sobre el tema: "La relación entre ansiedad personal y agresividad en adolescentes".

1. Para el cálculo se necesitan datos brutos, que normalmente son los resultados de las pruebas de los sujetos. Se ingresan en una tabla dinámica y se colocan en la aplicación. Esta tabla está organizada de la siguiente manera:

cada línea contiene datos para un tema;
cada columna contiene indicadores en una escala para todas las materias.

Asunto No.	Ansiedad de personalidad	Agresividad

2. Es necesario decidir cuál de los dos tipos de coeficientes se utilizará: Pearson o Spearman. Le recordamos que Pearson da un resultado más preciso, pero es sensible a los valores atípicos en los datos. Los coeficientes de Spearman se pueden usar con cualquier dato (excepto la escala nominativa), razón por la cual se usan con mayor frecuencia en las carreras de psicología.

3. Ingrese la tabla de datos sin procesar en el programa estadístico.

4. Calcula el valor.

5. El siguiente paso es determinar si la relación es significativa. El programa estadístico resaltó los resultados en rojo, lo que significa que la correlación es estadísticamente significativa en el nivel de significancia de 0,05 (indicado anteriormente).

Sin embargo, es útil saber cómo determinar la importancia manualmente. Para hacer esto, necesitará una tabla de valores críticos de Spearman.

Tabla de valores críticos de los coeficientes de Spearman.

	Nivel de significancia estadística
Número de sujetos	p=0,05	p=0,01	p=0,001
	0,88	0,96	0,99
	0,81	0,92	0,97
	0,75	0,88	0,95
	0,71	0,83	0,93
	0,67
	0,63	0,77	0,87
		0,74	0,85
	0,58	0,71	0,82
	0,55	0,68
	0,53	0,66	0,78
	0,51	0,64	0,76

Nos interesa un nivel de significancia de 0,05 y nuestro tamaño de muestra es de 10 personas. En la intersección de estos datos encontramos el valor crítico de Spearman: Rcr=0,63.

La regla es: si el valor empírico de Spearman resultante es mayor o igual que el valor crítico, entonces es estadísticamente significativo. En nuestro caso: Rampa (0,66) > Rcr (0,63), por lo tanto, la relación entre agresividad y ansiedad en el grupo de adolescentes es estadísticamente significativa.

5. En el texto de la tesis es necesario insertar datos en una tabla en formato Word, y no una tabla de un programa estadístico. Debajo de la tabla describimos el resultado obtenido y lo interpretamos.

tabla 1

Coeficientes de Spearman de agresión y ansiedad en un grupo de adolescentes.

	Agresividad
Ansiedad de personalidad	0,665*

* - estadísticamente significativo (p≤ 0,05)

El análisis de los datos presentados en la Tabla 1 muestra que existe una relación positiva estadísticamente significativa entre la agresión y la ansiedad en los adolescentes. Esto significa que cuanto mayor es la ansiedad personal de los adolescentes, mayor es su nivel de agresividad. Este resultado sugiere que la agresión para los adolescentes es una de las formas de aliviar la ansiedad. Al experimentar dudas y ansiedad debido a amenazas a la autoestima, que es especialmente sensible en la adolescencia, un adolescente a menudo utiliza un comportamiento agresivo, reduciendo la ansiedad de una manera tan improductiva.

6. ¿Se puede hablar de influencia a la hora de interpretar conexiones? ¿Podemos decir que la ansiedad afecta la agresividad? Estrictamente hablando, no. Mostramos anteriormente que la correlación entre fenómenos es de naturaleza probabilística y refleja solo la consistencia de los cambios en las características del grupo. Al mismo tiempo, no podemos decir que esta coherencia sea causada por el hecho de que uno de los fenómenos es la causa del otro y lo influye. Es decir, la presencia de una correlación entre parámetros psicológicos no da motivo para hablar de la existencia de una relación causa-efecto entre ellos. Sin embargo, la práctica muestra que el término "influencia" se utiliza a menudo al analizar los resultados del análisis de correlación.

06.06.2018 12 879 0 Ígor

Psicología y Sociedad

Todo en el mundo está interconectado. Cada persona, a nivel de intuición, intenta encontrar relaciones entre los fenómenos para poder influir en ellos y controlarlos. El concepto que refleja esta relación se llama correlación. ¿Qué significa en palabras simples?

Contenido:

Concepto de correlación

Correlación (del latín “correlatio” - ratio, relación)– un término matemático que significa una medida de dependencia probabilística estadística entre cantidades aleatorias (variables).

Ejemplo: Tomemos dos tipos de relaciones:

Primero- un bolígrafo en la mano de una persona. En qué dirección se mueve la mano, en esa dirección va la pluma. Si la mano está en reposo, la pluma no escribirá. Si una persona lo presiona un poco más fuerte, la marca en el papel será más rica. Este tipo de relación refleja una dependencia estricta y no es correlacional. Esta relación es funcional.
Segundo tipo– la relación entre el nivel de educación de una persona y la lectura de literatura. No se sabe de antemano qué personas leen más: las que tienen o no estudios superiores. Esta conexión es aleatoria o estocástica; la estudia la ciencia estadística, que se ocupa exclusivamente de fenómenos de masas. Si un cálculo estadístico permite demostrar la correlación entre el nivel de educación y la lectura de literatura, esto permitirá hacer pronósticos y predecir la ocurrencia probabilística de eventos. En este ejemplo, con un alto grado de probabilidad, se puede argumentar que las personas con mayor educación, las que tienen más educación, leen más libros. Pero como la conexión entre estos parámetros no es funcional, podemos estar equivocados. Siempre se puede calcular la probabilidad de cometer dicho error, que será claramente pequeña y se denomina nivel de significación estadística (p).

Ejemplos de relaciones entre fenómenos naturales son: la cadena alimentaria en la naturaleza, el cuerpo humano, que consta de sistemas de órganos que están interconectados y funcionan como un todo.

Todos los días encontramos correlaciones en la vida cotidiana: entre el clima y el buen humor, la correcta formulación de metas y su consecución, una actitud positiva y suerte, un sentimiento de felicidad y bienestar financiero. Pero buscamos conexiones, apoyándonos no en cálculos matemáticos, sino en mitos, intuiciones, supersticiones y especulaciones ociosas. Estos fenómenos son muy difíciles de traducir al lenguaje matemático, expresar en números y medir. Otra cosa es cuando analizamos fenómenos que pueden calcularse y presentarse en forma de números. En este caso, podemos definir la correlación utilizando el coeficiente de correlación (r), que refleja la fuerza, el grado, la cercanía y la dirección de la correlación entre variables aleatorias.

Fuerte correlación entre variables aleatorias.- evidencia de la presencia de alguna conexión estadística específicamente entre estos fenómenos, pero esta conexión no puede transferirse al mismo fenómeno, sino para una situación diferente. A menudo, los investigadores, habiendo obtenido en sus cálculos una correlación significativa entre dos variables, basándose en la simplicidad del análisis de correlación, hacen suposiciones intuitivas falsas sobre la existencia de relaciones de causa y efecto entre características, olvidando que el coeficiente de correlación es de naturaleza probabilística. .

Ejemplo: el número de personas heridas en condiciones de hielo y el número de accidentes de tráfico entre vehículos de motor. Estas cantidades se correlacionarán entre sí, aunque no están interconectadas en absoluto, sino que sólo tienen una conexión con la causa común de estos eventos aleatorios: el hielo negro. Si el análisis no revela una correlación entre los fenómenos, esto todavía no es evidencia de la ausencia de dependencia entre ellos, que puede ser compleja, no lineal y no revelada por los cálculos de correlación.

El primero en introducir el concepto de correlación en el uso científico fue el francés. paleontólogo Georges Cuvier. En el siglo XVIII, dedujo la ley de correlación de partes y órganos de organismos vivos, gracias a la cual fue posible restaurar la apariencia de toda la criatura fósil, animal, a partir de las partes del cuerpo encontradas (restos). En estadística, el término correlación fue utilizado por primera vez en 1886 por un científico inglés. francisco galton. Pero no pudo derivar la fórmula exacta para calcular el coeficiente de correlación, pero su alumno sí lo hizo: famoso matemático y biólogo Karl Pearson.

Tipos de correlación

Por importancia– muy significativo, significativo e insignificante.

tipos	¿A qué es igual r?
Altamente significativa	r corresponde al nivel de significancia estadística p<=0,01
Significativo	r corresponde a p<=0,05
Insignificante	r no llega a p>0.1

Negativo(una disminución en el valor de una variable conduce a un aumento en el nivel de otra: cuantas más fobias tiene una persona, es menos probable que ocupe una posición de liderazgo) y positivo (si un aumento en una variable conduce a un aumento en el nivel de otro: cuanto más nervioso estés, más probabilidades tendrás de enfermarte). Si no existe conexión entre las variables, dicha correlación se denomina cero.

Lineal(cuando un valor aumenta o disminuye, el segundo también aumenta o disminuye) y no lineal (cuando cuando un valor cambia, la naturaleza del cambio en el segundo no se puede describir utilizando una relación lineal, entonces se aplican otras leyes matemáticas: polinómica, hiperbólica relaciones).

Por fuerza.

Impares

Dependiendo de a qué escala pertenezcan las variables en estudio se calculan distintos tipos de coeficientes de correlación:

El coeficiente de correlación de Pearson, el coeficiente de correlación lineal por pares o la correlación del momento del producto se calcula para variables con escalas de medición de intervalo y escala.
Coeficiente de correlación de rango de Spearman o Kendall: cuando al menos una de las cantidades tiene una escala ordinal o no está distribuida normalmente.
Coeficiente de correlación biserial puntual (coeficiente de correlación del signo de Fechner): si una de las dos cantidades es dicotómica.
Coeficiente de correlación de cuatro campos (coeficiente de correlación (concordancia) de rango múltiple, si dos variables son dicotómicas.

El coeficiente de Pearson se refiere a indicadores de correlación paramétricos, todos los demás son no paramétricos.

El valor del coeficiente de correlación varía de -1 a +1. Con una correlación positiva completa, r = +1, con una correlación negativa completa, r = -1.

Fórmula y cálculo

Ejemplos

Es necesario determinar la relación entre dos variables: el nivel de desarrollo intelectual (según las pruebas) y el número de retrasos por mes (según anotaciones en el diario educativo) entre los escolares.

Los datos iniciales se presentan en la tabla:

№	Datos de coeficiente intelectual (x)	Datos sobre el número de retrasos (y)










Suma	1122
Promedio	112,2

Para dar una correcta interpretación del indicador obtenido, es necesario analizar el signo del coeficiente de correlación (+ o -) y su valor absoluto (módulo).

De acuerdo con la tabla de clasificación del coeficiente de correlación por fuerza, concluimos que rxy = -0,827 es una correlación negativa fuerte. Por tanto, el número de escolares que llegan tarde depende muy fuertemente de su nivel de desarrollo intelectual. Se puede decir que los estudiantes con un nivel de coeficiente intelectual alto llegan tarde a clases con menos frecuencia que los estudiantes con un nivel de coeficiente intelectual bajo.

El coeficiente de correlación puede ser utilizado tanto por científicos para confirmar o refutar el supuesto de la dependencia de dos cantidades o fenómenos y medir su fuerza e importancia, como por estudiantes para realizar investigaciones empíricas y estadísticas en diversos temas. Hay que recordar que este indicador no es una herramienta ideal; se calcula únicamente para medir la fuerza de una relación lineal y siempre será un valor probabilístico que tiene un cierto error.

El análisis de correlación se utiliza en las siguientes áreas:

ciencia económica;
astrofísica;
ciencias sociales (sociología, psicología, pedagogía);
agroquímica;
metalurgia;
industria (para control de calidad);
hidrobiología;
biometría, etcétera.

Razones de la popularidad del método de análisis de correlación:

La relativa simplicidad de calcular los coeficientes de correlación no requiere una educación matemática especial.
Le permite calcular las relaciones entre variables aleatorias masivas, que son objeto de análisis en la ciencia estadística. En este sentido, este método se ha generalizado en el campo de la investigación estadística.

Espero que ahora puedan distinguir una relación funcional de una relación correlacional y sepan que cuando escuchan en la televisión o leen en la prensa acerca de la correlación, significa una interdependencia positiva y bastante significativa entre dos fenómenos.

Los conceptos científicos siempre son populares. El verbo “correlacionar” es ampliamente utilizado por periodistas y políticos, a veces de manera inapropiada. Normalmente, el término "correlación" se refiere a cualquier relación.

Hace tiempo que la gente se da cuenta de que todos los fenómenos que ocurren en nuestro planeta se influyen mutuamente en cierta medida. Las conexiones entre ellos no siempre pueden detectarse fácilmente, pero, sin embargo, existen. Cuando se habla de interdependencia de eventos, se suele utilizar la palabra "correlación". Lo utilizan con mayor frecuencia economistas y analistas.

Averigüemos qué significa realmente este concepto.

Correlación: definición

Quizás el primero en el mundo científico en hablar de correlación fue el paleontólogo Georges Cuvier. A finales del siglo XVIII y XIX, hizo varios descubrimientos en el campo de la anatomía comparada. Como resultado de estos descubrimientos, Cuvier formuló la ley de la relación de las partes, según la cual los cambios en la estructura de uno de los órganos de un animal conducen a cambios en la estructura de otros órganos. Basándose en este conocimiento, Cuvier aprendió a restaurar la apariencia de animales fósiles a partir de fragmentos supervivientes individuales.

En cuanto a la estadística, el concepto de correlación en esta ciencia se estableció más tarde, a finales del siglo XIX, gracias al biólogo inglés Francis Galton.

Correlación– esto no es sólo una conexión (relación), sino más bien una relación o interdependencia (correlación).

La fórmula para obtener el coeficiente de correlación fue deducida por el alumno, matemático y biólogo de Galton, K. Pearson.

Coeficiente de correlación

La correlación es una conexión estadística entre cualquier cantidad independiente entre sí. Se supone que tan pronto como cambia el valor de uno de los parámetros, también cambia el valor del otro. Si los cambios afectan únicamente a características estadísticas individuales, una relación de este tipo se considera estadística. En este caso no se trata de correlación.

El coeficiente de correlación se utiliza para expresar el grado de interdependencia. El rango de valores de los coeficientes es de -1 a +1.

Si la correlación es absoluta y positiva (+1), cuando el precio de un valor aumenta, el precio del otro aumentará en la misma medida.
Cuando hablamos de correlación negativa absoluta, queremos decir que si el valor de un valor aumenta, el valor de un valor con correlación negativa cae.
Si el coeficiente de correlación es cero, entonces no existe interdependencia entre los movimientos de valores: son aleatorios.

Cuanto mayor sea el valor del coeficiente, mayor será la interdependencia. Si el valor del coeficiente es mayor que 0,5, entonces la relación se expresa claramente.

Es necesario aclarar que la correlación absoluta de valores sólo existe en un mundo ideal. En realidad, las acciones sólo están algo correlacionadas.

Correlación por pares

Este término se utiliza para indicar la relación entre dos cantidades específicas. Se sabe que los gastos en publicidad en los Estados Unidos influyen significativamente en el volumen del PIB del país. El coeficiente de correlación entre estos valores basado en observaciones que duraron 20 años es 0,9699.

Un ejemplo más "real" es la relación entre el tráfico a la página de una tienda en línea y su volumen de ventas.

Y, por supuesto, casi nadie negaría la existencia de una relación entre la temperatura del aire y las ventas de cerveza o helado.

La correlación es la interdependencia de dos cantidades; El coeficiente de correlación es un indicador objetivo que determina el grado de esta interdependencia. El coeficiente de correlación puede ser positivo o negativo. En cuanto a los valores, rara vez están completamente correlacionados.

Una correlación entre dos cantidades es una relación estadística en la que un cambio en una de las cantidades conduce a un cambio sistemático en la otra. Una medida cuantitativa de correlación es el coeficiente de correlación lineal (también llamado coeficiente de correlación de Pearson), calculado mediante la fórmula:

r xy – coeficiente de correlación de los valores de las cantidades xey;
d x – desviación de un cierto valor de la serie x del valor medio de esta serie;
d y – desviación de un determinado valor de la serie y del valor medio de esta serie.

El rango de valores posibles para el coeficiente de correlación está entre +1 y -1. Son posibles las siguientes opciones:

+1 – relación directa entre cantidades;
|r xy| > 0,7 – dependencia pronunciada entre valores;
0.4 < |r xy| >0,7 – relación moderadamente pronunciada entre valores;
|r xy|< 0.4 – слабо выраженная зависимость между величинами;
-1 – relación inversa entre cantidades.

Es importante señalar que cuanto mayor sea la muestra de valores, menor será la magnitud del módulo del coeficiente de correlación, podemos hablar de la presencia de una relación entre xey. Lamentablemente, la fórmula contiene una trampa que, cuando se aplica a instrumentos financieros, puede suponer una broma cruel para el inversor. En el numerador, las desviaciones de cantidades pueden tener signos iguales o diferentes, por lo que el producto también puede ser tanto positivo como negativo. En el denominador las desviaciones están al cuadrado, lo que garantiza que el denominador es positivo. Por ahora, sólo prestaremos atención a esto y más adelante volveremos a lo que podría resultar de ello.

El propósito práctico de calcular la correlación entre instrumentos financieros es obtener datos fundamentales importantes necesarios para tomar decisiones comerciales. La reacción de los mercados ante la publicación de noticias económicas importantes se expresa en el hecho de que primero comienzan a moverse los precios de los principales activos (oro, petróleo, futuros sobre índices industriales) y, a veces, la rentabilidad. Como resultado, los tipos de cambio y los precios de las acciones cambian. Al rastrear la relación de los instrumentos individuales, así como las relaciones de causa y efecto entre los cambios de precios, puede revisar rápidamente sus planes comerciales y de inversión. Además, el análisis de correlación se utiliza en la gestión como parte obligatoria.

Puede visualizar la correlación de dos cantidades como un gráfico en coordenadas de amplitud-tiempo. Por ejemplo, con una correlación negativa obtenemos una imagen similar:

Conocer la correlación de activos reduce los riesgos de la cartera

Digamos, por ejemplo, que hay 2 activos. Para simplificar, imaginemos que sus precios dependen del tiempo según la ley de una sinusoide. Entonces, con una correlación de +1, obtendremos una superposición completa de ondas y abrir transacciones en ambos activos equivaldrá a duplicar posiciones en uno de ellos. Por el contrario, una correlación de -1 significa que las ganancias y pérdidas de los activos se anulan entre sí. Por supuesto, los activos bien elegidos generalmente no se mueven al mismo nivel, sino que tienden a aumentar con el tiempo. Además, con algunos activos el crecimiento en otros nos permite minimizar el riesgo total de la cartera:

Un proceso llamado reequilibrio de cartera le permite generar ingresos alternando la proporción de activos en su cartera. Esto se logra más fácilmente con una correlación negativa pronunciada. Supongamos que inicialmente la cartera contenía los activos A y B con una correlación inversa y una proporción de 1:1, por un importe total de 1 millón de rublos. En seis meses, el precio del activo A cayó un 20% y su valor de los 500 mil rublos originales pasó a 400 mil rublos. El activo B, por el contrario, aumentó un 20% y su valor ascendió a 600 mil rublos. El valor total de la cartera no ha cambiado y sigue siendo de 1 millón de rublos. Ahora transferimos el 50% del activo B (300 mil) a A y su valor ahora es 700 mil, y el activo B es 300 mil.

Durante los siguientes seis meses ocurre el proceso opuesto: los activos vuelven a su precio original. Ahora el activo A cuesta 840 mil en lugar de 700 mil, y el activo B cuesta 240 mil en lugar de 300 mil. El valor total de la cartera ascendió a 1 millón 80 mil rublos, es decir. su rentabilidad por reequilibrio es del 8% anual. Sin reequilibrio, el rendimiento de la cartera sería del 0%. Las situaciones reales son mucho más complicadas, porque... Las correlaciones de la mayoría de los instrumentos están entre +0,5 y -0,5. Si consideramos el gráfico riesgo-rendimiento para diferentes ratios de dos instrumentos con diferentes valores de correlación, obtenemos la siguiente imagen:

Como puede ver, cuanto menor sea el valor del coeficiente de correlación del instrumento, mayor será el posible rendimiento de la cartera para el mismo valor de riesgo, o menor será el riesgo para el mismo valor de rendimiento.

Correlación en Forex

Una estrategia común basada en la correlación de pares de divisas es que, en caso de una fuerte desviación del coeficiente de correlación del valor actual, se abren transacciones con el objetivo de restaurar este valor. Por ejemplo, si los pares EURUSD y GBPUSD se movieron en la misma dirección durante mucho tiempo, entonces, si divergen fuertemente, se puede esperar una convergencia, si la divergencia no es causada por factores de largo plazo (por ejemplo, un cambio en el tasa de descuento).

Además, la correlación de los pares de divisas se utiliza en una evaluación integral del mercado. Por ejemplo, en vísperas de la crisis hipotecaria de 2008-2009, cuando los dólares australiano y neozelandés, así como la libra esterlina, tenían un tipo de cambio clave elevado, se desarrolló mucho una estrategia comercial llamada carry trade. Consistía en el hecho de que, cuando los acontecimientos eran favorables para los mercados de valores, los pares de estas monedas con el yen, tradicionalmente caracterizado por un tipo de cambio muy bajo, crecían de forma especialmente activa, y también disminuían activamente durante los acontecimientos desfavorables.

A pesar de que ninguna correlación puede afectar absolutamente a todos los intervalos de tiempo y que los movimientos multidireccionales de las monedas son posibles, un movimiento unidireccional pronunciado, por regla general, indica la presencia de un "impulsor" fundamental común. Esto facilita la planificación de transacciones. En particular, no tiene sentido buscar retrocesos y trabajar intradía si todos los pares claramente correlacionados van en la misma dirección.

Puede ver la tabla de correlación en tiempo real para pares de divisas y algunos otros instrumentos en myfxbook.com/forex-market/correlation. En esta tabla se puede ver que los pares EURUSD y AUDCAD prácticamente no se correlacionan entre sí. Si abre operaciones en estos pares al mismo tiempo, no tiene que preocuparse por la suma de las pérdidas o la superposición de las ganancias de un par con las pérdidas de otro.

Este gráfico muestra cómo los dólares australiano y neozelandés, que están inversamente correlacionados con las monedas de refugio seguro, el yen y el franco suizo, subieron con fuerza durante el período de mayor diferencial en los tipos clave. Esta tendencia se revirtió después de que comenzó un período de recortes de tasas a medida que se profundizaba la crisis hipotecaria.

No hay efectos sin causa.

La correlación de precios de los activos es algo similar a las tendencias: cuanto más largo es el intervalo de tiempo para su cálculo, más lento cambia. Pero también hay algo que distingue la correlación de muchos otros métodos. Se puede calcular para pares de activos que no se negocian en ninguna bolsa (petróleo-gas, petróleo-oro), lo que permite complementar el arsenal del analista con información valiosa que le permite "leer el mercado entre gráficos".

Cualquier correlación de dos o más cantidades siempre tiene una relación de causa y efecto. Una de las cantidades es decisiva de la que dependen la otra (u otras). La correlación en el mercado de valores no es una excepción. Por ejemplo, en el par petróleo-gas, las cotizaciones del petróleo fueron decisivas durante mucho tiempo. En el siguiente gráfico se puede ver que la ampliación del diferencial entre petróleo y gas debido al fuerte crecimiento relativo del gas fue seguida por un retorno igualmente pronunciado al equilibrio relativo:

Al mismo tiempo, en otro par de activos, oro-petróleo, el factor determinante es el oro. Con una expansión significativa (un fuerte aumento o caída del petróleo con oro más estable), es el petróleo el que restablece el equilibrio perturbado:

Al monitorear este comportamiento de "seguir" los activos, puede abrir transacciones con el objetivo de restablecer el equilibrio. Por cierto, la correlación se basa a menudo en la vinculación de determinadas monedas con los activos de materias primas. Se denominan “monedas de materias primas”. Por ejemplo, el dólar canadiense y el rublo dependen en gran medida del petróleo. En ambos casos, la correlación es directa: cuanto más caro es el petróleo, mayor es el tipo de cambio de estas monedas frente al dólar estadounidense.

En el caso del rublo, la correlación de los gráficos es tan clara que puede utilizarse en una estrategia comercial. Miremos a principios de 2014. El petróleo se cotiza en torno a los 110 dólares por barril, después de lo cual sube ligeramente durante un tiempo. En este momento, el rublo, por el contrario, de 33 por dólar estadounidense disminuye brevemente a 36. En algún momento, la correlación se vuelve casi inversa, pero el equilibrio se restablece rápidamente y el rublo vuelve a cotizar a 33 por dólar, obedientemente. siguiente aceite. Un ejemplo aún más sorprendente lo vemos a finales de 2014, cuando se produjo un fuerte debilitamiento del rublo en un contexto de caída mucho más gradual del precio del petróleo. Y esta vez el equilibrio perturbado pronto se restableció gracias al fortalecimiento del rublo. Con el tiempo, la correlación puede sufrir fuertes cambios e incluso pasar de directa a inversa. Esto fue especialmente evidente en el caso de la correlación entre el Dow Jones Industrial Average y los índices RTS.

A finales de 2007, cuando empezaron a aparecer los primeros signos de la crisis hipotecaria en Estados Unidos, el índice DJ bajó, pero el índice RTS, gracias al crecimiento activo de los precios del petróleo, todavía se acercaba a un máximo histórico. Sin embargo, más tarde, el fuerte colapso de todos los índices bursátiles del mundo también afectó al petróleo. Esto llevó al hecho de que el índice RTS cayó casi el doble de rápido que el DJ. Además del petróleo, el ritmo de caída del índice RTS también se vio afectado por la salida general de capitales de los mercados emergentes.

Sin embargo, la crisis duró poco y ya a principios de 2009 fue sustituida por el crecimiento económico. Se observó una alta correlación entre DJ y RTS hasta abril de 2012, que estuvo marcado por el agotamiento de las posibilidades del modelo de desarrollo de materias primas de la economía rusa. A partir de este año, ni siquiera el petróleo caro garantizaba el crecimiento económico. Posteriormente, la recesión económica en Rusia no hizo más que empeorar en el contexto de la caída de los precios del petróleo, mientras que la economía estadounidense recibió un estímulo adicional para el crecimiento. La correlación entre y se volvió inversa.

La mera presencia de una correlación entre activos no significa que se pueda construir una estrategia comercial o de inversión sobre esta base. Digamos que estamos interesados en la correlación de las acciones de IBM durante los últimos 12 meses (consulte impactopia.com/correlation). Así, en cuarto lugar en términos de correlación se encuentra el Banco Santander (alrededor de 0,43). Lo más probable es que esto sea sólo una coincidencia aleatoria o un defecto sistémico en el método de cálculo de las correlaciones en sí.

Trampa matemática

Como mencioné anteriormente, la fórmula para calcular el coeficiente de correlación es muy sensible a los signos de desviaciones de los valores de las cantidades de sus valores promedio. Si estas desviaciones suelen tener los mismos signos, se obtiene un valor elevado del coeficiente de correlación. ¿Pero tendrá sentido este valor? La respuesta no es nada obvia. Veamos un ejemplo práctico. Supongamos que en las gráficas de dos cantidades existe simultáneamente:

Entonces los nuevos valores de estas cantidades estarán sistemáticamente a un lado de sus valores medios. Esto dará como resultado una alta correlación positiva. Lamentablemente esta información no será de ninguna utilidad, porque... Aparte de la presencia de una brecha, no hay nada en común entre los gráficos. Este es solo un claro ejemplo del hecho de que al calcular la correlación se permite utilizar series de valores exclusivamente estacionarias, es decir Serie en la que no hay componente de tendencia. Esto significa que el cálculo de correlaciones en el mundo de los activos financieros conduce inevitablemente a una sobreestimación de la importancia de factores que en realidad son de naturaleza aleatoria. Entiéndalo correctamente: es importante no buscar estos factores e introducir correcciones especiales para ellos, sino mostrar la esencia misma del fenómeno y no buscar el próximo Grial donde no existe.

Sin embargo, no todo es malo. Hay una manera de evitar la influencia de las tendencias calculando la correlación no de los precios en sí, sino de sus incrementos. Entonces el GEP mencionado anteriormente resultará ser un valor atípico estadístico que prácticamente no tiene ningún efecto sobre el resultado. Sólo queda esperar a que prevalezca este enfoque. No siempre es posible encontrar datos de correlación de activos actualizados. En tales casos, se pueden calcular utilizando Microsoft Excel. Para hacer esto, las comillas se escriben en forma de dos rangos de celdas, y luego se escribe una función de la siguiente forma en una de las celdas libres: =CORREL (matriz 1; matriz 2). La matriz podría verse así, por ejemplo: A1:A100. Para calcular la correlación basándose en los incrementos de precios, este programa es doblemente útil, porque basándose en los precios de cierre, primero hay que calcular los propios incrementos.

Resumen

La correlación entre los precios de los activos es una herramienta importante tanto para el análisis de datos como para la gestión de riesgos en las inversiones de cartera. Pero, como todos los enfoques estadísticos, no está exento de graves inconvenientes:

la presencia de una correlación pronunciada entre los datos del pasado no puede garantizarla en el futuro;
el modelo matemático utilizado tiene grandes errores durante los períodos de tendencia.

El uso del enfoque de correlación traerá el máximo beneficio además de otros métodos de análisis y gestión del dinero. En los comentarios, propongo discutir cómo se puede ganar dinero correlacionando activos específicos. Di mis ejemplos en el artículo, espero con ansias el tuyo para discutirlo.

¡Beneficio para todos!