COVARIANZA Y CORRELACIÓN.

 

COVARIANZA.

La covarianza es una medida de la dependencia lineal entre una variable aleatoria Y1 y otra variable aleatoria Y2. Este proceso de dependencia ocurrirá si, por ejemplo, Y2 aumenta o disminuye cuando Y1 cambia.

La covarianza se define como:


Es decir, la covarianza es el valor esperado del producto entre las desviaciones de las observaciones de cada variable aleatoria respecto a su media. Además, cuanto mayor sea el valor absoluto de ésta, mayor será la dependencia lineal entre las variables, valores positivos señalarán que Y1 se reduce cuando Y2 decrece y viceversa.

Finalmente, la covarianza se puede simplificar como se muestra a continuación:



CORRELACIÓN.

El problema de la covarianza es que su valor depende de la escala de medición, por eso surge el coeficiente de correlación que estandariza los resultados y así, resuelve el problema de escala, mientras conserva el mismo signo de la covarianza.

La correlación tiene como fórmula:

Donde ρ (rho) es el coeficiente de correlación, que en el numerador tiene la covarianza y en el denominador el producto de las desviaciones estándar de las variables aleatorias Y1 y Y2, respectivamente.

Este coeficiente puede ubicarse en el intervalo [-1,1] y gráficamente expresa lo siguiente:

  


 

 

Referencias.

 Mendenhall, W. & Scheaffer, R. & Wackerly, D. (2010). Estadística Matemática con Aplicaciones. Cencage Learning Editores, S.A.

 

 

 

 

 

 

 

Comentarios