4.2. Asociación entre dos variables cualitativas

Hemos definido una variable como "cualitativa" cuando está medida en una escala nominal, o de clasificación. Estas variables pueden ser a su vez dicotómicas, cuando sólo presentan dos categorías, o politómicas cuando presentan un mayor número. También consideraremos como cualitativas aquellas variables que, en un principio, presentan un mayor nivel de medida (intervalos o razón) pero, a posteriori, han sido categorizadas. Cuando se dispone de los datos de dos variables cualitativas para todos los sujetos de una muestra se puede elaborar la denominada Tabla de Contingencia.

El estadístico X2 se define en función de las frecuencias empíricas (ne) y las frecuencias teóricas (nt). Las frecuencias teóricas se calculan asumiendo que ambas variables son independientes o no relacionadas. Las frecuencias teóricas, nt, serán el producto del total de su fila por el total de su columna dividido por la frecuencia total, n.

Uno de los inconvenientes del estadístico X2 es su difícil interpretación puesto que desconocemos su límite superior. Sólo sabemos que tiene un valor cero, cuando no hay relación entre las dos variables, es decir, cuando las frecuencias empíricas y teóricas son iguales en todos los casos. Por ello, las variables son independientes.

Para resolver este problema se ha definido el índice o Coeficiente de Contingencia, C. Este índice esta comprendido entre 0 y 1.

Características del Coeficiente C:

  • El coeficiente C puede asumir valores mayores o iguales a cero y menores que 1. El valor 0 lo alcanza cuando X2 = 0 e indica que las dos variables no tienen relación entre ellas y, además, las frecuencias empíricas coinciden con las frecuencias teóricas. El valor 1 sólo se consigue si n = 0, lo que implica que no hay observaciones, por lo que nunca se puede dar.

  • Cuanto mayor es el valor de C, mayor es la relación entre las dos variables, y al revés, cuanto menor es el valor de C, menor es la relación entre las dos variables.

  • Cuando existe un valor elevado de C no se puede afirmar que una de las variables es causa de la otra.

  • Se puede estimar, en casos en que la tabla de contingencia tenga igual número de filas que de columnas, un valor máximo que puede alcanzar C.

Contenido relacionado