Centrado

Correspondiente a la sesión del jueves, 29 de mayo de 2025

Este práctico es una versión traducida de: Centering in Multilevel Models.

Centrado de variables

Esta práctica

En este práctico, abordaremos algunos conceptos adicionales en los modelos multinivel:

La importancia del centrado de variables
Distinguir los efectos dentro de los grupos de los efectos entre grupos

Al final, la agrupación (clustering) nos acerca a comprender qué nos dicen las interacciones entre niveles

Modelos contextuales: un punto de partida

Los modelos contextuales utilizan el predictor tanto en el nivel 1 (L1) como en el nivel 2 (L2).

Este tipo de modelos se usa para evaluar efectos “contextuales”:

En general, un efecto contextual compara el efecto de un predictor medido a nivel individual sobre un resultado individual con el efecto de la media del predictor sobre ese mismo resultado.
Consideremos el efecto de las tareas escolares: ¿el logro en matemáticas de un estudiante es una función de su propia cantidad de tareas o de cuánta tarea hace en promedio toda la clase?
El problema es que el puntaje de cada estudiante en una clase o grupo determinado se utiliza para calcular la media; es decir, ambos no son ortogonales (no son independientes entre sí).

Los modelos contextuales son útiles para evaluar los efectos del centrado.

Datos de ejemplo

Los datos provienen de Kreft y Leeuw, y pueden encontrarse en el sitio web de IDRE

El logro en matemáticas es la variable dependiente, y los estudiantes están anidados dentro de escuelas.

Las horas de tarea son el predictor de nivel 1 (L1)

pacman::p_load(tidyverse, lme4, texreg, gt)

school0 <- foreign::read.dta("https://stats.idre.ucla.edu/stat/stata/examples/mlm_imm/imm10.dta")

school0[1:10,c("schid","schnum", "stuid","math","homework")]

   schid schnum stuid math homework
1   7472      1     3   48        1
2   7472      1     8   48        0
3   7472      1    13   53        0
4   7472      1    17   42        1
5   7472      1    27   43        2
6   7472      1    28   57        1
7   7472      1    30   33        5
8   7472      1    36   64        1
9   7472      1    37   36        1
10  7472      1    42   56        2

psych::describe(school0[c("math","homework")], fast = TRUE)

         vars   n  mean    sd median min max range skew kurtosis   se
math        1 260 51.30 11.14   49.5  31  71    40 0.11     -1.2 0.69
homework    2 260  2.02  1.55    1.0   0   7     7 0.82     -0.3 0.10

Centrado

En algunos casos, podríamos desear centrar nuestras variables predictoras/independientes.

Hemos hablado sobre problemas de interpretación (por ejemplo, cuando cero no es un valor plausible), pero existen otras razones.

Para centrar una variable, se resta un valor dado (usualmente una media) de los puntajes originales de la variable.

El centrado alterará el significado de ciertos parámetros, incluyendo el intercepto y algunas pendientes (dependiendo del método de centrado).

Dos métodos relevantes de centrado son:

Centrado en la media general / Centrado por una constante (GMC)
Centrado en la media del grupo (CMC)

Centrado en la Media General (GMC)

Quizás la forma más familiar de centrar los datos sería restar la media general a cada observación.

La media general es la media de cada variable X considerando todas las observaciones, sin importar la unidad de muestreo.

Nuestra ecuación de regresión para el modelo contextual que predice los puntajes en matemáticas según las horas de tarea se convierte en:

$Y_{i s} = γ_{00} + γ_{01} (X_{i s} - {\bar{X}}_{g}) + γ_{10} ({\bar{X}}_{s} - {\bar{X}}_{g}) + U_{0 s} + e_{i s}$ ₛ

El intercepto ahora refleja el valor predicho de Y para un estudiante que (siguiendo nuestro ejemplo):

Tiene un puntaje en tarea igual a la media general
Asiste a una escuela con un promedio de tarea igual a la media general

¿Dónde has visto antes la parte de la fórmula que está entre paréntesis?

¡Es justamente lo que hace que el cero tenga sentido!

La pendiente fija γ₀₁ ahora representa el cambio en Y por cada unidad en que el estudiante está por sobre la media general en tarea.

La pendiente fija γ₁₀ ahora representa el cambio en Y por cada unidad en que el promedio de tarea de una escuela está por sobre la media general.

El intercepto representa el valor esperado de Y cuando el predictor está en su valor de media general (es decir, cero tras el centrado).

Ten en cuenta que el GMC produce interceptos de nivel 2 que están ajustados por los predictores de nivel 1.

Las diferencias en el predictor dentro de los grupos son modificadas como resultado del GMC.

Las varianzas del intercepto y las pendientes se interpretan en los valores medios del/los predictor(es).

La Mecánica del Centrado GMC

El código para el GMC está más abajo.

Centro la variable “tarea” (homework) en ambos niveles.
En el nivel 2, probablemente el cero no tiene sentido (suponiendo que es imposible que todos los estudiantes no hagan tarea). Si el cero tuviera sentido, entonces podría considerar no centrar la variable.

Ten en cuenta que el centrado se hace primero en el nivel 1 antes de pasar al nivel 2 (con group_by).

Un estudiante con un puntaje determinado en tarea tendrá el mismo valor centrado en la media general (GMC) que otro estudiante con ese mismo puntaje en una escuela diferente.

#process data
school1 <- school0 %>% 
    dplyr::select(c("schid","schnum", "stuid","math","homework")) %>% 
    mutate(home.gmc = homework-mean(homework), #Centrar un predictor en la media general
           home.c.alt = scale(homework, center=T, scale=F), #Otra forma de hacer el centrado en la media general (GMC)
           homework.gm = mean(homework)) %>%  #gObtener la media general y agregarla a cada observación
           group_by(schnum) %>% 
           mutate(mean.g.home = mean(homework), #Obtener la media del grupo para el predictor
                  meanhome.gmc = mean.g.home - homework.gm) %>% #Centrar el predictor de nivel 2 (L2)
           ungroup()

school1 %>% 
    dplyr::select(-schid) %>% 
    slice(1:5, 30:35) %>% 
    mutate_if(is.numeric, round, 2) %>% 
    gt::gt()

schnum	stuid	math	homework	home.gmc	home.c.alt	homework.gm	mean.g.home	meanhome.gmc
1	3	48	1	-1.02	-1.02	2.02	1.39	-0.63
1	8	48	0	-2.02	-2.02	2.02	1.39	-0.63
1	13	53	0	-2.02	-2.02	2.02	1.39	-0.63
1	17	42	1	-1.02	-1.02	2.02	1.39	-0.63
1	27	43	2	-0.02	-0.02	2.02	1.39	-0.63
2	29	35	1	-1.02	-1.02	2.02	2.35	0.33
2	31	42	4	1.98	1.98	2.02	2.35	0.33
2	34	41	4	1.98	1.98	2.02	2.35	0.33
2	38	31	3	0.98	0.98	2.02	2.35	0.33
2	44	41	2	-0.02	-0.02	2.02	2.35	0.33
2	54	32	1	-1.02	-1.02	2.02	2.35	0.33

Correlaciones entre Puntaje Bruto y GMC

Examinemos la matriz de correlaciones.

Esto da una idea de lo que cambia o, más exactamente, de lo que no cambia con el centrado en la media general (GMC).

Si las correlaciones no cambian, entonces los coeficientes de regresión tampoco cambiarán.

Pero fíjate en el intercepto cuando lleguemos a él.

Tabla de Correlaciones

Variable	Mean	SD	1	2	3	4	5
1. Math	51.30	11.14	–
2. Homework	2.02	1.55	.50**	–
3. Home.gmc	-0.00	1.55	.50**	1.00**	–
4. Mean.g.home	2.02	0.84	.53**	.54**	.54**	–
5. Meanhome.gmc	-0.00	0.84	.53**	.54**	.54**	1.00**	–

Nota: *p < .05. **p < .01.

Estimaciones del Modelo con Puntaje Bruto y GMC

El modelo incluye versiones de la variable “tarea” (homework) tanto en nivel 1 como en nivel 2.

Los valores de los interceptos cambian.

Observa que los coeficientes de regresión y las estimaciones de varianza aleatoria no cambian.

model1 <-lmer(math ~ homework + mean.g.home + (1|schnum), data=school1)
model2 <-lmer(math ~ home.gmc + meanhome.gmc + (1|schnum), data=school1)

sjPlot::tab_model(model1, model2, dv.labels = c("Raw Score Model","GMC Model"),
                  show.ci = FALSE)

	Raw Score Model		GMC Model
Predictors	Estimates	p	Estimates	p
(Intercept)	39.75	<0.001	50.21	<0.001
homework	2.14	<0.001
mean g home	3.04	0.211
home gmc			2.14	<0.001
meanhome gmc			3.04	0.211
Random Effects
σ²	64.57		64.57
τ₀₀	23.10 _schnum		23.10 _schnum
ICC	0.26		0.26
N	10 _schnum		10 _schnum
Observations	260		260
Marginal R² / Conditional R²	0.233 / 0.435		0.233 / 0.435

Interpretaciones del Modelo con Puntaje Bruto:

El intercepto del modelo con puntaje bruto (γ₀₀ = 39.75)
Este valor es el logro académico predicho para un estudiante que tiene:
- Un valor cero en su tarea individual (Xᵢₛ)
- Un valor cero en el promedio de tareas de su escuela (X̄ₛ = 0)
Un promedio de tareas (por escuela) de cero parece poco plausible.
¡Imagina un mundo perfecto en el que todos los estudiantes hagan al menos algo de tarea!

Interpretaciones del Modelo con Puntaje GMC

El intercepto es γ₀₀ = 50.21

Este valor es el logro académico predicho para un estudiante que tiene:
- Un puntaje promedio en tareas (Xᵢₛ)
- Un promedio de tareas en su escuela (nivel 2) igual a cero (X̄ₛ = 0)

Otra Perspectiva del Centrado en la Media General – Estimaciones por Grupo

Aquí tienes una ilustración muy interesante de lo que ocurre con los interceptos y pendientes para los datos sin centrar (puntaje bruto) y con centrado en la media general (GMC).

Observa que en los modelos GMC los interceptos están “ajustados” en relación con la media general de la variable “tarea”.

Otra forma de pensar esto es que los puntajes ya no representan las mismas relaciones dentro de los grupos (en este caso, escuelas) cuando se utiliza GMC.

Las pendientes, sin embargo, no han cambiado.

school1 %>% 
  nest(-schnum) %>% 
  mutate(fit = map(data, ~ lm(math ~ homework, data=.)),
         fit.c = map(data, ~ lm(math ~ home.gmc, data=.)),
         results = map(fit, broom::tidy),
         results.c = map(fit.c, broom::tidy)) %>% 
  unnest(results, results.c) %>% 
  dplyr::select(schnum, term, estimate, term1, estimate1 ) %>% 
  pivot_wider(id_cols = "schnum", 
              values_from=c("estimate", "estimate1"), 
              names_from=
                "term") %>% 
  rename(Intercept = "estimate_(Intercept)", Slope=estimate_homework,
         Intercept.gmc = "estimate1_(Intercept)", Slope.gmc=estimate1_homework)%>%
  unnest() %>% 
  mutate_if(is.numeric, round, 2) %>% 
  gt::gt()

schnum	Intercept	Slope	Intercept.gmc	Slope.gmc
1	50.68	-3.55	43.49	-3.55
2	49.01	-2.92	43.10	-2.92
3	38.75	7.91	54.75	7.91
4	34.39	5.59	45.71	5.59
5	53.94	-4.72	44.39	-4.72
6	49.26	-2.49	44.23	-2.49
7	59.21	1.09	61.42	1.09
8	36.06	6.50	49.20	6.50
9	38.52	5.86	50.38	5.86
10	37.71	6.34	50.53	6.34

Centrado en la Media del Grupo (CMC)

Otro método importante de centrado es el centrado en la media del grupo (CMC).

A cada persona se le resta el promedio del grupo en esa variable independiente dada.

El modelo con X centrada en la media del grupo en el nivel 1 (L1) y centrada en la media general en el nivel 2 (L2) es:

$Y_{i s} = γ_{00} + γ_{01} (X_{i s} - {\bar{X}}_{s}) + γ_{10} ({\bar{X}}_{s} - {\bar{X}}_{g}) + U_{0 s} + e_{i s}$

donde:

$γ_{01} (X_{i s} - {\bar{X}}_{s})$ representa un aumento (o disminución) de una unidad respecto a la media del grupo
$γ_{10} ({\bar{X}}_{s} - {\bar{X}}_{g})$ sigue siendo la media a nivel de escuela (L2) del predictor

Cuatro características importantes del CMC:

Preserva la posición relativa de los puntajes dentro de los grupos
La media de cada grupo en el predictor es 0
Dado que no hay variación entre grupos para el predictor centrado en la media del grupo, se ha creado efectivamente un predictor dentro de los grupos (¡y ya sabemos lo que eso significa!)
Por lo tanto, el CMC aísla o elimina el efecto de la variable de nivel 2 – el efecto es puramente de nivel 1

Centrado en la Media del Grupo con Nuestros Datos

Aquí resto la media de tareas de la escuela a las tareas de cada estudiante.

Vuelve a revisar las correlaciones… ¿qué ha cambiado?

school2 <- school1 %>% 
    dplyr::select(-home.c.alt) %>% 
    group_by(schnum) %>% 
    mutate(home.cmc = homework-mean(homework)) %>% 
    ungroup()

school2 %>% 
  dplyr::select(math, homework, home.gmc, home.cmc, mean.g.home, meanhome.gmc) %>% slice(1:5,30:35)

# A tibble: 11 × 6
    math homework home.gmc home.cmc mean.g.home meanhome.gmc
   <dbl>    <dbl>    <dbl>    <dbl>       <dbl>        <dbl>
 1    48        1  -1.02     -0.391        1.39       -0.632
 2    48        0  -2.02     -1.39         1.39       -0.632
 3    53        0  -2.02     -1.39         1.39       -0.632
 4    42        1  -1.02     -0.391        1.39       -0.632
 5    43        2  -0.0231    0.609        1.39       -0.632
 6    35        1  -1.02     -1.35         2.35        0.327
 7    42        4   1.98      1.65         2.35        0.327
 8    41        4   1.98      1.65         2.35        0.327
 9    31        3   0.977     0.65         2.35        0.327
10    41        2  -0.0231   -0.35         2.35        0.327
11    32        1  -1.02     -1.35         2.35        0.327

Tabla de Correlaciones

Variable	Mean	SD	1	2	3	4	5	6
1. Math	51.30	11.14	–
2. Homework	2.02	1.55	.50**	–
3. Home.gmc	-0.00	1.55	.50**	1.00**	–
4. Home.cmc	-0.00	1.30	.25**	.84**	.84**	–
5. Mean.g.home	2.02	0.84	.53**	.54**	.54**	.00	–
6. Meanhome.gmc	-0.00	0.84	.53**	.54**	.54**	.00	1.00**	–

Nota: *p < .05. **p < .01.

Correlación y Método de Centrado

Correlaciones de la tarea del estudiante ( $X_{i s}$ ) con:

Promedio de tarea de la escuela ( ${\bar{X}}_{s}$ ): 0.54
Promedio de tarea de la escuela después del centrado en la media general ( $X_{i s} - {\bar{X}}_{s}$ ): 0.54

Correlaciones de la tarea del estudiante después del centrado en la media del grupo ( $X_{i s} - {\bar{X}}_{s}$ ) con:

Promedio de tarea de la escuela ( ${\bar{X}}_{s}$ ): 0
Promedio de tarea de la escuela después del centrado en la media general ( ${\bar{X}}_{s} - {\bar{X}}_{g}$ ): 0

El efecto del predictor cambia debido a la correlación entre el promedio de tarea de la escuela y la tarea del estudiante.

Modelando Datos CMC por Grupo

Vamos a obtener nuevamente las estimaciones por grupo.

school2 %>% 
  nest(-schnum) %>% 
  mutate(fit = map(data, ~ lm(math ~ homework, data=.)),
         fit.c = map(data, ~ lm(math ~ home.gmc, data=.)),
         fit.cmc = map(data, ~ lm(math ~ home.cmc, data=.)),
         results = map(fit, broom::tidy),
         results.c = map(fit.c, broom::tidy),
         results.cmc = map(fit.cmc, broom::tidy)) %>% 
  unnest(results, results.c, results.cmc) %>% 
  dplyr::select(schnum, term, estimate, estimate1, estimate2) %>% 
  pivot_wider(id_cols = "schnum", 
              values_from=c("estimate", "estimate1", "estimate2"), 
              names_from=
                "term") %>% 
  rename(Intercept = "estimate_(Intercept)", Slope=estimate_homework,
         Intercept.gmc = "estimate1_(Intercept)", Slope.gmc=estimate1_homework,
         Intercept.cmc = "estimate2_(Intercept)", Slope.cmc=estimate2_homework) %>% 
  mutate_if(is.numeric, round, 2) %>% 
  gt::gt()

schnum	Intercept	Slope	Intercept.gmc	Slope.gmc	Intercept.cmc	Slope.cmc
1	50.68	-3.55	43.49	-3.55	45.74	-3.55
2	49.01	-2.92	43.10	-2.92	42.15	-2.92
3	38.75	7.91	54.75	7.91	53.25	7.91
4	34.39	5.59	45.71	5.59	43.55	5.59
5	53.94	-4.72	44.39	-4.72	49.86	-4.72
6	49.26	-2.49	44.23	-2.49	46.40	-2.49
7	59.21	1.09	61.42	1.09	62.82	1.09
8	36.06	6.50	49.20	6.50	49.67	6.50
9	38.52	5.86	50.38	5.86	46.33	5.86
10	37.71	6.34	50.53	6.34	47.85	6.34

Modelo Multinivel con Datos CMC

Los efectos aleatorios no cambian entre los modelos.

Compara las estimaciones de efectos fijos entre los modelos.

model3<-lmer(math ~ home.cmc + meanhome.gmc + (1|schnum), data=school2)
## summary(m3)

sjPlot::tab_model(model1, model2, model3, dv.labels = c("Raw Score Model","GMC Model","CMC Model"), show.ci = FALSE)

	Raw Score Model		GMC Model		CMC Model
Predictors	Estimates	p	Estimates	p	Estimates	p
(Intercept)	39.75	<0.001	50.21	<0.001	50.21	<0.001
homework	2.14	<0.001
mean g home	3.04	0.211
home gmc			2.14	<0.001
meanhome gmc			3.04	0.211	5.17	0.031
home cmc					2.14	<0.001
Random Effects
σ²	64.57		64.57		64.57
τ₀₀	23.10 _schnum		23.10 _schnum		23.10 _schnum
ICC	0.26		0.26		0.26
N	10 _schnum		10 _schnum		10 _schnum
Observations	260		260		260
Marginal R² / Conditional R²	0.233 / 0.435		0.233 / 0.435		0.233 / 0.435

γ₀₀ (50.21) es ahora el valor predicho para un estudiante que:

Tiene una cantidad de tarea igual al promedio de su escuela
Asiste a una escuela con un promedio de tarea igual a la media general en tarea

γ₀₁ (5.17) es ahora el aumento en Y por cada unidad de tarea que el estudiante está por sobre el promedio de su escuela

γ₁₀ (2.14) es ahora el aumento en Y por cada unidad en que el promedio de tarea de la escuela está por sobre la media general

Revisitando el Modelo Contextual

El centrado en la media del grupo (CMC) efectivamente hace que las versiones de nivel 1 (L1) y nivel 2 (L2) del predictor sean ortogonales (ver la matriz de correlación más arriba).

La pendiente para el promedio de tarea de la escuela cambió de 3.04 en los modelos sin centrado o con centrado en la media general (GMC) a 5.17 en el modelo con centrado en la media del grupo.

Recuerda: las pendientes en regresión dependen de las otras variables en el modelo.

Si las variables independientes están correlacionadas, los coeficientes de regresión cambiarán.
Cambiamos: $X_{i s} a X_{i s} - {\bar{X}}_{s}$

El problema está en los tipos de información contenidos en ( X_{is} ):

Contiene tanto información de nivel 1 como de nivel 2, porque la tarea de cada estudiante está relacionada con el promedio de tarea de su escuela.
El coeficiente correspondiente (3.04) representa el efecto adicional del promedio de tarea de la escuela al controlar por la tarea del estudiante.

La tarea del estudiante centrada en la media del grupo contiene solo información de nivel 1:

restamos la componente grupal de los puntajes originales.
Recuerda esta parte cuando lleguemos a las estructuras correlacionales de datos diádicos o grupales.

El Factor que Complica: Interacciones

No hemos hablado mucho sobre las interacciones, pero son importantes en muchos modelos.

El centrado influye en las interacciones de dos maneras:

En la interpretación de las estimaciones
En las correlaciones entre predictores (lo cual influye en los errores estándar)

Las interacciones pueden darse dentro de un mismo nivel (L1 o L2) o ser entre niveles (L1 × L2).

Según Hox (p. 53): Si hay una interacción, entonces el coeficiente de regresión de una de las variables directas es el valor esperado de esa pendiente de regresión cuando la otra variable es igual a cero, y viceversa.

Esto significa que el valor cero debe tener un significado interpretable.

Seguimos teniendo las dos opciones de centrado, pero estas se vuelven un poco más complejas cuando hay interacciones involucradas.

Interacciones en el Nivel 1 (L1)

Volvamos al conjunto de datos de logro en matemáticas, pero esta vez nos centraremos en usar tareas (homework) y raza (blanco) como predictores, ambos del nivel 1 (L1).

Observa en el ejemplo a continuación que centro la variable de tarea en la media del grupo, pero no la variable dummy de raza/blanco (Podría hacerlo, pero el significado cambia de formas que podrían no ser útiles — ver Hox y Enders & Tofighi).

school3 <- school0 %>% 
    mutate(home.gmc = homework-mean(homework))

model4 <- lmer(math ~ homework + white + (1|schid), data=school3)
model5 <- lmer(math ~ homework * white + (1|schid), data=school3)
model6 <- lmer(math ~ home.gmc * white + (1|schid), data=school3)

sjPlot::tab_model(model4, model5, model6, dv.labels = c("No Interaction","Interaction Raw","Interaction/Centered"), show.se = T, show.ci = F)

	No Interaction			Interaction Raw			Interaction/Centered
Predictors	Estimates	std. Error	p	Estimates	std. Error	p	Estimates	std. Error	p
(Intercept)	42.57	2.00	<0.001	45.43	2.41	<0.001	47.00	1.87	<0.001
homework	2.20	0.38	<0.001	0.77	0.78	0.323
white	3.60	1.61	0.026	-0.06	2.38	0.979	3.54	1.59	0.027
homework × white				1.78	0.86	0.039
home gmc							0.77	0.78	0.323
home gmc × white							1.78	0.86	0.039
Random Effects
σ²	63.87			63.12			63.12
τ₀₀	21.35 _schid			20.35 _schid			20.35 _schid
ICC	0.25			0.24			0.24
N	10 _schid			10 _schid			10 _schid
Observations	260			260			260
Marginal R² / Conditional R²	0.148 / 0.361			0.159 / 0.364			0.159 / 0.364

Siguiendo a Hox, podemos expresar el Modelo 6 de la siguiente forma:

$math = 47 + 3.54 \cdot race + 0.77 \cdot homework + 1.78 \cdot race \cdot homework$

El intercepto representa el valor para niños no blancos con la cantidad promedio de tarea; el coeficiente de interacción se multiplica por dos ceros, así que no afecta directamente la interpretación del intercepto.
Un cambio de una unidad en homework produce un cambio de 0.77 en el logro en matemáticas.
Un cambio de una unidad en race (donde los niños blancos están codificados como 1) produce una diferencia o aumento de 3.54 en el logro en matemáticas.
El término de interacción funciona solo cuando race = 1 (niño blanco) y hay un valor distinto de 0 para homework.
- Con white = 1 y homework = 1, hay una diferencia de $1.78 \cdot 1 = 1.78$ entre niños blancos y no blancos en logro matemático para 1 hora de tarea por sobre la media.
- Con white = 1 y homework = 2, la diferencia es: $1.78 \cdot 2 = 3.56$ en logro matemático para 2 horas de tarea por sobre la media.
- Repite el mismo razonamiento para otros valores de homework.
- Y no olvides considerar los efectos principales: también importan.

Graficando Interacciones

Cuando se tiene un predictor categórico, se grafican las pendientes para cada grupo.

El paquete interactions hace que esto sea bastante sencillo.

Podemos ver que el efecto de un aumento en la tarea es más pronunciado para los niños blancos.

interactions::interact_plot(model6, pred = home.gmc, modx = white)

Con predictores continuos, usualmente tenemos un rango de valores del moderador para elegir:

En algunos casos, hay valores teóricos a utilizar, o bien investigaciones previas sugieren valores apropiados.
En otros casos, tenemos que usar algo un poco más artificial (por ejemplo, ±1 desviación estándar).
Aquí utilizo nivel socioeconómico (SES) (que parece estar estandarizado).
Observa que la interacción no es significativa, y el gráfico correspondiente de las pendientes lo refleja.

model7 <- lmer(math ~ home.gmc * ses + (1|schid), data=school3)

sjPlot::tab_model(model7)

	math
Predictors	Estimates	CI	p
(Intercept)	50.62	48.39 – 52.85	<0.001
home gmc	1.96	1.22 – 2.71	<0.001
ses	3.82	2.41 – 5.23	<0.001
home gmc × ses	0.05	-0.68 – 0.78	0.890
Random Effects
σ²	60.92
τ₀₀ _schid	9.48
ICC	0.13
N _schid	10
Observations	260
Marginal R² / Conditional R²	0.314 / 0.407

interactions::interact_plot(model7, pred = home.gmc, modx = ses)

Interacciones Entre Niveles (Cross-level Interactions)

Una interacción entre niveles, como su nombre lo indica, es un término de interacción basado en dos predictores (por ahora), uno en el nivel 1 (L1) y otro en el nivel 2 (L2).

El centrado influye tanto en las estimaciones de la interacción como en su interpretación.

Interacciones entre Niveles como Predictores de Pendientes Aleatorias

Las interacciones entre niveles (L1 × L2) funcionan como predictores de pendientes aleatorias en modelos multinivel (MLM).

Te ahorraré las fórmulas, pero puedes consultarlas en Hox, Capítulo 2.

Revisión (dentro del contexto del MLM):

Un predictor de nivel 1 (L1) se utiliza para predecir resultados de nivel 1

Un predictor de nivel 2 (L2) se utiliza para predecir interceptos de nivel 2

- Recuerda: los **predictores de nivel 2** varían **entre grupos**, pero **no dentro** de los grupos.

Una interacción L1 × L2 representa, conceptualmente, las pendientes (L1) para cada grupo (L2).
Por lo tanto, la interacción L1 × L2 es el predictor de las pendientes aleatorias (es decir, los valores de pendiente específicos de cada grupo).

Importante: el centrado en la media del grupo (CMC) de la variable L1 garantiza la ortogonalidad entre esa variable y la de nivel 2 (L2).

Presta atención al cambio en la varianza del intercepto a nivel de escuela.

school3 <- school3 %>% 
    group_by(schnum) %>% 
    mutate(home.cmc = homework-mean(homework)) %>% 
    ungroup()

model8.gmc <- lmer(math ~ home.gmc * public + (home.gmc||schid), data=school3,REML=FALSE)
model8.cmc <- lmer(math ~ home.cmc * public + (home.cmc||schid), data=school3, REML=FALSE)

sjPlot::tab_model(model8.gmc, model8.cmc, show.dev=T, show.ci = F, show.se = T,
                  dv.labels = c("GMC Model","CMC Model"))

	GMC Model			CMC Model
Predictors	Estimates	std. Error	p	Estimates	std. Error	p
(Intercept)	61.42	3.27	<0.001	62.82	2.80	<0.001
home gmc	1.09	4.27	0.798
public	-13.83	3.48	<0.001	-15.60	2.98	<0.001
home gmc × public	1.14	4.52	0.801
home cmc				1.09	4.48	0.807
home cmc × public				1.06	4.74	0.823
Random Effects
σ²	43.24			43.14
τ₀₀	9.69 _schid			7.21 _schid
τ₁₁	17.98 _{schid.home.gmc}			19.85 _{schid.home.cmc}
ρ₀₁
ρ₀₁
ICC	0.18			0.14
N	10 _schid			10 _schid
Observations	260			260
Marginal R² / Conditional R²	0.517 / 0.606			0.508 / 0.579
Deviance	1762.721			1759.945

¿Qué Método de Centrado Usar?

Según Enders y Tofighi:

El centrado en la media del grupo (CMC) (Enders y Tofighi lo llaman “centering within cluster” o CWC) es apropiado cuando la asociación entre X e Y en el Nivel 1 (L1) es de interés sustantivo.

CMC elimina el efecto del grupo/diada de las estimaciones a nivel 1.

2- El centrado en la media general (GMC) (Enders y Tofighi lo llaman “centering at the grand mean” o CGM) es apropiado cuando el interés principal está en un predictor de Nivel 2 (L2) y se desea controlar por covariables de Nivel 1.

GMC no controla por el efecto del grupo/diada sobre las variables de L1.
Los predictores de L1 contienen información tanto de nivel 1 como de nivel 2.

Tanto GMC como CMC pueden ser usados para examinar la influencia diferencial de una variable en el Nivel 1 y Nivel 2.

Esto se refiere a los modelos contextuales.

CMC es preferible para examinar interacciones entre niveles y entre pares de variables de Nivel 1. GMC es apropiado para interacciones entre variables de Nivel 2.

Resumen sobre el Centrado

La escala de las variables puede llevar a valores de parámetros que no sean plausibles.

A veces, el centrado cambia la interpretación (como en el centrado en la media general)
A veces, cambia la inferencia (como en el centrado en la media del grupo)

El centrado ayuda a:

Hacer que las estimaciones de los parámetros sean más comprensibles
Facilitar la estimación de efectos aleatorios en ciertos tipos de modelos
Diferenciar tipos de efectos, especialmente en el centrado en la media del grupo

Centrado de variables

Esta práctica

Modelos contextuales: un punto de partida

Datos de ejemplo

Centrado

Centrado en la Media General (GMC)

La Mecánica del Centrado GMC

Correlaciones entre Puntaje Bruto y GMC

Tabla de Correlaciones

Estimaciones del Modelo con Puntaje Bruto y GMC

Otra Perspectiva del Centrado en la Media General – Estimaciones por Grupo

Centrado en la Media del Grupo (CMC)

Centrado en la Media del Grupo con Nuestros Datos

Correlación y Método de Centrado

Modelando Datos CMC por Grupo

Modelo Multinivel con Datos CMC

Revisitando el Modelo Contextual

El Factor que Complica: Interacciones

Interacciones en el Nivel 1 (L1)

Graficando Interacciones

Interacciones Entre Niveles (Cross-level Interactions)

¿Qué Método de Centrado Usar?

Resumen sobre el Centrado

Foro