hetero_pairs

Autor/a

Guillermo Correa-Londoño

Descripción

Implementa procedimientos de comparación múltiple en escenarios de varianzas heterogéneas. Incluye las pruebas de Games-Howell, T2 y T2′ de Tamhane, y T3 de Dunnett, descritas en Métodos Estadísticos para la Investigación.

Uso

hetero_pairs(anova, tto = NULL, method = c("T3", "GH", "T2", "T2'"), alpha = 0.05)

Argumentos

anova Objeto de la clase aov o lm que contiene el modelo de ANOVA ajustado
tto Nombre del factor de tratamiento cuyas medias se desean comparar
method

Método de comparación múltiple:

  • "T3": T3 de Dunnett (por defecto)
  • "GH": Games-Howell
  • "T2": T2 de Tamhane
  • "T2'": T2′ de Tamhane
alpha Nivel de significancia (por defecto: 0.05)

Detalles

El objeto anova debe corresponder a un modelo ajustado de análisis de varianza de una vía o a un modelo lineal equivalente.

En los modelos de análisis de varianza de una vía en DCA, en los que el único término explicativo corresponde a los tratamientos, no es necesario especificar el argumento tto. En modelos más complejos (por ejemplo, con estructuras factoriales o efectos adicionales), es necesario indicar explícitamente el factor de tratamiento cuyas medias se desean comparar.

Todos los métodos implementados se basan en contrastes por pares construidos a partir de un estadístico tipo Welch. Las diferencias entre los métodos radican en la forma en que se controla la tasa de error por familia (TEF), ya sea mediante ajustes explícitos de los valores p o a través de distribuciones de referencia que incorporan directamente la multiplicidad.

Se implementan los siguientes métodos:

  • T3 de Dunnett (T3). Es el método por defecto. Suele ofrecer mayor potencia que T2 y T2′, especialmente con muestras pequeñas. Se considera generalmente el método más equilibrado, al ofrecer buena potencia manteniendo un control adecuado de la TEF. Está basado en la distribución del máximo módulo estudentizado. Se implementa a través de la función PMCMRplus::dunnettT3Test.

  • T2 de Tamhane (T2). Basado en la solución de Welch al problema de Behrens–Fisher y en la desigualdad de Šidák para el ajuste por comparaciones múltiples. Garantiza el control de la TEF, aunque puede resultar conservador.

  • T2’ de Tamhane (T2′). Variante del método T2 que ajusta los grados de libertad en función de las condiciones de Ury y Wiggins (1971). Puede ofrecer mayor potencia en algunas comparaciones, manteniendo el control de la TEF.

  • Games-Howell (GH). Basado en la distribución del recorrido estudentizado. Tiende a ser uno de los métodos más potente en presencia de varianzas heterogéneas, pero puede presentar un control imperfecto de la TEF en situaciones de fuerte desbalance o heterogeneidad extrema.

El argumento alpha, cuyo valor por defecto es 0.05, define el nivel de significancia con base en el cual se estructuran los grupos y la confianza de los intervalos.

Los intervalos de confianza para el método T3 se construyen mediante una aproximación basada en la distribución del recorrido estudentizado con grados de libertad por comparación. Estos intervalos deben interpretarse como aproximaciones coherentes con el procedimiento de prueba, aunque no existe una forma canónica única ampliamente aceptada para su construcción.

Salida

La función produce una tabla que contiene:

  • Diferencias de medias entre tratamientos
  • Estadísticos de prueba (tipo Welch)
  • Grados de libertad aproximados
  • Valores p ajustados
  • Intervalos de confianza
  • Símbolos de significancia

Adicionalmente se genera una segunda tabla con:

  • Conformación de grupos homogéneos de tratamientos

Ejemplos

Ejemplo 1.

1data <- readxl::read_excel("Ejemplo.xlsx")
data$tto <- factor(data$tto)
anova <- aov(y ~ tto, data)
2source("hetero_pairs.R")
3hetero_pairs(anova)
1
Importación y preparación de la base de datos y ajuste del modelo ANOVA.
2
Carga de la función hetero_pairs.
3
Llamado de la función con valores por defecto.

Comparación de medias por el método T3 de Dunnett 

      dif. statistic   gl p_value      lwr     upr sig.
A - B -4.6   -2.6997 4.91  0.2432 -14.3379  5.1379     
A - C -7.4  -12.6291 2.25  0.0235 -13.0195 -1.7805    *
A - D -1.9   -1.5344 1.55  0.7345 -15.3738 11.5738     
A - E  2.4    2.3080 5.97  0.3437  -3.1261  7.9261     
B - C -2.8   -1.7365 4.06  0.6280 -12.8576  7.2576     
B - D  2.7    1.3869 4.59  0.8014  -8.7521 14.1521     
B - E  7.0    3.8314 6.16  0.0606  -2.6070 16.6070    .
C - D  5.5    4.9592 1.03  0.2939  -6.5677 17.5677     
C - E  9.8   11.1106 4.21  0.0023   4.3961 15.2039   **
D - E  4.3    3.0652 2.41  0.3172  -8.2934 16.8934     

Los intervalos de confianza para el método T3 no son exactos
------------------------------------------------------------

    medias   grupos
C     12.9        a
B     10.1       ab
D      7.4       ab
A      5.5        b
E      3.1        b

Los tratamientos con una letra común no difieren 
significativamente al 5 %

Referencias Bibliográficas

Dunnett, C. W. (1980). Pairwise multiple comparisons in the unequal variance case. Journal of the American Statistical Association, 75(372), 796-800.

Games, P. A. y Howell, J. F. (1976). Pairwise multiple comparison procedures with unequal n’s and/or variances: A Monte Carlo study. Journal of Educational Statistics, 1(2), 113-125.

Tamhane, A. C. (1979). A comparison of procedures of means with unequal variances. Journal of the American Statistical Association, 74(366), 471-480.

Ury, H. K. y Wiggins, A. D. (1971). Large sample and other multiple comparisons among means. British Journal of Mathematical and Statistical Psychology, 24(2), 174-191. doi: 10.1111/j.2044-8317.1971.tb00465.x