7 ESQUEMAS DE ALEATORIZACIÓN

En la sección 6.1.18 se desglosaron los componentes de los estudios experimentales: la estructura de los tratamientos, el esquema de aleatorización y la secuencialidad en el registro de la información.

En este capítulo se presentan los esquemas de aleatorización básicos.

Definición 7.1 : Esquema de aleatorización

Protocolo seguido para asignar los tratamientos a las unidades experimentales.

¿¡Y los demás componentes!?

Con el fin de mantener una presentación secuencial y ordenada, sin mezclar conceptos, todos los ejemplos de este capítulo están basados en un único factor, es decir, la estructura de los tratamientos es unifactorial o de una vía (one-way).

No obstante, los esquemas de aleatorización que se presentan pueden usarse igualmente en los experimentos con estructura factorial de tratamientos que se desarrollan en el capítulo 10.

Asimismo, aunque todos los ejemplos de este capítulo son de tipo transversal —por cuanto registran la respuesta en un único momento al final de experimento—, los esquemas de aleatorización considerados también son aplicables en estudios longitudinales.

Conviene enfatizar que el esquema de aleatorización es solo uno de los componentes que —junto con la estructura de los tratamientos y la secuencialidad— describe un diseño experimental (cf. sección 6.1.18).

En tal sentido, la denominación tradicional —que se refiere a estos esquemas de aleatorización como diseños (diseño completamente al azar: DCA, diseño en bloques al azar: DBA, diseño cuadro latino: DCL, etc.)— puede no ser la más conveniente para el presente sistema de clasificación.

Consecuentemente, en el presente texto evitamos referirnos a los esquemas de aleatorización como diseños. Sin embargo, no puede desconocerse que tales nombres tienen una larga tradición y que es la denominación que se encuentra en la mayoría de textos.

¿¡Entonces, son o no son diseños!?

La denominación diseño, aunque válida en el sistema de clasificación tradicional, no se ajusta a la taxonomía adoptada en este texto.

Al protocolo seguido para asignar los tratamientos a las unidades experimentales lo denominamos esquema de aleatorización.

Reservamos la palabra diseño para referirnos, de manera integral, a los componentes de un experimento.

El esquema de aleatorización, además de tener implicaciones en el ensayo de campo, se refleja en el modelo del ANOVA.

Todos los modelos de una vía tienen un par de elementos comunes: los tratamientos y el término del error. Adicionalmente, pueden incluir términos correspondientes a una o más fuentes de variación aleatoria, sin que por ello dejen de ser modelos de una vía.

En la sección 7.1 se presenta el esquema de aleatorización completamente al azar, cuyo modelo corresponde al presentado en la sección 6.2.

En la sección 7.2 se presenta el esquema de aleatorización en bloques completos al azar, cuyo modelo incluye una fuente de variación aleatoria.

Y finalmente, en la sección 7.3 se presentan el esquema de aleatorización en cuadro latino —que incluye dos fuentes de variación aleatoria— y sus generalizaciones —que consideran la inclusión de más de dos fuentes de variación aleatoria—.

Los procedimientos de comparación múltiple que se presentan en el capítulo 8 son aplicables a todos los experimentos con un factor que se desarrollan en este capítulo, sin importar su esquema de aleatorización.

Asimismo, tales procedimientos, con algunas adaptaciones, se emplean en los experimentos con estructura factorial que se presentan el capítulo 10.

7.1 Esquema de aleatorización completamente al azar

Este es el más simple de los esquemas de aleatorización. También se le denomina completamente aleatorizado (Completely Randomized Design–CRD). En español suelen emplearse las siglas DCA por su denominación tradicional (diseño completamente al azar).

Bajo este esquema de aleatorización todas las unidades experimentales tienen exactamente la misma probabilidad de que les sea asignado cualquiera de los tratamientos evaluados.

En tal sentido, se dice que se trata de una aleatorización completa o sin restricciones, en concordancia con lo presentado en la sección 6.1.11.

Este esquema de aleatorización es el indicado cuando se tienen unidades experimentales homogéneas y el experimento se realiza bajo condiciones ambientales controladas, por ejemplo, en ensayos de laboratorio, donde las fuentes de variación adicionales a tratamientos son despreciables.

Si bien este esquema de aleatorización exhibe su mejor desempeño cuando se satisfacen las condiciones descritas, también puede ser la mejor alternativa cuando, a pesar de que estas no se satisfagan, el investigador no tiene forma de preverlas, medirlas o controlarlas para incorporarlas en el modelo.

El modelo correspondiente a este esquema de aleatorización es el presentado en la sección 6.2 y condensado en la nota 6.1:

\[ Y_{ij}=\mu+\tau_i+\varepsilon_{ij},\ i=1, 2,\dotsc, k;\quad j=1, 2,\dotsc, r, \]
donde:

\(Y_{ij}\): Respuesta de la \(j\)-ésima réplica del \(i\)-ésimo tratamiento.

\(\mu\): Media general.

\(\tau_i\): Efecto del \(i\)-ésimo tratamiento \((\mu_i-\mu).\)

\(\varepsilon_{ij}\): Desviación aleatoria de la \(j\)-ésima réplica del \(i\)-ésimo tratamiento respecto a la media, \(\mu_i\), del \(i\)-ésimo tratamiento.

Los supuestos del modelo son los que se detallan en la sección 6.3 y se sintetizan en la siguiente expresión, que indica que los errores son independientes y se distribuyen normalmente, con media cero y varianza común \(\sigma^2:\)

\[ \varepsilon_{ij}\text{ iid } N(0,\ \sigma^2),\ i=1, 2,\dotsc, k;\quad j=1, 2,\dotsc, r \]

Ejemplo 7.1
Con el fin de evaluar el efecto de cuatro sistemas de empaque de pulpa de guanábana (Annona muricata) sobre el pH del producto, se usa un esquema de aleatorización completamente al azar (DCA) con tres réplicas por tratamiento.

Las unidades experimentales son sometidas a condiciones de anaquel, a 14ºC, durante 7 días, tras lo cual se registra el pH.

Cada unidad experimental corresponde a una porción de 250 g de pulpa empacada.

Este ensayo comprende dos pasos de aleatorización. El primero corresponde a la asignación de los tratamientos a las unidades experimentales disponibles (empacar las pulpas). Este paso puede surtirse con apoyo de la instrucción sample(1:12, 12), tal y como se indicó en la sección 6.1.11.

El segundo paso corresponde a una aleatorización de tipo espacial, al ubicar en el anaquel las unidades experimentales ya empacadas. Para ello es recomendable usar un esquema de aleatorización que produzca adecuados niveles de intercalamiento (cf. sección 6.1.11.1).

La figura 7.1, en la que los tratamientos están representados por las letras \(\text{A}\), \(\text{B}\), \(\text{C}\) y \(\text{D},\) muestra un posible esquema de aleatorización que da lugar a una disposición intercalada de las 12 unidades experimentales.

\(\text{C}\)

\(\text{A}\)

\(\text{B}\)

\(\text{D}\)

\(\text{C}\)

\(\text{A}\)

\(\text{C}\)

\(\text{A}\)

\(\text{B}\)

\(\text{D}\)

\(\text{B}\)

Figura 7.1: Posible esquema de aleatorización espacial para los tratamientos del ejemplo 7.1

En la tabla 7.1 se presentan las lecturas de pH registradas a los 7 días.

Tabla 7.1: pH registrado al séptimo día en las unidades experimentales del ejemplo 7.1

Tratamiento	pH			\(\overline{Y}_{i\bullet}\)
\(\text{A}\)	4.3	3.9	4.1	4.1
\(\text{B}\)	3.2	3.1	3.3	3.2
\(\text{C}\)	3.7	3.9	3.8	3.8
\(\text{D}\)	4.1	3.7	3.9	3.9

Antes de proceder con cualquier cálculo, es muy importante tener presente qué pregunta se busca responder y el alcance de la correspondiente respuesta.

En la formulación del ejemplo se dice que se quiere evaluar el efecto de cuatro sistemas de empaque de pulpa de guanábana sobre el pH del producto.

Un usuario poco atento podría verse tentado a responder rápidamente dicha pregunta con base en la información de la última columna de la tabla 7.1, es decir, los promedios de los tratamientos.

Se diría, por ejemplo, que el empaque \(\text{A}\) dio lugar a un pH mayor que el \(\text{B}\) y que los empaques \(\text{C}\) y \(\text{D}\) mantuvieron la pulpa con valores intermedios de pH. Aparentemente, con ello quedaría todo dicho, no siendo necesario ni el ANOVA, ni ninguna otra técnica adicional.

Debe tenerse en cuenta, sin embargo, el alcance de tales respuestas. ¿Deseamos comparar entre sí las tres porciones de pulpa que se almacenaron con cada uno de los tipos de empaques o el efecto de tales empaques sobre futuras porciones de pulpa?

Desde luego, existe muy poco interés en las 12 porciones circunstanciales de pulpa usadas en el presente ensayo, las cuales, aunque suministran información importante, se vuelven prescindibles después del ensayo. El interés del investigador radica en la generalización que pueda hacerse del comportamiento de tales porciones de pulpa cuando son almacenadas con diferentes tipos de empaques.

Cada subconjunto de tres porciones de pulpa que es almacenado con un determinado sistema de empaque representa una muestra. La población es el universo de pulpas almacenadas con un sistema de empaque determinado (cf. secciones 3.9 y 6.2). Las medias muestrales que aparecen en la última columna de la tabla 7.1 suministran información de cada una de las cuatro muestras.

Aunque las afirmaciones que podrían hacerse con respecto a cuáles muestras tuvieron mayor o menor pH medio son válidas para tales muestras, no pueden generalizarse de manera automática a las poblaciones que representan.

Tales afirmaciones tienen un carácter descriptivo. Más allá de que las diferencias observadas puedan parecerle interesantes al usuario del estudio, ello no implica que sean estadísticamente significativas, esto es, que puedan generalizarse con un grado de incertidumbre controlado a las poblaciones que representan (cf. sección 3.9.2.6).

En el ámbito investigativo, los experimentos tienen una intención inferencial, es decir que se busca generalizar los patrones observados en las muestras a las correspondientes poblaciones. Consecuentemente, se requieren herramientas inferenciales, como el análisis de varianza, las cuales brindan el marco teórico para realizar dichas generalizaciones con baja probabilidad de error.

Antes de proceder con la parte operativa del ANOVA, es importante considerar el alcance de las conclusiones que se deriven de este.

Anteriormente se hacía referencia a la población del presente ejemplo, de manera deliberadamente general, como el universo de pulpas almacenadas con un sistema de empaque determinado.

¿Esto cubrirá las pulpas de guanábana de todas las variedades, de cualquier condición de madurez, cultivadas con cualquier sistema de manejo, en cualquier tipo de suelo, en cualquier época y en cualquier lugar del mundo?

Con toda seguridad, sería demasiado ambicioso e ingenuo pretender que tres porciones de pulpa de guanábana lograran representar tal diversidad de condiciones. El investigador deberá tener en cuenta tales aspectos para definir la validez externa de su experimento y, si fuera del caso, tendría que ampliar la cobertura de sus muestras y/o realizar experimentos adicionales (cf. sección 6.1.4).

Este tipo de consideraciones pone de manifiesto la necesidad de emplear procedimientos inferenciales, como el análisis de varianza.

Para la realización manual del ANOVA se siguen una serie de pasos: el cálculo de las sumas de cuadrados, de los grados de libertad, de los cuadrados medios, del estadístico \(F\) y del valor p. Esta información suele presentarse en una tabla resumen.

El modelo del ANOVA de una vía considera que la variabilidad total se particiona en dos únicas fuentes: tratamientos y error. A continuación, se calculan las sumas de cuadrados, usando las fórmulas operacionales presentadas en la sección 6.2.2 (expresiones 6.10, 6.11 y 6.12), empezando por el cálculo del término de corrección.

\[ C=\frac{Y_{\bullet\bullet}^2}{n}=\frac{(4.3+3.9+4.1+\dotsb+3.9)^2}{3\times4}=\frac{45^2}{12}=168.75 \]
Se obtiene a continuación la suma de cuadrados total:

\[ \begin{align} \text{SCT}&=\sum\limits_{i=1}^k\sum\limits_{j=1}^r{Y_{ij}^2}-\frac{Y_{\bullet\bullet}^2}{n}\\[1.4em] &=(4.3^2+3.9^2+4.1^2+\dotsb+3.9^2)-C\\[1.4em] &=170.30-168.75\\[1.4em] &=1.55\\[1.4em] \end{align} \]
La suma de cuadrados de tratamientos se obtiene como: \[ \begin{align} \text{SCttos}&=\frac{\sum\limits_{i=1}^k{Y_{i\bullet}^2}}{r}-\frac{Y_{\bullet\bullet}^2}{n}\\[1.4em] &=\frac{12.3^2+9.6^2+11.4^2+11.7^2}{3}-C\\[1.4em] &=\frac{510.3}{3}-168.75\\[1.4em] &=1.35 \end{align} \]

¿¡No hubiera quedado mejor con los totales!?

La inclusión en la tabla 7.1 de una columna con los totales de los tratamientos facilitaría su visualización para el cálculo de la \(\text{SCttos}\). De hecho, así suele presentarse cuando se ilustra la realización manual del ANOVA.

En este ejemplo se prefirió omitir dicha columna para no desviar la atención y centrarla en el alcance interpretativo de los promedios muestrales que se discutió anteriormente.

La suma de cuadrados del error se obtiene por diferencia:

\[ \begin{align} \text{SCE}&=\text{SCT}-\text{SCttos}\\[1.4em] &=1.55-1.35\\[1.4em] &=0.20 \end{align} \]
Los grados de libertad se obtienen con base en las expresiones compiladas en la nota 6.3.

\[ \begin{align} \text{glT}&=n-1=11\\[1.4em] \text{glttos}&=k-1=3\\[1.4em] \text{gle}&=11-3=8 \end{align} \]
Los cuadrados medios se calculan como la razón entre las sumas de cuadrados y sus correspondientes grados de libertad, usando las expresiones 6.14 y 6.15.

\[ \text{CMttos}=\frac{\text{SCttos}}{k-1}=\frac{1.35}{3}=0.45 \]
\[ \text{CME}=\frac{\text{SCE}}{n-k}=\frac{0.20}{8}=0.025 \]
El estadístico de prueba se calcula como la razón entre el \(\text{CMttos}\) y el \(\text{CME}:\)

\[ F_{\text{c}}=\frac{\text{CMttos}}{\text{CME}}=\frac{0.45}{0.025}=18 \]
Bajo la hipótesis nula, el estadístico de prueba sigue una distribución \(F_{(3, 8)}.\) El valor p se obtiene como el área a la derecha del estadístico calculado en dicha distribución (cf. figura 6.10).

pf(18, 3, 8, lower.tail = FALSE)

[1] 0.0006459601

La tabla 7.2 condensa la información anterior.

Tabla 7.2: Tabla resumen del análisis de varianza para el ejemplo 7.1

Fuentes de variación	Grados de libertad	Sumas de cuadrados	Cuadrados medios	Estadístico \(F\)	Valor p
Tratamientos	3	1.35	0.45	18.0	0.000646
Error	8	0.20	0.025
Total	11	1.55

Usando el código 7.1 en R, se obtiene la tabla resumen del análisis de varianza:

Código 7.1

data <- readxl::read_excel("ejemplo 7.1.xlsx")
data$tto <- factor(data$tto)
anova <- aov(pH ~ tto, data = data)
summary(anova)

Mediante la línea 1 del código 7.1, se importa la información correspondiente a la tabla 7.1, desde el archivo Excel ejemplo 7.1.xlsx.

¿¡Pero es distinta!?

La información de la tabla 7.1 es la misma que aparece en el archivo ejemplo 7.1.xlsx; lo único que cambia es la manera en la que se organiza.

La información tabular, como la que se muestra en la tabla 7.1, es adecuada para visualizar los resultados y para realizar cálculos manuales, pues se presta para obtener totales y promedios en los márgenes de la tabla. Este formato es el que suele emplearse en tablas de resumen y en libros de texto.

El formato de base de datos, como el empleado en el archivo ejemplo 7.1.xlsx, en el que la información se organiza con una columna por factor o variable y una observación por fila, es el estándar para análisis de datos mediante algún software.

Aunque el proceso para pasar del formato tabular al de base de datos suele ser relativamente sencillo, puede verse afectado por errores de manipulación. La función personalizada tb2db facilita este proceso.

La línea 2 del código 7.1 define el vector de tratamientos como un factor.

¡Hágalos factor!

En el presente contexto, los tratamientos son variables de clasificación. Consecuentemente, deben estar definidos en R como objetos de la clase factor (cf. R paso a paso).

Aunque algunas funciones como aov realizan la coerción automática desde character a factor, algunos otras, como plot¹, no aplican coerción.

En adición, la coerción automática no se da cuando los tratamientos están identificados con símbolos numéricos, en cuyo caso, se importan como vectores de la clase numeric.

Por lo anterior, se recomienda definir explícitamente los tratamientos como factores.

La línea 3 del código 7.1 es la instrucción central. La función aov{stats} ajusta el modelo de ANOVA y lo guarda en un objeto de las clases aov y lm, desde el cual puede recuperarse la información del modelo. En el presente ejemplo, dicho objeto se llama anova.

El primer argumento de la función aov es una fórmula con el formato general respuesta ~ tratamientos. Mediante el argumento data se especifica el data frame desde el cual se lee la información.

Finalmente, mediante la línea 5 del código 7.1 se ejecuta la función summary, que extrae el resumen del objeto anova, es decir, la tabla resumen del ANOVA.

Esta tabla reproduce la obtenida previamente por cálculo manual, con ligeras variaciones en el formato.

            Df Sum Sq Mean Sq F value   Pr(>F)    
tto          3   1.35   0.450      18 0.000646 ***
Residuals    8   0.20   0.025                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Una de las diferencias más notorias es la omisión de la fila de totales. Aunque esta resulta útil en el procedimiento manual, no aporta información de carácter inferencial.

En la última línea se presentan códigos de significancia, comunes en muchas salidas de R, que se interpretan con base en lo indicado en la tabla 7.3:

Tabla 7.3: Interpretación de los códigos de significancia en las salidas de R

Símbolo	Valor p
\(***\)	\(0 < \text{p} \le 0.001\)
\(**\)	\(0.001 < \text{p} \le 0.01\)
\(*\)	\(0.01 < \text{p} \le 0.05\)
\(.\)	\(0.05 < \text{p} \le 0.1\)
\(\text{Ningún símbolo}\)	\(\text{p} > 0.1\)

Aunque en el presente ejemplo —en el que se contrasta un único juego de hipótesis y se obtiene, por tanto, un solo valor p— tales códigos no aportan información adicional, estos pueden llegar a ser útiles en tablas de resultados con múltiples valores p, guiando rápidamente hacia los valores de interés.

En cualquier caso, el usuario puede evitar la aparición de tales códigos mediante la instrucción options(show.signif.stars = FALSE).

Antes de interpretar los resultados de cualquier técnica inferencial y proceder con el análisis, el investigador debe evaluar la solidez de los resultados obtenidos; en otras palabras, debe validar los supuestos del correspondiente modelo estadístico.

Los supuestos susceptibles de validación para el modelo del ANOVA de una vía, con esquema de aleatorización completamente al azar son la normalidad de los errores y la homogeneidad de varianzas dentro de los tratamientos (cf. sección Sección 6.3).

Para evaluar el supuesto de normalidad, se usa la prueba de Shapiro-Wilk sobre los residuales del modelo (cf. secciones 4.1 y 6.3.2), los cuales se extraen en R mediante la función resid.

Se enfatiza que la normalidad se evalúa sobre los residuales del modelo; no sobre la variable respuesta (cf. sección 6.3.2).

shapiro.test(resid(anova))


    Shapiro-Wilk normality test

data:  resid(anova)
W = 0.92745, p-value = 0.3538

Puesto que el valor p de la prueba de Shapiro-Wilk (0.3538) es mayor que \(\alpha=0.01,\) no se rechaza la hipótesis nula. En otras palabras, no se tienen evidencias de desviaciones severas del supuesto de normalidad. Por ende, no se consideran necesarias acciones correctivas ni alternativas.

A continuación, se evalúa el supuesto de homocedasticidad, siguiendo las pautas indicadas en la sección 6.3.3.1. Inicialmente se ilustra el cálculo manual de la prueba de Levene centrada en la mediana, también denominada prueba de Brown-Forsythe.

La tabla 7.4 presenta las desviaciones absolutas entre cada una de las lecturas y la mediana de su correspondiente grupo.

Tabla 7.4: Desviaciones absolutas entre las lecturas de pH y la mediana del grupo para el ejemplo 7.1

Tratamiento	\(\|Y_{ij}-\widetilde{Y}_{i\bullet}\|\)			\(\widetilde{Y}_{i\bullet}\)
\(\text{A}\)	0.2	0.2	0	4.1
\(\text{B}\)	0	0.1	0.1	3.2
\(\text{C}\)	0.1	0.1	0.1	3.8
\(\text{D}\)	0.2	0.2	0	3.9

La prueba de Levene consiste en realizar un ANOVA sobre las desviaciones absolutas que se presentan en la tabla 7.4. Todos los componentes de dicho análisis se calculan tal y como se ilustró anteriormente para los datos de la tabla 7.1. Los resultados se condensan en la tabla 7.5.

Tabla 7.5: ANOVA sobre las desviaciones absolutas entre las lecturas de pH y la mediana del grupo: prueba de Brown-Forsythe, para los datos del ejemplo 7.1

Fuentes de variación	Grados de libertad	Sumas de cuadrados	Cuadrados medios	Estadístico \(F\)	Valor p
Tratamientos	3	0.01333	0.004444	0.533	0.672
Error	8	0.06667	0.008333
Total	11	0.20667

Puesto que el valor p (0.672) es mayor que \(\alpha=0.01,\) no se rechaza la hipótesis de homogeneidad de varianzas. En otras palabras, no se tienen elementos que evidencien desviaciones severas del supuesto de homocedasticidad y, consecuentemente, no se consideran necesarias acciones correctivas ni alternativas.

La prueba de Levene puede calcularse automáticamente en R, mediante la función LeveneTest{car}.

library(car)
leveneTest(pH ~ tto, data = data)

Se obtiene el siguiente resultado, el cual coincide con el de la tabla 7.5, pero omitiendo la información irrelevante.

Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  3  0.5333 0.6722
       8

Puesto que no se han detectado desviaciones severas de los supuestos de normalidad y homogeneidad de varianzas, se procede al análisis de los resultados del experimento.

¿¡Al 1 %!?

El empleo de \(\alpha=0.01\) en las pruebas de normalidad y homocedasticidad se sustenta en la robustez del ANOVA ante desviaciones leves de estos supuestos.

Este aspecto se discute en el ejemplo 4.1 y las secciones 6.3.2 y 6.3.3.1.

Salvo que se sustente alguna condición especial, el estándar para evaluar la significancia del análisis de varianza es \(\alpha=0.05.\)

En el presente ejemplo, dado que el valor p obtenido (0.000646) es menor que 0.05, se rechaza la hipótesis nula al nivel de significancia del 5 %.

Mediante el ANOVA se contrasta el siguiente juego de hipótesis:

\[ \mu_{\text{A}}=\mu_{\text{B}}=\mu_{\text{C}}=\mu_{\text{D}}=\mu \] \[ \mu_i \ne \mu_{i'} \text{ para al menos un par } (i,i') \]

¿¡Y las varianzas!?

Al estudiar el ANOVA, su lógica y el uso de un estadístico basado en la distribución \(F,\) se hace notar que el mecanismo subyacente es la comparación de la variabilidad entre tratamientos contra variabilidad dentro de tratamientos. Asimismo, se hace notar que el juego de hipótesis para las varianzas es equivalente al juego de hipótesis para la comparación de múltiples medias (cf. sección 6.2.6).

No obstante, para fines prácticos, el ANOVA se presenta e interpreta únicamente en términos de comparación de medias.

Este juego de hipótesis contrasta las medias poblacionales de la respuesta evaluada, es decir, el pH medio de la pulpa de guanábana en los diferentes tipos de empaques.

Así, la hipótesis nula plantea que el pH medio es el mismo, sin importar el tipo de empaque, mientras que la hipótesis alternativa plantea la posibilidad de que el pH medio de la pulpa de guanábana difiera entre al menos dos de los empaques comparados.

La significancia del ANOVA permite concluir que el pH medio de la pulpa de guanábana, evaluado tras 7 días, en condiciones de anaquel, a 14ºC difiere, a nivel poblacional, entre al menos dos de los sistemas de empaque evaluados.

Esto suele expresarse diciendo que el ANOVA es significativo o que hay efecto significativo de los tratamientos. Esta afirmación puede interpretarse de dos maneras: una más formal, basada en el modelo teórico, y otra más aplicada referida a las poblaciones de campo.

Desde el punto de vista teórico, un efecto significativo de tratamientos quiere decir que al menos uno de los \(\tau_i\) del modelo de efectos difiere de cero (cf. expresión 6.7).

En la práctica esto significa que al menos uno de los sistemas de empaque ejerció un efecto diferencial sobre el pH medio de la pulpa de guanábana, con respecto a los demás.

Para tener una mejor idea de las características de las muestras, puede usarse —como herramienta descriptiva— un diagrama de caja y bigotes con una representación para cada uno de los tratamientos (cf. sección 2.3.6).

En R, la siguiente instrucción² genera el diagrama de la figura 7.2.

Figura 7.2: Diagrama de caja y bigotes por tratamiento para los datos el ejemplo 7.1

Dada la significancia del ANOVA, ¿el usuario puede estar absolutamente convencido del efecto de los tratamientos a nivel poblacional?

La respuesta corta es no. Ni en este ejemplo ni en ninguna otra situación en la que se haga uso de una técnica inferencial puede tenerse certeza absoluta sobre la validez de los resultados. Siempre existe una probabilidad de errar, sea que se rechace o no la hipótesis nula (cf. tabla 3.4).

No obstante, se ha establecido la convención de destacar aquellos resultados cuya probabilidad de aparición por azar es muy baja. Ya desde la época de Fisher se ha usado un valor probabilístico de 0.05 como referente de baja probabilidad (cf. tip 3.3).

El valor p se calcula como la probabilidad de obtener bajo la hipótesis nula una razón de varianzas igual o más extrema que la observada. Puede interpretarse como la probabilidad —en el contexto del experimento observado— de incurrir en un error al rechazar la hipótesis nula con base en la información de la muestra.

En el contexto del presente ejemplo, el investigador puede interpretar este resultado como una probabilidad de 0.000646 de incurrir en un error al formular sus conclusiones sobre las diferencias de medias o los efectos de los tratamientos. Por tanto, aunque existe una probabilidad de errar mayor que cero —lo que impide avalar la absoluta veracidad de la conclusión—, se considera que dicha probabilidad es baja.

Es necesario tener presente que, además de la significancia estadística, debe valorarse la significancia práctica para la toma de decisiones (cf. sección 3.9.2.6).

Una vez establecido que el ANOVA es significativo —es decir, que existen diferencias entre al menos dos medias— el usuario naturalmente querrá saber entre cuáles medias se presentan dichas diferencias.

Los procedimientos de comparación múltiple permiten responder esta pregunta. Dada su extensión, complejidad y carácter transversal —en cuanto a su aplicación a los distintos esquemas de aleatorización—, se desarrollan en un capítulo aparte, donde se retoma el presente ejemplo para ilustrar su aplicación (cf. capítulo 8).

7 ESQUEMAS DE ALEATORIZACIÓN

7.1 Esquema de aleatorización completamente al azar

7.2 Equema de aleatorización en bloques al azar

7.3 Esquema de aleatorización en cuadro latino

Referencias bibliográficas