Métodos Estadísticos para la Investigación

Autor/a

Guillermo Correa-Londoño

PREFACIO

Este libro está concebido como una guía para la elección, aplicación e interpretación fundamentadas de algunas de las técnicas estadísticas más usuales en la práctica investigativa.

La presentación formal de las técnicas está condimentada con algunas de las experiencias acumuladas durante más de 30 años de docencia y consultoría estadística en trabajos de investigación aplicada. Gran parte de estas experiencias se han forjado principalmente en el ámbito de las ciencias agrarias, habiéndose enriquecido también por retos provenientes de disciplinas como la biotecnología y la industria alimentaria.

Aunque la inferencia estadística es el eje central que estructura todos los contenidos, se trasciende la presentación de sus mecanismos, abordándola desde el punto de vista del investigador: enfatizando en las interpretaciones y los alcances de la misma, y previniendo sobre interpretaciones y usos particularmente inadecuados.

Con el fin de evitar en lo posible que el lector se vea obligado a interrumpir su estudio recurriendo a textos en los que se cubran los conceptos básicos que sirven de base a las técnicas inferenciales, tales aspectos han sido recogidos en los tres primeros capítulos, en especial en el tercero, el cual está dedicado en su totalidad al desarrollo del marco conceptual de la inferencia estadística, lo que permite desarrollar los contenidos subsiguientes con mayor fluidez. El lector podrá remitirse a los capítulos iniciales siempre que sea necesario.

Aunque en la mayoría de los ejemplos se detalla, paso a paso, el desarrollo matemático de las técnicas expuestas, esto se hace con el único fin de propiciar un mejor entendimiento y facilitar una eventual adaptación de las técnicas o de los resultados generados por los programas estadísticos. No obstante, la aplicación “manual” de los métodos estadísticos no tiene sentido en la práctica investigativa ni por eficiencia ni por seguridad, debido a la cantidad de información que suele manejarse, a la complejidad y/o extensión de algunos cálculos y a la potencia computacional de la que gozamos hoy en día.

Consecuentemente, no se presentan secciones de ejercicios enfocadas en fortalecer la habilidad matemática, sino que se enfatiza, a través de ejemplos cuidadosamente seleccionados, en los aspectos conceptuales más relevantes al aplicar y evaluar métodos estadísticos: lo adecuado o inadecuado que resulte su uso en un contexto determinado, la forma en la que se presenten las conclusiones y el alcance de las mismas, indicando en todos los casos la forma de realizar los correspondientes procedimientos en el lenguaje de programación R.

Si bien el presente texto tampoco tiene por objetivo fortalecer las habilidades de programación, dado que muchos textos especializados están enfocados en ello, estas habilidades sí se consideran altamente deseables. Se recomienda, por tanto, la revisión juiciosa del código R, la consulta de otras fuentes bibliográficas y la adaptación a las particularidades de la investigación. Quien no esté familiarizado con este lenguaje, puede tener un primer acercamiento al mismo a través del texto introductorio R paso a paso (Correa-Londoño, 2025).

Para facilitar la visualización, tanto el código R como las salidas generadas se diferencian del texto ordinario mediante el uso de fuentes y resaltados especiales:

El código se ve así:

x <- c(1, 3, 6, 9, 11)
var(x)

Las salidas se ven así:

[1] 17

Frecuentemente el código y el resultado generado aparecen juntos, sin que medie ningún comentario entre estos, así:

x <- c(1, 3, 6, 9, 11)
var(x)
[1] 17

En ocasiones pueden aparecer anotaciones referidas a una o más líneas de código, así:

1créditos <- c(5, 3, 2, 3)
2nota <- c(3.0, 3.5, 4.2, 3.6)
3weighted.mean(nota, créditos)
1
Vector con los factores de ponderación.
2
Vector con los valores que se van a promediar.
3
Cálculo del promedio ponderado.

En fragmentos de código extensos puede dificultarse parear el identificador que aparece al frente de la línea con la anotación que aparece en la parte inferior. En tales casos puede resultar útil hacer clic sobre la etiqueta de anotación que aparece en la parte inferior del código (el número encerrado dentro del círculo), con lo cual se resaltará la correspondiente línea de código (¡ensáyelo!). Para desactivar el resaltado, se hace clic nuevamente sobre la etiqueta numérica.

Para verificar el funcionamiento de algún fragmento de código basta con copiarlo y pegarlo en el editor de scripts de RStudio y ejecutarlo desde allí. El copiado podría hacerse de dos formas:

  1. Seleccionando el fragmento de código y copiándolo (Ctrl-C en Windows o Comando-C en Mac)

  2. Haciendo clic en el ícono de copiado que aparece en la parte superior derecha cuando se pasa el puntero por encima del fragmento de código (¡ensáyelo con el código anterior!).

Se recomienda la segunda estrategia, es decir, hacer clic en el ícono de copiado, no solo por ser más expedita, sino principalmente porque así se evita arrastrar las etiquetas de anotación que pudieran estar contenidas en el código, las cuales generarían errores de ejecución (¡Verifíquelo, intentando llevar el código presentado anteriormente al editor de scripts de RStudio mediante el método de copiado tradicional del sistema!).

Para copiar código…

Utilice siempre el ícono de copiado.

La parte central de la mayoría de procedimientos en R puede expresarse mediante unas pocas líneas, por lo que su presentación de manera simultánea con las explicaciones no resulta incómoda. Solo cuando los procesos exigen muchas líneas de programación —como en algunas funciones personalizadas— el correspondiente código se presenta plegado1, pudiendo ser desplegado por el usuario para su revisión, tal y como se muestra a continuación (hacer clic en el triángulo o en la etiqueta):

Cálculo de la varianza
x <- c(1, 3, 6, 9, 11)
var(x)

Esta misma estrategia de plegamiento se usa para temas, desarrollos o discusiones que, aunque permiten una comprensión más profunda de ciertos aspectos, bien podrían obviarse sin comprometer los desarrollos posteriores. Allí se incluye el material que en el formato tradicional de los libros impresos suele presentarse como material complementario.

En ocasiones también se utiliza texto plegado cuando se plantean preguntas, permitiéndole al lector un espacio de reflexión y de elaboración de las respuestas, las cuales podrá verificar desplegando el texto.

El formato digital usado para la escritura de este libro facilita ubicarse y moverse a través de los diferentes contenidos. Por una parte, están los menús de capítulos (a la izquierda) y secciones dentro del capítulo (a la derecha)2, que brindan una panorámica de la obra. Por otra parte, están las referencias internas, que interconectan diversos elementos o apartados del libro (secciones, figuras, tablas, ejemplos, comentarios o ecuaciones), facilitando su revisión y el posterior regreso al punto de partida.

Otra herramienta que facilita la navegabilidad a través del libro es el buscador integrado que aparece en la parte superior izquierda del menú de capítulos.


Al escribir una cadena de caracteres, se muestra el número de documentos (o capítulos3) en los que aparece la cadena buscada, así como la sección específica, bastando con hacer clic en alguno de los resultados para ir a una sección particular. Una vez allí, se precisará la búsqueda usando la herramienta específica del navegador.

¿Y por qué no usar directamente el buscador del navegador?

Para realizar búsquedas en todo el libro es necesario aplicar el procedimiento descrito anteriormente: buscador integrado -> buscador del navegador.

La búsqueda directa a través del buscador del navegador únicamente se realiza dentro del capítulo que se tenga abierto. Esta sería, sin embargo, la estrategia correcta si se deseara restringir la búsqueda al capítulo actual.

Finalmente, vale la pena mencionar que, aunque a lo largo del texto se hace referencia al investigador, este debe entenderse como un término genérico, pues la realidad es que las investigaciones exitosas suelen desarrollarlas grupos multidisciplinarios, en donde se conjugan los esfuerzos de especialistas en diferentes áreas con los del consultor estadístico.

SOBRE EL AUTOR

Guillermo Correa-Londoño es un Ingeniero Forestal que obtuvo su título de Maestría en Estadística en el Colegio de Postgraduados (Texcoco, México) y de doctorado en Estadística Multivariante Aplicada en la Universidad de Salamanca (Salamanca, España). Actualmente es Profesor Titular, adscrito al Departamento de Ciencias Agronómicas de la Facultad de Ciencias Agrarias de la Universidad Nacional de Colombia. Su ámbito de desempeño está relacionado principalmente con investigación aplicada en ciencias agrarias y biotecnología.

email: gcorrea@unal.edu.co
CvLAC
ORC

Otros textos del mismo autor

  • Índice de Condición Integral. Se desarrolla una metodología que desglosa los diferentes procesos involucrados en la construcción de un Índice de Condición Integral, que permite realizar valoraciones a partir de variables complejas en diversos ámbitos. La propuesta está acompañada de un paquete para R.

  • R paso a paso. Este manual introduce al neófito en el fascinante mundo de R y sus posibilidades, iniciando desde cero, hasta llevarlo a un punto en el que programe sus propias funciones personalizadas.

  • Quarto. Se presenta este entorno de trabajo que facilita estructurar de manera elegante un documento que reúne las salidas de R u otros lenguajes, con el código que las genera y los comentarios e interpretaciones redactados por el usuario.

  • Lúzcase con Shiny. Se presentan los fundamentos de la herramienta de construcción de apps basadas en R, que llevan la experiencia del usuario a otro nivel.

Referencias bibliográficas

Correa-Londoño, G. 2025. R paso a paso. 2nd ed. https://gcorrea.quarto.pub/rpap/.

  1. se muestra un triángulo apuntando a la derecha y un título↩︎

  2. La forma en que estos menús se muestran u ocultan depende del dispositivo usado para la visualización.↩︎

  3. El libro está estructurado a través de un documento por capítulo.↩︎