Creando tablas de datos presentados en proporciones
Cuando tenemos unos datos a veces solo estamos interesados en mostrar unos resúmenes de los mismos
y no en realizar cálculos estadísticos. Para ello podemos hacer una serie de tablas. Existe una regla general que indica que si queremos ver detalles de datos
crearemos tablas. En cambio, si lo que queremos es
mostrar efectos generaremos gráficos. Principalmente
usaremos tablas cuando alguna de nuestras variables
independientes sea categórica, mientras que los gráficos scatterplot o de interacción (figura 1) son los más
apropiados cuando se trata de variables independientes continuas. Lo veremos a través de unos ejemplos.
Las hojas de cálculo como Excel (Office de Microsoft) u OpenOfficeCalc (Apache) proporcionan
una herramienta fantástica muy rápida para generar tablas con nuestros datos: las tablas dinámicas
o pivotales. Sin embargo, R no se queda atrás y
proporciona muchas utilidades para crear tablas a
través de varias de sus librerías.
TABLAS EN R
Lo primero que necesitamos para crear tablas son datos. Para ello abriremos R y RCommander (recordad que se abre desde la consola principal de R con “library(Rcmdr)”) y, como siempre, descargaremos el archivo “tabla.csv” de nuestro blog (http://testsndtrials.blogspot.com.es/). Denominaremos al conjunto de datos “Tabla”.
Una vez cargados los datos exploraremos el archivo a través de “Estadísticos/Resúmenes/Conjunto de datos activo” y obtendremos un resumen con la información de cada variable. Tenemos cuatro variables categóricas: el ciclo de la cerda, el año y el espesor de grasa dorsal en gestación y en lactación. Estas dos últimas variables se han categorizado en tres niveles,
pero también existen dos variables cuantitativas que
corresponden a su valor en milímetros.
En nuestro ejemplo trabajaremos con la variable
nacidos totales (nt) como variable dependiente o
explicada. En primer lugar, vamos a conocer la media de nacidos totales según el ciclo, el año o el espesor de grasa dorsal en gestación. RCommander
no habilita ninguna función para la realización de
estas tablas, así que tendremos que escribir un código muy sencillo en la pantalla que nos reportará
grandes resultados. Por ejemplo, la instrucción:
Podemos ser más ambiciosos y pedir las medias de
nacidos totales de las dos variables categóricas (ciclo y año) en una sola instrucción:
y obtendremos esta tabla:
Podemos observar que en 2015 no hubo partos del ciclo 6 (NA). Complicándolo más, si queremos saber las medias de los nacidos totales en función del nivel de grasa dorsal en la gestación, la instrucción:
De la misma forma que hemos hallado la media podemos obtener la mayoría de los estadísticos que queramos (desviación estándar, máximo, mínimo, etc.). La función “ftable” hace lo mismo que acabamos de describir, pero con un resultado más elegante que incluye la desviación estándar.
con estas instrucciones por sí mismo.Por otro lado, podemos agrupar en una sola función, por ejemplo, la media y la desviación estándar de nuestras variables. Así, creamos un objeto denominado “dstats”:
y obtendremos la media y desviación estándar de
los lechones nacidos totales por ciclo:
los lechones nacidos totales por ciclo:
La librería “doBy” es más completa y nos permite obtener estadísticos por grupo. Es probable que
esta librería se tenga que instalar, como ocurrió con el paquete “Rcmdr” (ver Suis 87). Por ejemplo, la siguiente instrucción nos genera una tabla completa resumen de lo que vemos hasta ahora:
esta librería se tenga que instalar, como ocurrió con el paquete “Rcmdr” (ver Suis 87). Por ejemplo, la siguiente instrucción nos genera una tabla completa resumen de lo que vemos hasta ahora:
CON EXCEL TAMBÍEN
Veamos ahora cómo lo hacemos con Excel. En primer lugar abrimos el archivo "tabla.csv" con Excel. Para ello lo marcamos con el botón derecho del ratón, elegimos la opción "Abrir con" y elelgimos "Excel". Iremos entonces a "Insertar/Tabla dinamica" y seleccionamos el rango que ocupan nuestros datos con el desplegable o escribiendo
“Tabla!$A$1:$N$82”. Debemos indicar que la
tabla dinámica se tiene que abrir en una nueva
hoja de cálculo.
A partir de aquí es donde podemos comenzar a
crear tablas. Elegimos ahora la variable “ciclo” y la
arrastramos hasta la casilla “Rótulos de columna”.
Llevamos a la casilla “Valores” la variable “nt”.
Una vez ahí, abriendo el desplegable de “Valores”
elegimos la opción “Promedio” y generaremos la
tabla 1 (figura 2).
Ahora llevamos la variable “ciclo” a la casilla “Rótulos de fila” y en el desplegable de “Valores” elegimos la opción “Desvest” (desviación estándar).
Obtendremos la información que aparece en la
figura 3.
Si queremos un tercer nivel de agrupación, llevaremos la variable “egdges_cat” a la casilla “Filtro de
informe” y tendremos entonces la información que
hayamos elegido según la categoría del espesor de
grasa dorsal.
Dejamos al lector experimentar con más posibilidades de las tablas dinámicas, una de las herramientas más útiles de Excel.
Archivo para descargar Tabla.csv
Comentarios
Publicar un comentario