Creando tablas de datos presentados en proporciones

Cuando tenemos unos datos a veces solo estamos interesados en mostrar unos resúmenes de los mismos y no en realizar cálculos estadísticos. Para ello podemos hacer una serie de tablas. Existe una regla general que indica que si queremos ver detalles de datos crearemos tablas. En cambio, si lo que queremos es mostrar efectos generaremos gráficos. Principalmente usaremos tablas cuando alguna de nuestras variables independientes sea categórica, mientras que los gráficos scatterplot o de interacción (figura 1) son los más apropiados cuando se trata de variables independientes continuas. Lo veremos a través de unos ejemplos. Las hojas de cálculo como Excel (Office de Microsoft) u OpenOfficeCalc (Apache) proporcionan una herramienta fantástica muy rápida para generar tablas con nuestros datos: las tablas dinámicas o pivotales. Sin embargo, R no se queda atrás y proporciona muchas utilidades para crear tablas a través de varias de sus librerías.

TABLAS EN R

Lo primero que necesitamos para crear tablas son datos. Para ello abriremos R y RCommander (recordad que se abre desde la consola principal de R con “library(Rcmdr)”) y, como siempre, descargaremos el archivo “tabla.csv” de nuestro blog (http://testsndtrials.blogspot.com.es/). Denominaremos al conjunto de datos “Tabla”.
Una vez cargados los datos exploraremos el archivo a través de “Estadísticos/Resúmenes/Conjunto de datos activo” y obtendremos un resumen con la información de cada variable. Tenemos cuatro variables categóricas: el ciclo de la cerda, el año y el espesor de grasa dorsal en gestación y en lactación. Estas dos últimas variables se han categorizado en tres niveles, pero también existen dos variables cuantitativas que corresponden a su valor en milímetros. En nuestro ejemplo trabajaremos con la variable nacidos totales (nt) como variable dependiente o explicada. En primer lugar, vamos a conocer la media de nacidos totales según el ciclo, el año o el espesor de grasa dorsal en gestación. RCommander no habilita ninguna función para la realización de estas tablas, así que tendremos que escribir un código muy sencillo en la pantalla que nos reportará grandes resultados. Por ejemplo, la instrucción:





nos dará la media de nacidos totales por ciclo:





Podemos ser más ambiciosos y pedir las medias de nacidos totales de las dos variables categóricas (ciclo y año) en una sola instrucción:

 y obtendremos esta tabla:

 Podemos observar que en 2015 no hubo partos del ciclo 6 (NA). Complicándolo más, si queremos saber las medias de los nacidos totales en función del nivel de grasa dorsal en la gestación, la instrucción:
nos genera la siguiente tabla encadenada:
De la misma forma que hemos hallado la media podemos obtener la mayoría de los estadísticos que queramos (desviación estándar, máximo, mínimo, etc.). La función “ftable” hace lo mismo que acabamos de describir, pero con un resultado más elegante que incluye la desviación estándar.
 Dejamos al lector la posibilidad de experimentar
con estas instrucciones por sí mismo.
Por otro lado, podemos agrupar en una sola función, por ejemplo, la media y la desviación estándar de nuestras variables. Así, creamos un objeto denominado “dstats”:
 
y obtendremos la media y desviación estándar de
los lechones nacidos totales por ciclo:
La librería “doBy” es más completa y nos permite obtener estadísticos por grupo. Es probable que
esta librería se tenga que instalar, como ocurrió con el paquete “Rcmdr” (ver Suis 87). Por ejemplo, la siguiente instrucción nos genera una tabla completa resumen de lo que vemos hasta ahora:


CON EXCEL TAMBÍEN

Veamos ahora cómo lo hacemos con Excel. En primer lugar abrimos el archivo "tabla.csv" con Excel. Para ello lo marcamos con el botón derecho del ratón, elegimos la opción "Abrir con" y elelgimos "Excel". Iremos entonces a "Insertar/Tabla dinamica" y seleccionamos el rango que ocupan nuestros datos con el desplegable o escribiendo “Tabla!$A$1:$N$82”. Debemos indicar que la tabla dinámica se tiene que abrir en una nueva hoja de cálculo. A partir de aquí es donde podemos comenzar a crear tablas. Elegimos ahora la variable “ciclo” y la arrastramos hasta la casilla “Rótulos de columna”. Llevamos a la casilla “Valores” la variable “nt”. Una vez ahí, abriendo el desplegable de “Valores” elegimos la opción “Promedio” y generaremos la tabla 1 (figura 2). Ahora llevamos la variable “ciclo” a la casilla “Rótulos de fila” y en el desplegable de “Valores” elegimos la opción “Desvest” (desviación estándar). Obtendremos la información que aparece en la figura 3. Si queremos un tercer nivel de agrupación, llevaremos la variable “egdges_cat” a la casilla “Filtro de informe” y tendremos entonces la información que hayamos elegido según la categoría del espesor de grasa dorsal. Dejamos al lector experimentar con más posibilidades de las tablas dinámicas, una de las herramientas más útiles de Excel.

Archivo para descargar Tabla.csv

No hay comentarios:

Publicar un comentario