martes, 1 de diciembre de 2015

Exploración y representación de datos

En el artículo anterior vimos cómo cargar el paquete R y cómo instalar la interfaz RCommander en nuestro ordenador, que nos facilitará la ejecución de nuestros análisis estadísticos y nuestros gráficos (la que descargamos es sólo una de las disponibles; para ver las diferentes interfaces que se están desarrollando en R se puede visitar http://www.scieviews.org/_gui). En este artículo vamos a activar inmediatamente RCommander y comenzaremos a trabajar en más análisis estadísticos, manejo de datos y nuevos gráficos.
Para continuar leyendo el articulo visite este link Exploración y representación de datos donde estará el articulo completo y archivos realizar la prueba que se propone.

miércoles, 7 de octubre de 2015

Introducción a R


La vida es una toma de decisiones constante. Tenemos que decidir entre un tratamiento con un fármaco determinado u otro, o entre dos sistemas de nutrición o entre dos niveles de lisina. Todo son toma de decisiones. Y no queremos errar en la decisión. Pero, ¿qué circunstancias son las que nos hacen tomar una decisión u otra? ¿En qué nos basamos ? ¿Con qué probabilidad de acierto tomamos esa decisión?. Muchas de las decisiones de nuestra vida  profesional las tomamos “porque me parece” o “porque creo que”. ¿No es un poco ilógico que en pleno siglo XXI tomemos decisiones basadas en creencias y no apoyando nuestra decisión en un razonamiento basado en hechos y en datos que nos den unas probabilidades de acertar en nuestra decisión?.

Teniendo en mente  la toma de decisiones basadas en datos, nos gustaría,  ayudar a todos aquellos que quieran aprender técnicas para tomar decisiones con la más alta probabilidad posible de acertar. Para ello vamos a utilizar las mejores herramientas de las que disponemos hoy en día en la toma de decisiones basadas en datos, los programas informáticos creados para ser utilizados en ordenadores personales.

Queremos presentarles a R
¿Qué es R? R es una aplicación informática de libre distribución, gratuita con versiones para Windows, Mac OS X y Linux creada  a finales de los años 90 y clónica del paquete no gratuito S-Plus que es un compendio de aplicaciones estadísticas. R son las iniciales de dos profesores de la Universidad de Auckland, Nueva Zelanda,  Ross Ihaka y Robert Gentleman, que a partir de S-Plus (desarrollado por AT$T's Bell Laboratories) hicieron una plataforma para usar en tareas docentes. A partir de 1995 dicha plataforma se convirtió en una aplicación estadística de distribución gratuita.

R no es un programa de estadística como otros  tanto para estadística como  para otras aplicaciones. R es una herramienta gigantesca y poderosa con muchas aplicaciones diversas de todos los campos de la ciencia y con un enorme número de funciones gráficas disponibles. En los últimos recuentos, se han descrito más de 50.000 diferentes funciones que hacen de R uno de los más gigantescos desarrollos actualmente realizados por la comunidad científica mundial.

Pero para no aburrirles comenzaremos con descargarnos el programa, instalarlo en nuestro ordenador y comenzar a interactuar con alguna de sus múltiples aplicaciones que podrán utilizar rápidamente en su labor cotidiana.


INSTALACIÓN DE R

 

Primero empezamos descargando R.

Nosostos utilizaremos la version para Windows para esta introducción a R, asi que descargamos la versión que pone:


Si utiliza otro sistema operativo descarge el que usted utilice.

En la siguiente pantalla, clicar sobre:

install Rfor the first time (instalar R por primera vez)

y en la siguiente pantalla, clicar sobre:


Una vez descargado el paquete en el directorio elegido en nuestro ordenador, haremos doble clic sobre el fichero descargado y R quedará instalado en nuestro ordenador.

Una vez instalado, su ejecución es como la de cualquier otro programa, doble (o simple) clic sobre R y  aparecerá la pantalla inicial de R.

 

NUESTRA PRIMERA EXPERIENCIA CON R

 

Nuestra primera experiencia con R va a ser para demostrar la potencia gráfica y la facilidad de uso del paquete; nos gustaría que este primer contacto atraiga su atención. Lo que vamos a hacer con este código que vamos a proporcionar a continuación es generar tres gráficos en uno. En el eje de abcisas o eje X vamos a tener la variable “Coste de un kg de pienso” y en el eje de ordenadas o eje Y pondremos la variable “Índice de conversión”. Con ambas variables dibujaremos un gráfico de dispersión, y a la vez tendremos el diagrama de caja (boxplot) de cada una de ellas.

En primer lugar, hay que abrir R como cualquier otro programa (en Windows desde el menú de inicio o el icono que se ha instalado en el escritorio) y una vez abierto, en la pantalla que aparece al lado del signo de R que es “>”, hay que introducir el siguiente código (atención: R es muy sensible y requiere todos los signos que aparecen en el código, paréntesis, comas, mayúsculas y minúsculas).
Las líneas que comienzan con # son explicaciones de lo que hace R y no hace falta copiarlas, aunque si se incluyen tal y como están no pasa nada (el símbolo # delante de una línea le indica a R que el texto que hay a continuación es un comentario):


ic<-c(2.90, 2.82, 2.56, 2.78, 2.98, 3.01)
 #cargamos los datos del índice de conversión de 6 granjas de cerdos
cos<-c(38.50, 38.75, 41.00, 41.03, 40.00, 35.40)
 #cargamos el coste por kg de pienso de cada una de las granjas anteriores en el mismo  #orden
opar<-par(no.readonly=TRUE)
 #le decimos a R que vamos a modificar las características de la creación de gráficos,
par(fig=c(0, 0.8, 0, 0.8))
 #donde queremos el gráfico principal,
plot(cos, ic, xlab="Coste de un kg de pienso", ylab="Indice de conversión")
 #le decimos que construya un gráfico con la variable “cos” en ordenadas y la variable “ic”  #en abcisas  
par(fig=c(0, 0.8, 0.55, 1), new=TRUE)
 #dónde queremos el gráfico boxplot, sobre el gráfico,
boxplot(cos, horizontal=TRUE, axes=FALSE)
 #que dibuje el boxplot con la variable cos,,
par(fig=c(0.65, 1, 0, 0.8), new=TRUE)
 #dónde queremos el boxplot, en el lateral del gráfico,
boxplot(ic, axes=FALSE)
 #que dibuje el boxplot con la variable ic,
mtext("Scatterplot mejorado", side=3, outer=TRUE, line=-3)
 #que inserte la leyenda y dónde
par(opar)
 #que hemos terminado de definir las características del gráfico.

Una vez terminada esta operación, obtendremos el gráfico de esta página. ¿Podrían hacerlo tan rápido con otro tipo de programa?




Para cerrar R hay que escribir:

q()

indicándole que no queremos guardar el área de trabajo

En 49 palabras y 424 caracteres hemos creado un gráfico profesional difícilmente asequible con herramientas como Excel u otras. Pero no hay que asustarse, que no hay que aprender a programar ni nada por el estilo para sacarle un increíble partido al uso de R. Lo veremos en las siguientes entradas.

Pueden visitar la web de R en http://cran.r-project.orgy descargar mucha más información, archivos
de ayuda o incluso manuales de instalación, uso y estadística. Es aconsejable descargar un pdf muy