Rosana Ferrero
Data Scientist
Juan L. López
Data Scientist
En post anteriores te he hablado de R y RStudio, por eso ya sabrás que para mí y para miles de Data Scientists estas herramientas son el támdem perfecto para el análisis estadístico.
Y hoy quiero compartir contigo unos trucos realmente útiles para que importes, manipules y grafiques tus datos de manera sencilla con R/RStudio, ¡en muy pocos pasos y de forma interactiva!
Veremos cómo con una única función o con un solo clic puedes comenzar a analizar tus datos en R/RStudio:
👉 ¡Manos a la obra!
RStudio incluye nuevas características para importar datos de manera interactiva: archivos csv, xls, xlsx, sav, dta, por, sas y stata.
Te voy a mostrar cómo importar tus archivos de manera interactiva en 3 sencillos pasos:
1.SELECCIONA. Elige los datos que quieres importar desde el panel de entorno (ventana superior derecha de R: Environment-> Import Dataset):
Puedes importar 3 tipos de datos:
Podrás ir viendo cómo será el objeto resultante para evitar errores.
IMPORTANTE: El mayor problema con el uso de la opción interactiva es que pierde la reproducibilidad de su código. Si el archivo se va a quedar en el mismo lugar, es mejor copiar y pegar el código que has generado en el lugar donde lo vas a usar.
El visor También te permite mirar dentro de tus datos y realizar algunos análisis exploratorio (EDA) para ayudarte a comprender los datos.
Como te comenté en el caso anterior, cuando importas tus datos de manera interactiva automáticamente se abrirá un visor con los datos importados. En caso de que quieras abrir el visor por ti mismo puedes hacerlo de 2 maneras:
> data(iris)
> View(iris)
Se abrirá una pestaña en la ventana superior izquierda de RStudio, así:
Por ejemplo, para ordenar la tabla según valores crecientes de Sepal.Length:
Aparecerá un triángulo azul para indicarle lo que ha realizado. Si vuelves a pinchar sobre él se ordenarán los datos de manera decreciente según esa columna.
Para eliminar la clasificación y mostrar los datos en el orden en que R lo ve, haz clic en la celda vacía en la esquina superior izquierda.
Cualquier campo que se pueda filtrar tendrá un cuadro blanco etiquetado como «All». Haz clic en este cuadro para cambiar los valores que desea ver. Por ejemplo, para filtrar iris con un ancho de sépalo superior a 3.6:
En la parte inferior de la tabla se indicará cuántos registros contiene el conjunto de datos antes y después del filtrado; en este caso, hemos filtrado 135 registros de un total de 150.
Si aplicas dos filtros de columna, verás solo registros que coincidan con ambos.
Puedes borrar los filtros individuales haciendo clic en (x) al lado del filtro; para borrar todos los filtros a la vez, haga clic en el icono de Filtro en la barra de herramientas.
Puedes buscar un número, un valor lógico (TRUE o FALSE) o un texto en todas las columnas de tus datos escribiendo en el cuadro de filtro global. Por ejemplo, si buscamos los casos que corresponden a la especie virgínica:
IMPORTANTE: Por el momento no es posible extraer la «vista actual» como un objeto R, o guardar en un código R las manipulaciones que hayas realizado de manera interactiva.
La función ggpairs del paquete GGally genera una matriz de gráficos a partir de un conjunto de datos. Automáticamente identifica los tipos de variables que tenemos y las gráficas de manera adecuada. También calcula las correlaciones lineales entre variables numéricas.
Por ejemplo, para los datos de lirios, escribe en la consola:
> library(GGally)
> ggpairs(iris, mapping = aes(colour = Species))
Se generará el siguiente gráfico:
Los gráficos son un paso crucial en el análisis exploratorio de tus datos.
Máster de Estadística Aplicada con R Software IX edición Octubre 2019
ggThemeAssist es un complemento (addin) de RStudio que usa el paquete rstudioapi para brindarte una GUI donde puedes editar tus gráficos ggplot2.
Necesitarás la versión más reciente (estable) de RStudio (v0.99.878 o posterior). Instalar el paquete desde CRAN:
> install.packages(«ggThemeAssist»)
O desde Github usando el paquete devtools:
> if (!requireNamespace(«devtools», quietly = TRUE))
install.packages(«devtools»)
> devtools::install_github(«calligross/ggthemeassist»)
La función ggThemeAssist estará disponible en el menú Addins en RStudio:
Para editar gráficos de ggplot2, simplemente resalte un objeto ggplot2 en su secuencia de comandos actual y ejecute el complemento.
Por ejemplo, para los datos de lirios, puedes escribir en un archivo de código:
> library(GGally)
> library(ggplot2)
> gg<-ggplot(data=iris, aes(x = Sepal.Length, y = Sepal.Width)) +
geom_point(aes(color=Species, shape=Species)) +
xlab(«Sepal Length») + ylab(«Sepal Width») +
ggtitle(«Sepal Length-Width”)
> gg
Subraya el objeto gg y presiona el Addins ggplot Theme Assistant como se muestra en la imagen:
Puedes customizar tu gráfico como quieras, y cuando finalices (Done) se insertará en tu hoja de código las operaciones que has realizado en la notación estándar de ggplot2. Si más adelante necesitas volver a realizar estos pasos, puedes simplemente ejecutar los comandos que has creado.
¡Así de fácil!
Puedes continuar describiendo tus datos con los consejos que te hemos dado en el siguiente post:
Espero que estos trucos te hayan resultado prácticos
¿Quieres compartir los tuyos? Espero tus comentarios.
¡Nos vemos en el próximo post!
Hola. Muy interesante. Estaba realizando su ejemplo
gg gg ggtitle(“Sepal Length-Width”)
Error: unexpected input in » ggtitle(“»
Espero puedan ayudarme. Saludos
Hola Alejandro, muchas gracias por tus palabras y por participar de este post. El mensaje de error te indica que existe una entrada inesperada y que es una comilla. Borra y sustituye las comillas desde la consola de R e intenta volver a ejecutar la orden, debería funcionar sin problemas. Ya me dices si se soluciona. Saludos cordiales y buen comienzo de semana
Gracias por el articulo, son datos muy útiles.
solo quisiera agregar que lamentablemente la web ha interpretado un paréntesis con un emoticón
¡Gracias por el aviso Jaime! Efectivamente cuando menciono el tipo de separador de un archivo de datos, debería decir ; ) y se ha sustituido por un emoticón, lo he editado y se ha solucionado. Saludos