EXPERIENCIAS REALES EN DATA SCIENCE: Creación de aplicaciones web interactivas con Shiny

EXPERIENCIAS REALES EN DATA SCIENCE: Creación de aplicaciones web interactivas con Shiny

nov´22 Rosana Ferrero 0 comentarios

¿Quieres conocer cómo crear aplicaciones web online e interactivas con Shiny para el #DataScience

¿Qué es Shiny? Shiny es un paquete R que crea aplicaciones web interactivas directamente desde R, sin usar HTML, CSS o JavaScript. Shiny permite, a quienes no son profesionales del diseño web, construir rápidamente una página reactiva para explorar información.

¿Quieres conocer un caso espectacular de aplicación web con Shiny? Hoy te presento a nuestro alumno José María Arroyo Sánchez, profesor de informática en SAGRAT COR DE JESUS, Cataluña, y realizó nuestro Máster en Estadística Aplicada para la Ciencia de Datos. En su Trabajo Fin de Máster, José María realizado una aplicación con Shiny para la Estadística Descriptiva Educativa (EDE).

¿Por qué realizar una aplicación con Shiny para la Estadística Descriptiva Educativa? En la realización de cualquier estudio, para el análisis de datos, es necesaria una primera fase, que se basa en la Estadística Descriptiva, cuyo objetivo es el resumen de la información, tanto numéricamente, mediante las correspondientes medidas estadísticas descriptivas, como gráficamente.

"Dado el desconocimiento de la Estadística por parte de muchos investigadores, es de crucial interés el desarrollo de software y de aplicaciones en un entorno que resulte amigable para los usuarios de cualquier ámbito y que les permitan obtener fácilmente los resultados derivados de sus estudios y proyectos."

Dice José María Arroyo Sánchez

Siguiendo esta línea, el objetivo de su TFM fue la realización de una aplicación o herramienta interactiva para la Educación denominada EDE, que permita el análisis descriptivo de un conjunto de datos.

 

En una primera versión de dicha aplicación, al seleccionar conjuntos de datos de R, se proporciona toda la información más relevante acerca de las medidas y gráficos estadísticos sin necesidad de que el usuario tenga conocimientos ni de Estadística ni del lenguaje de programación R. Esta aplicación web EDE 1.0 está alojada en la siguiente URL: https://arrocar.shinyapps.io/EDE_1/

 
 

Para el desarrollo de la aplicación EDE se utilizó el paquete Shiny del software estadístico R, que es un paquete que permite construir aplicaciones web interactivas en base a los correspondientes scripts y códigos en R. Entre las características principales de este tipo de aplicaciones están:

  1. la interactividad, que permite manipular los datos sin tener que cambiar el código en R
  2. que pueden abrirse desde cualquier dispositivo, como el ordenador, la tableta o el móvil
  3. que se pueden aplicar en numerosos ámbitos, como la docencia o la investigación.

Además, para poder crear esta aplicación, o cualquier aplicación con Shiny, es necesario tener por lo menos dos archivos: ui.R: script para la interfaz del usuario que recibe los inputs y muestra los outputs, y server.R: script para la realización de todos los cálculos necesarios. En este caso, puesto que la finalidad de la aplicación EDE es la realización del análisis descriptivo de un conjunto de datos, en el archivo server.R estarán todos los cálculos de las medidas estadísticas descriptivas y de los gráficos obtenidos con R. Por eso, para la implementación de EDE, además del paquete Shiny, se emplearon otros paquetes o funciones específicas de R, como por ejemplo la función o comando de R mean() para el cálculo de la media aritmética de una determinada variable numérica de un conjunto de datos.

En cuanto a la estructura de la aplicación, EDE consta de un total de seis pestañas totalmente operativas:

1. Pestaña 1 (Inicio)

2. Pestaña 2 (Estadística univariante)

3. Pestaña 3 (Estadística bivariante)

4. Pestaña 4 (Análisis correlación)

5. Pestaña 5 (Regresión lineal simple)

6. Pestaña 6 (Estadística multivariante)

 

La pestaña 1 (Inicio) muestra los motivos que han llevado al desarrollo de la aplicación, así como un pequeño resumen sobre la Estadística Descriptiva, concretamente, que medidas y gráficos estadísticos se van a poder obtener con EDE.  Una vez que el usuario ya conoce las funcionalidades de la aplicación, la pestaña 2 (Estadística univariante) permite la creación de un vector aleatorio formado por 50 valores comprendidos entre 0 y 100, pudiéndose repetir los valores, y de forma que cada vez que el usuario haga clic en dicho botón, se genere un nuevo vector aleatorio. Una vez creado el vector, se muestran todos los descriptivos (o medidas estadísticas básicas) y gráficos de la Estadística Descriptiva en un checklist (para poder seleccionar cual o cuales se desee) que se podrán calcular a partir de los valores de dicho vector. Dentro de dichas medidas, están los descriptivos básicos (mínimo, máximo y rango); las medidas de tendencia central (media y mediana), las medidas de dispersión (varianza, desviación típica, coeficiente de variación y coeficiente de correlación) y las medidas de asimetría y curtosis. En cuanto a los gráficos de representación, se pueden obtener el diagrama de cajas, el histograma y el gráfico de densidad. 

Con respecto a la tercera pestaña (Estadística bivariante), en ella se muestran dos conjuntos de datos de muestra en R: cars y pressure, así como el número de observaciones de dichos conjuntos (por defecto aparece el conjunto de datos cars y 5 observaciones, aunque estas opciones se pueden cambiar); y los gráficos de representación para el conjunto de datos también en un checklist. Para uno de los dos conjuntos de datos, el que haya seleccionado el usuario, se puede realizar un resumen descriptivo básico (summary), la visualización del número deseado de observaciones de dicho fichero, los gráficos de cajas y los diagramas de densidad.

La siguiente pestaña, la pestaña 4 (Análisis correlación) permite la visualización de los gráficos de correlación del conjunto de datos, pudiendo elegir entre uno cualquiera de los dos mismos ficheros de datos de la pestaña anterior. Además, se puede realizar un summary del conjunto de datos seleccionado (por defecto cars) y se presenta también un breve resumen del significado del término correlación.  

De modo similar a la pestaña 4, en la pestaña 5 (Regresión lineal simple) se pueden realizar modelos de regresión lineal y los gráficos asociados, a partir de los dos ficheros de datos de las pestañas 3 y 4. Al igual que antes, por defecto se muestra un resumen estadístico del conjunto de datos cars (pero se puede cambiar a los datos pressure) y un breve resumen del concepto regresión lineal.

Finalmente, la pestaña 6 (Estadística multivariante) permite la realización de los gráficos de representación, gráficos de cajas o gráficos de correlación, de los siguientes tres conjuntos de datos de R: rock, iris y mtcars. En suma, por defecto se presenta un resumen descriptivo básico del conjunto rock y sus primeras 5 observaciones (opciones que el usuario puede cambiar como en las pestañas anteriores haciendo clic en el combo y actualizando). 

Esta primera versión presenta algunas limitaciones entre las que se pueden destacar las siguientes: 1) el usuario no puede introducir sus propios datos para hacer las pruebas y análisis estadísticos correspondientes, tanto en la Estadística univariante como en la bivariante y 2) el usuario no puede seleccionar las variables que desee de los ficheros de datos para poder calcular tanto las medidas descriptivas como los gráficos. Estas limitaciones serán solventadas en una actualización de la aplicación, que será la segunda versión EDE 2.0.

 

Con esta aplicación, "un usuario sin experiencia en análisis de datos puede comprender de forma fácil e intuitiva la Estadística Descriptiva, además de obtener los principales estadísticos descriptivos y gráficos, sin perderse en innumerables fórmulas y funciones del lenguaje de programación R", comenta José María.

 

El TFM es una oportunidad para demostrar las cualidades del alumno, ya sea en el entorno de la empresa, o para desarrollar proyectos personales.

Si te gustó conocer esta aplicación de la Ciencia de Datos en el mundo de la enseñanza, comenta y comparte la publicación. ¡Nos encantaría conocer tu opinión!

 

QUIERO EMPEZAR EL MÁSTER DE DATA SCIENCE HOY MISMO

Artículo de Rosana Ferrero

0 comentarios

¹ Todos los campos son obligatorios.
² Tu correo electrónico no será publicado.

Nadie ha publicado ningún comentario aún. ¡Se tu la primera persona!

Te llamamos

Introduce los siguientes datos y nos pondremos en contacto contigo para atender tus dudas sin compromiso.

Te llamamos

Muchas gracias por solicitar información.
Te contactaremos lo antes posible.

Diseño web: Albin Soft.