Diagramas de dispersión en R (1/2)

Guía avanzada Scatter Plots en R con ggplot y geom_point

En (““Gráficos avanzados en R - Introducción a ggplot2”.” revise algunas opciones básicas para generar diagramas de dispersión (scatter plots) con ggplot. Los diagramas de dispersión se usan para mostrar la relación entre dos variables continuas (aunque también se suele representar como la relación de una variable continua y una categórica), cada observación se representa como un punto representado en coordenadas cartesianas. En esta ocasión como origen de datos emplearé el paquete “gcookbook” que contiene datasets usados como ejemplo en la publicación “R Graphics Cookbook” de Winston Chang, publicado por O’Reilly (Reference manual: gcookbook. []

Diagramas de caja

Introducción a ggplot2

“También conocido como diagrama de caja y bigote o boxplot. Es un método estandarizado para representar gráficamente una serie de datos numéricos a través de sus cuartiles. De esta manera, el diagrama de caja muestra a simple vista la mediana y los cuartiles de los datos, pudiendo también representar los valores atípicos de estos”. (Wikipedia). Pertenece al área de la estadística descriptiva. Ejemplo con dataset mpg Vamos a volver a utilizar el dataset mpg que viene con ggplot2, en este primer ejemplo vamos a relacionar el tipo de coche (class) con su consumo (hwy). []

Histogramas

Introducción a ggplot2

Comenzamos como en otros tipos de diagramas con el ejemplo más sencillo: ggplot(data = iris,aes(x=Sepal.Width)) + geom_histogram() El resultado no es muy espectacular, ahora usamos el parámetro binwidth de geom_histogram para definir los intervalos o como se agrupan. El resultado es: ggplot(data = iris,aes(x=Sepal.Width)) + geom_histogram(binwidth = 0.2) Otra cosa que puedo hacer es definir el color de la línea de las barras como sigue: ggplot(data = iris,aes(x=Sepal. []

geom_bar() - Gráficos de barras

Introducción a ggplot2

Vamos con otro de los gráficos más comunes, usaremos un dataset nuevo llamado “mpg” que viene con ggplot2, contiene información sobre diversos modelos de coches y sus características. Como siempre antes de nada cargamos la librería ggplot2 con library("ggplot2") (en caso contrario la función head de abajo no funciona). > head(mpg) # A tibble: 6 x 11 manufacturer model displ year cyl trans drv cty hwy fl class <chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr> 1 audi a4 1. []

geom_line() - Gráficos de líneas

Introducción a ggplot2

Vamos a usar un dataset que viene con R, “ChickWeight” relaciona el peso y la edad de los pollitos. Contiene 578 filas y 4 columnas, peso, tiempo, pollito y dieta. > head(ChickWeight) weight Time Chick Diet 1 42 0 1 1 2 51 2 1 1 3 59 4 1 1 4 64 6 1 1 5 76 8 1 1 6 93 10 1 1 Lo primero como siempre es cargar la librería ggplot2 con library("ggplot2"). []

Gráficos avanzados en R

Introducción a ggplot2

ggplot2 es un paquete especializado para visualización de datos avanzados, el creador de ggplot2 en el 2009 es Hadley Wickham. No hay mas que ver la galería de ejemplos en https://www.r-graph-gallery.com/portfolio/ggplot2-package/ para apreciar su potencial. Otros desarrolladores a su vez han creado un rico ecosistema de extensiones basadas en ggplot2. ggplot2 es una gramática ideada para definir diagramas basada en el libro de Leland Wilkinson “The Grammar of Graphics (Statistics and Computing)”). []

R - Gráficos básicos

Histogramas con hist()

Un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados (Wikipedia). Permite observar la distribución de los datos agrupados por clases. El eje horizontal normalmente representa los valores de la variable. hist(c(2,2,2,2,2,3,3,3,4,4,5,5)) Produce este diagrama: Los valores del vector están entre 2 y 5, el eje X se agrupa en intervalos de 0. []

R - Gráficos básicos

Función barplot()

Ahora vamos a revisar el gráfico de barras, el uso de la función barplot() es muy similar a plot(), por eso no me voy a detener en cada posible opción del diagrama de barras, ademas tengo un post previo sobre barplot() en este enlace. ventas <- c(12,34,10,45) barplot(ventas, main="Ventas\n2017-2019", # Título principal xlab = "Tiendas", #Título eje x names.arg = c("Vi","Bi","Ss","Ma"), #Nombres de cada columna ylab = "Millones", #Título eje y border = "deeppink4", #Color del borde de barras col = "grey", #Color del relleno de barras legend. []

R - Gráficos básicos

Función plot()

Gráfico básico Empezamos con una llamada básica a plot() pasando sólo los datos que debe representar: x <- 1:20 y <- x**3 plot(x,y) El resultado es este: Unir los puntos Ahora voy a crear un sencillo diagrama de puntos unidos por líneas: ventas <- c(1,30,4,6,11,20) plot(ventas,type = 'o') Podemos cambiar el color por ejemplo: plot(ventas,type = 'o',col = "blue") Podemos añadir un título principal: title(main="ventas") Añadir nuevos datos como una línea nueva Ahora vamos a añadir una nueva línea al diagrama previo con ayuda de la función lines(): []