Diagramas de dispersión en R (1/2)

Guía avanzada Scatter Plots en R con ggplot y geom_point

En (““Gráficos avanzados en R - Introducción a ggplot2”.” revise algunas opciones básicas para generar diagramas de dispersión (scatter plots) con ggplot. Los diagramas de dispersión se usan para mostrar la relación entre dos variables continuas (aunque también se suele representar como la relación de una variable continua y una categórica), cada observación se representa como un punto representado en coordenadas cartesianas. En esta ocasión como origen de datos emplearé el paquete “gcookbook” que contiene datasets usados como ejemplo en la publicación “R Graphics Cookbook” de Winston Chang, publicado por O’Reilly (Reference manual: gcookbook. []

Diagramas de caja

Introducción a ggplot2

“También conocido como diagrama de caja y bigote o boxplot. Es un método estandarizado para representar gráficamente una serie de datos numéricos a través de sus cuartiles. De esta manera, el diagrama de caja muestra a simple vista la mediana y los cuartiles de los datos, pudiendo también representar los valores atípicos de estos”. (Wikipedia). Pertenece al área de la estadística descriptiva. Ejemplo con dataset mpg Vamos a volver a utilizar el dataset mpg que viene con ggplot2, en este primer ejemplo vamos a relacionar el tipo de coche (class) con su consumo (hwy). []

Histogramas

Introducción a ggplot2

Comenzamos como en otros tipos de diagramas con el ejemplo más sencillo: ggplot(data = iris,aes(x=Sepal.Width)) + geom_histogram() El resultado no es muy espectacular, ahora usamos el parámetro binwidth de geom_histogram para definir los intervalos o como se agrupan. El resultado es: ggplot(data = iris,aes(x=Sepal.Width)) + geom_histogram(binwidth = 0.2) Otra cosa que puedo hacer es definir el color de la línea de las barras como sigue: ggplot(data = iris,aes(x=Sepal. []

geom_bar() - Gráficos de barras

Introducción a ggplot2

Vamos con otro de los gráficos más comunes, usaremos un dataset nuevo llamado “mpg” que viene con ggplot2, contiene información sobre diversos modelos de coches y sus características. Como siempre antes de nada cargamos la librería ggplot2 con library("ggplot2") (en caso contrario la función head de abajo no funciona). > head(mpg) # A tibble: 6 x 11 manufacturer model displ year cyl trans drv cty hwy fl class <chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr> 1 audi a4 1. []

geom_line() - Gráficos de líneas

Introducción a ggplot2

Vamos a usar un dataset que viene con R, “ChickWeight” relaciona el peso y la edad de los pollitos. Contiene 578 filas y 4 columnas, peso, tiempo, pollito y dieta. > head(ChickWeight) weight Time Chick Diet 1 42 0 1 1 2 51 2 1 1 3 59 4 1 1 4 64 6 1 1 5 76 8 1 1 6 93 10 1 1 Lo primero como siempre es cargar la librería ggplot2 con library("ggplot2"). []

Gráficos avanzados en R

Introducción a ggplot2

ggplot2 es un paquete especializado para visualización de datos avanzados, el creador de ggplot2 en el 2009 es Hadley Wickham. No hay mas que ver la galería de ejemplos en https://www.r-graph-gallery.com/portfolio/ggplot2-package/ para apreciar su potencial. Otros desarrolladores a su vez han creado un rico ecosistema de extensiones basadas en ggplot2. ggplot2 es una gramática ideada para definir diagramas basada en el libro de Leland Wilkinson “The Grammar of Graphics (Statistics and Computing)”). []