Introducción a Seaborn en Python

Esta publicación es una introducción aproximada al módulo Seaborn en Python. Lo uso para la visualización de datos, en combinación con Pandas. Lea los comentarios para entender mi flujo de trabajo. Cualquier duda puedes dejarla como comentario al pie de la publicación.

# pandas es un módulo de python para trabajar con marcos de datos 
import pandas 
# seaborn es un contenedor para matplotlib y está destinado a la visualización de datos 
import seaborn 
# pandas y numpy están relacionados, por lo tanto, siempre leo en numpy cuando trabajo con pandas 
import numpy 
# y desde entonces seaborn es un contenedor alrededor de matplotlib También leí en matplotlib .pyplot 
import matplotlib .pyplot as plt 
# lectura en un conjunto de datos como marco de datos usando pandas; 
# los datos son datos de producción de la industria automotriz OICA 
data_df.head()
añopaísproducción
02018Argentina466649
12018Austria164900
22018Bélgica308493
32018Brasil2879809
42018Canadá2020840
# veamos también la cola 
data_df.tail()
añopaísproducción
8351999Ucrania1918
8361999Reino Unido1973519
8371999EE.UU13024978
8381999Uzbekistán44433
8391999Otros11965
# probemos .describe() 
data_df.describe()
añoproducción
contar840.0000008.400000e+02
significar2008.2845241.840118e+06
estándar5.7098083.407141e+06
min1999.0000003.600000e+01
25%2004.0000001.633742e+05
50%2008.0000005.586175e+05
75%2013.0000001.970880e+06
máximo2018.0000002.901543e+07
# establecer el tamaño del gráfico usando matplotlib .pyplot 
plt.figure(figsize=(20,15)) 
# crear un diagrama de dispersión usando seaborn 
plot1 = seaborn.scatterplot(x="year",y="output ",hue="country ", data=data_df) 
# agregar el título de la parcela 
plot1.set_title("producción por año (datos de OICA)", tamaño de fuente=22) 
# agregar las etiquetas de los ejes x e y 
plot1.set_xlabel("año",fontsize=16) 
plot1. set_ylabel("salida",tamaño de fuente=16)
Texto (0, 0.5, 'salida')
# establecer el tamaño del gráfico con matplotlib .pyplot 
plt.figure(figsize=(20,15)) 
# rotar los ticks del eje x 90 grados 
plt.xticks(rotation=90) 
# vamos a crear un gráfico de diagrama de 
caja plot2 = seaborn.boxplot(x ="país",y="salida",data=data_df) 
# set title 
plot2.set_title("distribución de producción anual por nación, 1999 - 2018 (datos de OICA)",fontsize=22) 
# agregar etiquetas a x- y y- 
xis plot2.set_xlabel("país",fontsize=16) 
plot2.set_ylabel("producción anual",fontsize=16)
Text(0, 0.5, 'producción anual')
# diagramas de enjambre, usando seaborn 
# establecer el tamaño del gráfico usando matplotlib .pyplot 
plt.figure(figsize=(20,15)) 
# rotar los ticks del eje en el eje x 
plt.xticks(rotación=90) 
# establecer el estilo seaborn predeterminado 
seaborn.set_style ("whitegrid") 
# establece el contexto predeterminado 
seaborn.set_context("talk") 
# crea el diagrama de enjambre 
plot3 = seaborn.swarmplot(x="país",y="salida",data=data_df,color="green") 
# establecer título 
plot3.set_title("producción anual de la industria automotriz por país de 1999 a 2018, según OICA",fontsize=22) 
# establecer etiquetas de eje 
plot3.set_xlabel("país",fontsize=22) 
# agregar línea de referencia,usando.pyplot 
plt.axhline(data_df["salida "].media(),color="azul")
<matplotlib.lines.Line2D en 0x2b02ec39b88>
# por último, vamos a crear también un diagrama de líneas 
# establecer el tamaño del gráfico 
plt.figure(figsize=(20,15)) 
# ajustar el contexto a "papel" 
seaborn.set_context("papel") 
# crear un diagrama de líneas usando seaborn 
plot4 = seaborn. lineplot(x="año",y="salida",hue="país",data=data_df) 
# add title plot 
plot4.set_title("Serie temporal de producción de la industria automotriz de OICA, 1999 - 2018",fontsize=22) 
# ajustar las etiquetas de los ejes 
plot4.set_xlabel("año",fontsize=22) 
plot4.set_ylabel("salida de producción [unidades]",fontsize=22)
Text(0, 0.5, 'salida de producción [unidades]')

You May Also Like

Leave a Reply

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.