Introduktion til Seaborn i Python

Dette indlæg er en grov introduktion til Seaborn-modulet i Python. Jeg bruger det til datavisualisering, i kombination med Pandas. Læs kommentarerne for at forstå min arbejdsgang. Eventuelle spørgsmål kan du efterlade som en kommentar nederst i indlægget.

# pandas er et python-modul til at arbejde med datarammer 
import pandaer 
# seaborn er en wrapper til matplotlib og er beregnet til datavisualisering 
import seaborn 
# pandaer og numpy er relaterede, derfor læser jeg altid i numpy når jeg arbejder med pandaer 
import numpy 
# og siden seaborn er en indpakning omkring matplotlib Jeg læste også i matplotlib .pyplot 
import matplotlib .pyplot som plt 
# læsning i et datasæt som dataramme ved hjælp af pandaer; 
# dataene er OICA bilindustriens produktionsdata  
data_df = pandas.read_csv("oica.csv",sep=",")
data_df.head()
årLandproduktion
02018Argentina466649
12018Østrig164900
22018Belgien308493
32018Brasilien2879809
42018Canada2020840
# lad os også se halen 
data_df.tail()
årLandproduktion
8351999Ukraine1918
8361999Storbritannien1973519
8371999USA13024978
8381999Usbekistan44433
8391999Andre11965
# lad os prøve .describe() 
data_df.describe()
årproduktion
tælle840.000.0008,400000e+02
betyde2008.2845241.840118e+06
std5,7098083.407141e+06
min1999.000.0003,600000e+01
25 %2004.000.0001,633742e+05
50 %2008.000.0005.586175e+05
75 %2013.000.0001,970880e+06
max2018.000.0002.901543e+07
# indstil grafstørrelse ved hjælp af matplotlib .pyplot 
plt.figure(figsize=(20,15)) 
# oprettelse af et scatterplot ved hjælp af søborn 
plot1 = seaborn.scatterplot(x="year",y="output ",hue="country ", data=data_df) 
# tilføj 
plottitel plot1.set_title("produktionsoutput efter år (OICA-data)", fontsize=22) 
# tilføj x- og y-akse-etiketter 
plot1.set_xlabel("year",fontsize=16) 
plot1. set_ylabel("output",fontstørrelse=16)
Tekst(0, 0,5, 'output')
# indstil grafstørrelse med matplotlib .pyplot 
plt.figure(figsize=(20,15)) 
# drej x-akse flueben med 90 grader 
plt.xticks(rotation=90) 
# lad os skabe et boxplot graf 
plot2 = seaborn.boxplot(x) ="land ",y="output ",data=data_df) 
# set title 
plot2.set_title("årlig produktionsproduktionsfordeling efter nation, 1999 - 2018 (OICA-data)",fontsize=22) 
# tilføj etiketter til x- og y- 
xis plot2.set_xlabel("country",fontsize=16) 
plot2.set_ylabel("årlig produktionsoutput",fontsize=16)
Tekst(0, 0,5, 'årlig produktionsoutput')
# sværmplot, ved hjælp af søfødt 
# indstil grafstørrelse ved hjælp af matplotlib .pyplot 
plt.figure(figsize=(20,15)) 
# roter akse-ticks på x-aksen 
plt.xticks(rotation=90) 
# sæt standard seaborn-stil 
seaborn.set_style ("whitegrid") 
# sæt standardkontekst 
seaborn.set_context("talk") 
# opret 
sværmplottet plot3 = seaborn.swarmplot(x="land ",y="output ",data=data_df,color="grøn") 
# set title 
plot3.set_title("årlig produktion af bilindustrien efter land fra 1999 til 2018, ifølge OICA",fontsize=22) 
# sæt akseetiketter 
plot3.set_xlabel("land",fontsize=22) 
plot3.set_ylabel("årlig produktionsoutput",fontsize=22)
# tilføj referencelinje ved hjælp af matplotlib .pyplot 
plt.axhline(data_df["output "].mean(),color="blue")
<matplotlib.lines.Line2D ved 0x2b02ec39b88>
# Til sidst, lad os også lave et linjeplot 
# sæt 
grafstørrelse plt.figure(figsize=(20,15)) 
# juster kontekst til "papir" 
seaborn.set_context("paper") 
# opret linjeplot ved hjælp af havfødt 
plot4 = søfødt. lineplot(x="year",y="output ",hue="country ",data=data_df) 
# add title plot 
plot4.set_title("OICA bilindustriens produktion output tidsserie, 1999 - 2018",fontsize=22) 
# juster akseetiketter 
plot4.set_xlabel("år",fontsize=22) 
plot4.set_ylabel("produktionsoutput [enheder]",fontsize=22)
Tekst(0, 0,5, 'produktionsoutput [enheder]')

You May Also Like

Leave a Reply

Leave a Reply

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

This site uses Akismet to reduce spam. Learn how your comment data is processed.