Neben Pandas und Seaborn möchte ich Ihnen auch eine kurze Einführung in matplotlib geben. Matplotlib ist ein weiteres wichtiges Modul und eine Bibliothek in Python. Es dient der Datenvisualisierung. Das folgende Codierungsbeispiel wird Ihnen den Einstieg erleichtern. Die vollständige Dokumentation zu matplotlib ist hier verfügbar: https://matplotlib.org/index.html
# Matplotlib importieren, matplotlib.pyplot matplotlib importieren importiere matplotlib.pyplot als plt # Importieren von Pandas und Numpy , da wir in Datenrahmen gespeicherte Daten visualisieren möchten Pandas importieren importiere numpy # einen Datensatz importieren und den Header anzeigen data_df = pandas.read_csv("oica.csv",sep=",") data_df.head()
Jahr | Land | Ausgang | |
---|---|---|---|
0 | 2018 | Argentinien | 466649 |
1 | 2018 | Österreich | 164900 |
2 | 2018 | Belgien | 308493 |
3 | 2018 | Brasilien | 2879809 |
4 | 2018 | Kanada | 2020840 |
# Schritt 1: Gestalte die Fläche, die Figur; ermöglicht zB das Einstellen der Größe # die Figur ist wie eine Seite; eine Abbildung kann mehrere Diagramme, dh Achsen, enthalten plt.figure(figsize=(10,10))
<Abbildungsgröße 720x720 mit 0 Achsen>
<Abbildungsgröße 720x720 mit 0 Achsen>
# .subplots() gibt die Figur und die Achsen zurück; # die Achsen sind die Basiskoordinaten, auf denen Sie zeichnen; # Wie bereits erwähnt, kann eine Figur mehrere Achsen enthalten plt.figure(figsize=(10,10)) plt.subplots()
(<Abbildungsgröße 432x288 mit 1 Achse>, <matplotlib.axes._subplots.AxesSubplot bei 0x257b791bb08>)
<Abbildungsgröße 720x720 mit 0 Achsen>
# Schritt 2: Zeichnen Sie ein Punktdiagramm, dh Streudiagramm; # Fügen Sie den Plot dem Achsenobjekt hinzu plt.figure(figsize=(10,10)) plt.plot( numpy .sort(data_df["output "]),marker="o",markersize=2)
[<matplotlib.lines.Line2D bei 0x257b6180108>]
# Schritt 3: Titel und Achsenbeschriftungen hinzufügen; # -- Figurgröße festlegen plt.figure(figsize=(20,10)) # -- Diagramm erstellen plt.plot( numpy .sort(data_df["output"]), marker="o", Markierungsgröße=6, Linienbreite=2, Linienstil ="--", color="orange") # -- Titel festlegen plt.title("Jahresproduktionszahlen der Automobilindustrie", fontdict={"fontname":"Times New Roman", "Schriftgröße": 32}) # - xlabel zuweisen plt.xlabel("Datenpunkt Nr.", fontdict={"fontname":"Comic Sans MS", "Schriftgröße": 18, "Farbe Rot"}) # -- ylabel zuweisen plt.ylabel("jährliche Produktionsleistung", Schriftgröße=18, color="grün") # -- Xticks anpassen plt.xticks (Größe=16, color="lila")
(array([-200., 0., 200., 400., 600., 800., 1000.]), <eine Liste von 7 Text-xticklabel-Objekten>)
# Eine strukturiertere Art, mit Matplotlib zu arbeiten, ist die Arbeit mit Referenzhandlern # -- Richten Sie einige Datenvektoren ein, die geplottet werden sollen y1 = [1,2,3,3,5,1,7] y2 = [2,4,5,5,5,5,75] x = Bereich(0,len(y1)) # -- ein leeres Bild erstellen (dh = Figur); einen Handler gefangen nehmen fig = plt.figure() # fig zeigt an, dass es sich um eine "Figur" handelt # -- erzeuge einen Subplot auf dem leeren Bild, zB der leeren Figur; einen Handler gefangen nehmen ax = plt.subplot() # ax zeigt an, dass dies eine "Achse" ist; Die Achsen sind im Grunde der Graph # -- Erstellen von Liniendiagrammen auf der Achse unter Verwendung der Achsen-Handler-Referenz ax.plot(x, y1, label='$y1 = Serie 1, wächst schnell', color="black") ax.plot(x, y2, label='$y2 = Serie 2, wächst langsam', color="grey") # -- Hinzufügen eines Titels zu den Achsen unter Verwendung der Achsen-Handler-Referenz ax.set_title('Vergleich zweier Zeitreihen', Schriftgröße=18, color="grün") # -- Hinzufügen von x- und y-Achsenbeschriftungen unter Verwendung der Achsen-Handler-Referenz ax.set_xlabel("Werte der X-Achse", Schriftgröße=14, color="rot") ax.set_ylabel("Werte der Y-Achse", Schriftgröße=14, color="lila") # -- Legende hinzufügen, standardmäßig innerhalb des Zeichnungsrahmens Axt. Legende (Schriftgröße = 10) # -- Raster hinzufügen ax.grid(b=Wahr, color="blau", alpha=0,1) # -- zeigt alles, was in diesem Abschnitt bis zu diesem Punkt geplottet wurde plt.show()
# sehen wir uns nun einige weitere Beispiele an; # zB können wir mit matplotlib Histogramme erstellen # -- Importieren von Zufallszahlen, um einige Zufallszahlen zu erstellen willkürlich importieren # -- Verwenden Sie randint() von random, um einige zufällige Ganzzahlen zu erstellen x = [] für i im Bereich (0,100): x.append(random.randint(a=0,b=100)) # -- Erstellen Sie eine Figur fig = plt.figure(figsize=(10,10)) # -- Achsen zur Figur hinzufügen ax = plt.subplot() # -- Hinzufügen von Histogrammen zu Achsen mithilfe des Objekthandlers für Achsen ax.hist(x, Behälter=20, histtype="bar", Farbe = "Rosa") # -- fügen Sie Titel zum Histogramm hinzu, indem Sie den Axes-Objekt-Handler verwenden ax.set_title("ein Histogramm, erstellt mit matplotlib in Python", Schriftgröße=22, color="dunkelgrün") # -- Hinzufügen von Beschriftungen zur x- und y-Achse mithilfe des Objekthandlers "axis". ax.set_xlabel("Beobachtungswertebereich", Schriftgröße=16, color="dunkelgrün") ax.set_ylabel("absolute Häufigkeit", Schriftgröße=16, color="dunkelgrün") # -- x- und y-Tick-Beschriftungen mit Hilfe des Axes-Object-Handlers anpassen # -- auch: Passen Sie die Ticks der x- und y-Achse selbst an, indem Sie den Objekthandler für Achsen verwenden ax.tick_params(axis="x", Größe=12, Breite=5, color="blau", Etikettengröße = 20, labelcolor="rot") ax.tick_params(axis="y", Größe=12, Breite=5, Farbe = "blau") # -- alles anzeigen, was in diesem Abschnitt bis zu diesem Punkt gezeichnet wurde plt.show()
# weiteres Beispiel: 3D-Oberflächenplot mit matplotlib in Python # Kredit: https://stackoverflow.com/questions/3810865/matplotlib-unknown-projection-3d-error # -- zuerst einige Daten zum Plotten x = [1,2,3] y = [1,2,3] z = [[1,2,3], [1,2,3], [1,2,3]] # -- Figur mit Pyplot erstellen fig = plt.figure(figsize=(10,10)) # -- Erstellen von Achsen mit Pyplot aus mpl_toolkits.mplot3d importiere axis3d, Axes3D ax = Axes3D(fig) # -- Oberflächendiagramm erstellen ax.contour(x,y,z,extend3d=True)
<matplotlib.contour.QuadContourSet bei 0x257b7899f48>
Wirtschaftsingenieur mit Interesse an Optimierung, Simulation und mathematischer Modellierung in R, SQL, VBA und Python
Leave a Reply