Neben Pandas und Seaborn möchte ich Ihnen auch eine kurze Einführung in matplotlib geben. Matplotlib ist ein weiteres wichtiges Modul und eine Bibliothek in Python. Es dient der Datenvisualisierung. Das folgende Codierungsbeispiel wird Ihnen den Einstieg erleichtern. Die vollständige Dokumentation zu matplotlib ist hier verfügbar: https://matplotlib.org/index.html
# Matplotlib importieren, matplotlib.pyplot matplotlib importieren importiere matplotlib.pyplot als plt # Importieren von Pandas und Numpy , da wir in Datenrahmen gespeicherte Daten visualisieren möchten Pandas importieren importiere numpy # einen Datensatz importieren und den Header anzeigen data_df = pandas.read_csv("oica.csv",sep=",") data_df.head()
| Jahr | Land | Ausgang | |
|---|---|---|---|
| 0 | 2018 | Argentinien | 466649 |
| 1 | 2018 | Österreich | 164900 |
| 2 | 2018 | Belgien | 308493 |
| 3 | 2018 | Brasilien | 2879809 |
| 4 | 2018 | Kanada | 2020840 |
# Schritt 1: Gestalte die Fläche, die Figur; ermöglicht zB das Einstellen der Größe # die Figur ist wie eine Seite; eine Abbildung kann mehrere Diagramme, dh Achsen, enthalten plt.figure(figsize=(10,10))
<Abbildungsgröße 720x720 mit 0 Achsen>
<Abbildungsgröße 720x720 mit 0 Achsen>
# .subplots() gibt die Figur und die Achsen zurück; # die Achsen sind die Basiskoordinaten, auf denen Sie zeichnen; # Wie bereits erwähnt, kann eine Figur mehrere Achsen enthalten plt.figure(figsize=(10,10)) plt.subplots()
(<Abbildungsgröße 432x288 mit 1 Achse>, <matplotlib.axes._subplots.AxesSubplot bei 0x257b791bb08>)
<Abbildungsgröße 720x720 mit 0 Achsen>

# Schritt 2: Zeichnen Sie ein Punktdiagramm, dh Streudiagramm; # Fügen Sie den Plot dem Achsenobjekt hinzu plt.figure(figsize=(10,10)) plt.plot( numpy .sort(data_df["output "]),marker="o",markersize=2)
[<matplotlib.lines.Line2D bei 0x257b6180108>]

# Schritt 3: Titel und Achsenbeschriftungen hinzufügen; # -- Figurgröße festlegen plt.figure(figsize=(20,10)) # -- Diagramm erstellen plt.plot( numpy .sort(data_df["output"]), marker="o", Markierungsgröße=6, Linienbreite=2, Linienstil ="--", color="orange") # -- Titel festlegen plt.title("Jahresproduktionszahlen der Automobilindustrie", fontdict={"fontname":"Times New Roman", "Schriftgröße": 32}) # - xlabel zuweisen plt.xlabel("Datenpunkt Nr.", fontdict={"fontname":"Comic Sans MS", "Schriftgröße": 18, "Farbe Rot"}) # -- ylabel zuweisen plt.ylabel("jährliche Produktionsleistung", Schriftgröße=18, color="grün") # -- Xticks anpassen plt.xticks (Größe=16, color="lila")
(array([-200., 0., 200., 400., 600., 800., 1000.]), <eine Liste von 7 Text-xticklabel-Objekten>)

# Eine strukturiertere Art, mit Matplotlib zu arbeiten, ist die Arbeit mit Referenzhandlern
# -- Richten Sie einige Datenvektoren ein, die geplottet werden sollen
y1 = [1,2,3,3,5,1,7]
y2 = [2,4,5,5,5,5,75]
x = Bereich(0,len(y1))
# -- ein leeres Bild erstellen (dh = Figur); einen Handler gefangen nehmen
fig = plt.figure() # fig zeigt an, dass es sich um eine "Figur" handelt
# -- erzeuge einen Subplot auf dem leeren Bild, zB der leeren Figur; einen Handler gefangen nehmen
ax = plt.subplot() # ax zeigt an, dass dies eine "Achse" ist; Die Achsen sind im Grunde der Graph
# -- Erstellen von Liniendiagrammen auf der Achse unter Verwendung der Achsen-Handler-Referenz
ax.plot(x, y1, label='$y1 = Serie 1, wächst schnell', color="black")
ax.plot(x, y2, label='$y2 = Serie 2, wächst langsam', color="grey")
# -- Hinzufügen eines Titels zu den Achsen unter Verwendung der Achsen-Handler-Referenz
ax.set_title('Vergleich zweier Zeitreihen',
Schriftgröße=18,
color="grün")
# -- Hinzufügen von x- und y-Achsenbeschriftungen unter Verwendung der Achsen-Handler-Referenz
ax.set_xlabel("Werte der X-Achse",
Schriftgröße=14,
color="rot")
ax.set_ylabel("Werte der Y-Achse",
Schriftgröße=14,
color="lila")
# -- Legende hinzufügen, standardmäßig innerhalb des Zeichnungsrahmens
Axt. Legende (Schriftgröße = 10)
# -- Raster hinzufügen
ax.grid(b=Wahr,
color="blau",
alpha=0,1)
# -- zeigt alles, was in diesem Abschnitt bis zu diesem Punkt geplottet wurde
plt.show()

# sehen wir uns nun einige weitere Beispiele an;
# zB können wir mit matplotlib Histogramme erstellen
# -- Importieren von Zufallszahlen, um einige Zufallszahlen zu erstellen
willkürlich importieren
# -- Verwenden Sie randint() von random, um einige zufällige Ganzzahlen zu erstellen
x = []
für i im Bereich (0,100):
x.append(random.randint(a=0,b=100))
# -- Erstellen Sie eine Figur
fig = plt.figure(figsize=(10,10))
# -- Achsen zur Figur hinzufügen
ax = plt.subplot()
# -- Hinzufügen von Histogrammen zu Achsen mithilfe des Objekthandlers für Achsen
ax.hist(x,
Behälter=20,
histtype="bar",
Farbe = "Rosa")
# -- fügen Sie Titel zum Histogramm hinzu, indem Sie den Axes-Objekt-Handler verwenden
ax.set_title("ein Histogramm, erstellt mit matplotlib in Python",
Schriftgröße=22,
color="dunkelgrün")
# -- Hinzufügen von Beschriftungen zur x- und y-Achse mithilfe des Objekthandlers "axis".
ax.set_xlabel("Beobachtungswertebereich",
Schriftgröße=16,
color="dunkelgrün")
ax.set_ylabel("absolute Häufigkeit",
Schriftgröße=16,
color="dunkelgrün")
# -- x- und y-Tick-Beschriftungen mit Hilfe des Axes-Object-Handlers anpassen
# -- auch: Passen Sie die Ticks der x- und y-Achse selbst an, indem Sie den Objekthandler für Achsen verwenden
ax.tick_params(axis="x",
Größe=12,
Breite=5,
color="blau",
Etikettengröße = 20,
labelcolor="rot")
ax.tick_params(axis="y",
Größe=12,
Breite=5,
Farbe = "blau")
# -- alles anzeigen, was in diesem Abschnitt bis zu diesem Punkt gezeichnet wurde
plt.show()

# weiteres Beispiel: 3D-Oberflächenplot mit matplotlib in Python
# Kredit: https://stackoverflow.com/questions/3810865/matplotlib-unknown-projection-3d-error
# -- zuerst einige Daten zum Plotten
x = [1,2,3]
y = [1,2,3]
z = [[1,2,3],
[1,2,3],
[1,2,3]]
# -- Figur mit Pyplot erstellen
fig = plt.figure(figsize=(10,10))
# -- Erstellen von Achsen mit Pyplot
aus mpl_toolkits.mplot3d importiere axis3d, Axes3D
ax = Axes3D(fig)
# -- Oberflächendiagramm erstellen
ax.contour(x,y,z,extend3d=True)
<matplotlib.contour.QuadContourSet bei 0x257b7899f48>


Wirtschaftsingenieur mit Interesse an Optimierung, Simulation und mathematischer Modellierung in R, SQL, VBA und Python

Leave a Reply