Dansk: Pandas i Python – introduktion

Pandas er et modul i Python som bygger videre på Numpy modulet. Pandas bruges især til statistiske applikationer, så som aktieanalyser, trendanalyser, regressionsanalyser osv. Pandas gør det muligt at gemme data i et DataFrame format, som er en objekttype som minder om en 2D-tabel. Numpy bruges til applikationer hvor data skal gemmes i multi-dimensionelle data-terninger, med 3 eller flere dimensioner. Forneden demonstrerer jeg nyttig og grundlæggende Pandas funktionalitet i Python.

In [2]:

# importer numpy og pandas
import numpy as np
import pandas as pd

# opret et DataFrame; dvs. en tabel - med 3 spalter og 3 rækker; spalterne hedder "sted", "navn", "score"
df = pd.DataFrame([["Odense","Jens",97],
                 ["Esbjerg","Simone",98],
                 ["København","Klara",76]],
                 index = [0,1,2],
                 columns = ["sted","navn","score"])

# print det nye DataFrame objekt
print(df)
        sted    navn  score
0     Odense    Jens     97
1    Esbjerg  Simone     98
2  København   Klara     76

In [4]:

# udgiv de første 2 rækker
print(df.head(2))
      sted    navn  score
0   Odense    Jens     97
1  Esbjerg  Simone     98

In [5]:

# udgiv de sidste 2 rækker
print(df.tail(2))
        sted    navn  score
1    Esbjerg  Simone     98
2  København   Klara     76

In [11]:

# udgiv kun navnene
df["navn"]

Out[11]:

0      Jens
1    Simone
2     Klara
Name: navn, dtype: object

In [12]:

# udgiv kun sted
df.sted

Out[12]:

0       Odense
1      Esbjerg
2    København
Name: sted, dtype: object

In [17]:

# udgiv sted og navn
df[["sted","navn"]]

Out[17]:

stednavn
0OdenseJens
1EsbjergSimone
2KøbenhavnKlara

In [23]:

# udgiv anden række, kun sted og navn
df.loc[1,["sted","navn"]]

Out[23]:

sted    Esbjerg
navn     Simone
Name: 1, dtype: object

In [24]:

# udgiv anden række, kun sted og navn men brug index af spalten, ikke navnet på spalten
df.iloc[1,0:2]

Out[24]:

sted    Esbjerg
navn     Simone
Name: 1, dtype: object

In [25]:

# tilføj ny score til simone
df.iloc[1,2] = 100
print(df)
        sted    navn  score
0     Odense    Jens     97
1    Esbjerg  Simone    100
2  København   Klara     76

Leave a Reply

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

Close

Meta