I dette indlæg skriver jeg om hvordan du kan indlæse data fra bilindustrien via Quandl i Python. Quandl kan installeres med kommandoen “pip install” i din kommandoprompt. Til dette skal du blot skrive “pip install quandl” i din Anaconda-kommandoprompt (eller anden prompt).
Quandl kaldes også for dataverdenens Wikipedia – med den lille forskel at ikke al data på Quandl er gratis. Quandl vedligeholder gratis og premium datasæt. Disse videregives til platformen fra dataudbydere så som US Federal Reserve, globale børser osv.
Du skal først oprette en konto på Quandls hjemmeside. Når du har oprettet og bekræftet din konto modtager du din API-nøgle. Kun med denne nøgle kan du bruge quandl-modulet i Python.
I koden nedenfor henter jeg et datasæt med produktionstal fra den tyske bilindustri, leveret af Deutsche Bundesbank (tyske nationalbank) via Quandl
import quandl # opsætning af API-nøgle quandl.ApiConfig.api_key = "your key here" import numpy import pandas # hentning af data fra quandl i numpy format og derefter konvertering til pandas DataFrame data = pandas.DataFrame(quandl.get("BUNDESBANK/BBDE1_M_DE_Y_BAA1_A2R290050_G_C_I10_A", returns="numpy"))
Jeg hentede al data som en tidsserie i pandas DataFrame-format; jeg plotter tidsserien ved hjælp af matplotlib
import matplotlib.pyplot as plt plt.figure(figsize=(10,10)) plt.plot(data["Date"], data["Value"],color="red") plt.title("Manufactur output for motor vehicles, trailers, semi-trailers and other transport equipment; Germany",size=12) plt.ylabel("index value",size = 12) plt.xlabel("date", size =12)
Text(0.5, 0, 'date')

I dette tilfælde skal det bemærkes, at datasættet ikke længere vedligeholdes. Dette bliver tydeligt når du ser halen af datasættet:
data.tail()
Date | Value | |
---|---|---|
319 | 2017-08-31 | 138.8 |
320 | 2017-09-30 | 130.1 |
321 | 2017-10-31 | 124.3 |
322 | 2017-11-30 | 136.3 |
323 | 2017-12-31 | 132.6 |
Ikke alle datasæt vedligeholdes og ikke alle datasæt er veldokumenterede. Quandl er alligevel en stærk søgemaskine til søgning og indlæsning af relevante datasæt.

Industriingeniør som gerne beskæftiger sig med optimering, simulation og matematisk modellering i R, SQL, VBA og Python
Leave a Reply