Python의 Quandl에서 자동차 산업 데이터 쿼리

Python에서 Quandl의 데이터를 쿼리하는 방법에 대한 빠른 게시물입니다. Quandl은 명령 프롬프트에서 “pip install”명령으로 설치할 수 있습니다. 이를 위해 Anaconda 명령 프롬프트에 “pip install quandl”을 입력하면됩니다.

Quandl은 데이터의 Wikipedia입니다. 단지 모든 콘텐츠가 무료는 아닙니다. Quandl은 미국 연방 준비 은행, 증권 거래소 등과 같은 데이터 공급자로부터 플랫폼으로 전달되는 무료 및 프리미엄 데이터 세트를 유지합니다.

Quandl 웹 사이트에서 계정을 설정해야합니다. 계정을 확인한 후 API 키를 받게됩니다. 이 키로 만 Python에서 quandl 모듈을 사용할 수 있습니다.

아래 코드에서 quandl을 통해 Deutsche Bundesbank에서 제공 한 독일 자동차 산업 생산 출력에 대한 데이터 세트를 검색합니다.

import quandl
# API 키 설정
quandl.ApiConfig.api_key = "your key here"
import numpy
import pandas
# quandl에서 numpy 형식으로 데이터를 검색 한 다음 pandas DataFrame으로 변환
data = pandas.DataFrame(quandl.get("BUNDESBANK/BBDE1_M_DE_Y_BAA1_A2R290050_G_C_I10_A", returns="numpy"))

데이터를 pandas DataFrame 형식의 시계열로 검색했습니다. matplotlib를 사용하여 시계열을 플로팅합니다.

import matplotlib.pyplot as plt
plt.figure(figsize=(10,10))
plt.plot(data["Date"], data["Value"],color="red")
plt.title("Manufactur output for motor vehicles, trailers, semi-trailers and other transport equipment; Germany",size=12)
plt.ylabel("index value",size = 12)
plt.xlabel("date", size =12)
Text(0.5, 0, 'date')

이 경우 데이터 세트가 더 이상 유지되지 않는다는 점에 유의해야합니다. 이는 데이터 세트의 꼬리를 볼 때 분명해집니다.

data.tail()
DateValue
3192017-08-31138.8
3202017-09-30130.1
3212017-10-31124.3
3222017-11-30136.3
3232017-12-31132.6

모든 데이터 세트가 유지되는 것은 아니며 모든 데이터 세트가 잘 문서화되어 있지는 않습니다. 여전히 Quandl은 관련 데이터 세트를 쿼리하기위한 강력한 검색 엔진입니다.

Leave a Reply

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.

Close

메타