반응형
pasdas는 파이썬의 리스트와 딕셔너리의 개념을 혼합 짬뽕한 것. 매우 유용함. 임포트할 때 Series 와 DataFrame을 로컬네임스페이스 내로 직접 임포트 함.
from pandas import Series, DataFrame
시리즈는 리스트로 부터 변환된다.
kakao = Series([92600, 92400, 92100, 94300, 92300])
print(kakao)
이때 자동적으로 인덱스는 0을 포함한 정수형으로 생김
리스트로 부터 시리즈를 만들 때, 인덱스를 직접 지정할 수 있다.
시리즈변수명 = Series(데이터리스트, index=인덱스리스트)
예)
kakao2 = Series([92600, 92400, 92100, 94300, 92300],
index=['2016-02-19', '2016-02-18', '2016-02-17', '2016-02-16','2016-02-15'])
kakao2['2016-02-18']
처럼 데이터에 접근할 수 있음. 인덱스 전체를 리스트로 얻으려면 kakao2.index
데이터 전체를 리스트로 얻으려면 kakao2.values
시리즈 + 시리즈
하면 같은 키값의 데이터 끼리만 더해짐.
DataFrame은 2차원 데이터 타입임. 딕셔너리로 DataFrame을 정의할 수 있다.
딕셔너리변수명 = {'컬럼명' : 컬럼데이터리스트,
'컬럼명' : 컬럼데이터리스트,
'컬럼명' : 컬럼데이터리스트 ...}
데이터프레임변수명 = DataFrame(딕셔너러변수명)
예)
from pandas import Series, DataFrame
daeshin = {'open': [11650, 11100, 11200, 11100, 11000],
'high': [12100, 11800, 11200, 11100, 11150],
'low' : [11600, 11050, 10900, 10950, 10900],
'close': [11900, 11600, 11000, 11100, 11050]}
date = ['16.02.29', '16.02.26', '16.02.25', '16.02.24', '16.02.23']
daeshin_day = DataFrame(daeshin, columns=['open', 'high', 'low', 'close'], index=date)
DataFrame을 생성할 때 columes=
옵션을 써서 컬럼의 순서를 정의 할 수 있다.index=
옵션을 사용해서 인덱스를 지정할 수 있다. 컬럼을 얻어 올 땐, daeshin_day['close']
로우를 얻어 올 땐, daeshin_day.ix['16.02.29']
컬럼명을 리스트로 얻어 올 땐, daeshin_day.columes
인덱스를 리스트로 얻어 올 땐, daeshin_day.index
반응형
'대동단결 Python' 카테고리의 다른 글
Python 에서 R 스크립트 실행 (0) | 2020.06.24 |
---|---|
ANSI 화면제어 (0) | 2020.06.06 |
파이썬 기초 (0) | 2020.05.06 |
자동라인매매알고리즘 (0) | 2020.05.05 |
판서 바탕화면 만들기 (0) | 2020.05.04 |
댓글