본문 바로가기
대동단결 Python

pandas 기초

by 즐거운 지니 2020. 5. 6.
반응형

pasdas는 파이썬의 리스트와 딕셔너리의 개념을 혼합 짬뽕한 것. 매우 유용함. 임포트할 때 Series 와 DataFrame을 로컬네임스페이스 내로 직접 임포트 함.

from pandas import Series, DataFrame

시리즈는 리스트로 부터 변환된다.

kakao = Series([92600, 92400, 92100, 94300, 92300])
print(kakao)

이때 자동적으로 인덱스는 0을 포함한 정수형으로 생김

리스트로 부터 시리즈를 만들 때, 인덱스를 직접 지정할 수 있다.

시리즈변수명 = Series(데이터리스트, index=인덱스리스트)

예)

kakao2 = Series([92600, 92400, 92100, 94300, 92300], 
    index=['2016-02-19', '2016-02-18', '2016-02-17', '2016-02-16','2016-02-15'])

kakao2['2016-02-18'] 처럼 데이터에 접근할 수 있음. 인덱스 전체를 리스트로 얻으려면 kakao2.index 데이터 전체를 리스트로 얻으려면 kakao2.values

시리즈 + 시리즈 하면 같은 키값의 데이터 끼리만 더해짐.

DataFrame은 2차원 데이터 타입임. 딕셔너리로 DataFrame을 정의할 수 있다.

딕셔너리변수명 =    {'컬럼명' : 컬럼데이터리스트,
                    '컬럼명' : 컬럼데이터리스트,
                    '컬럼명' : 컬럼데이터리스트 ...}
데이터프레임변수명 = DataFrame(딕셔너러변수명)

예)

from pandas import Series, DataFrame
daeshin = {'open':  [11650, 11100, 11200, 11100, 11000],
           'high':  [12100, 11800, 11200, 11100, 11150],
           'low' :  [11600, 11050, 10900, 10950, 10900],
           'close': [11900, 11600, 11000, 11100, 11050]}
date = ['16.02.29', '16.02.26', '16.02.25', '16.02.24', '16.02.23']
daeshin_day = DataFrame(daeshin, columns=['open', 'high', 'low', 'close'], index=date)

DataFrame을 생성할 때 columes= 옵션을 써서 컬럼의 순서를 정의 할 수 있다.index= 옵션을 사용해서 인덱스를 지정할 수 있다. 컬럼을 얻어 올 땐, daeshin_day['close'] 로우를 얻어 올 땐, daeshin_day.ix['16.02.29'] 컬럼명을 리스트로 얻어 올 땐, daeshin_day.columes 인덱스를 리스트로 얻어 올 땐, daeshin_day.index

반응형

'대동단결 Python' 카테고리의 다른 글

Python 에서 R 스크립트 실행  (0) 2020.06.24
ANSI 화면제어  (0) 2020.06.06
파이썬 기초  (0) 2020.05.06
자동라인매매알고리즘  (0) 2020.05.05
판서 바탕화면 만들기  (0) 2020.05.04

댓글