Appia의 IT세상

파이썬[Python] Pandas, Series 기본 메소드 기능 본문

Python/Python Pandas

파이썬[Python] Pandas, Series 기본 메소드 기능

Appia 2020. 3. 24. 07:57
반응형

이번 포스팅은 Pandas에서 사용되는 데이터 컨테이너를 사용하는 메소드에 대해서 간단히 살펴보고자 합니다. 저희는 앞서서 Series에 대해서 간단히 살펴봤습니다. 이번 포스팅에서는 Series관련해서만 포스팅하고, 이와 별개로 DataFrame 관련해서 추가로 포스팅 예정입니다. 혹 궁금하시거나 필요로 하시는 분들은 간단한 생성 및 개념에 대해서 다음 링크를 참조 부탁드립니다. 

 

파이썬[Python] Pandas, Pandas Series생성 및 활용하기

불러오는 중입니다...

그럼 간단히 Series에서 사용될 수 있는 메소드에 대해서 간단히 표로 한번 살펴보겠습니다. 다음 명시된 메소드에 대해서에 간단히 기술해봤습니다. 

Method Description(Series)
axes row label 리스트를 반환 
dtype 객체의 데이터 타입 반환
empty Series 가 비었는지 확인 비었을 경우 - True
ndim 객체 dimension 반환
size Serises 객체 갯수 반환
values 데이터 값을 ndarray형태로 반환 
head() 처음 n열 반환
tail() 뒤에서 n열들 반환 

위의 부분을 바탕으로 각 함수에 대해서 예시를 들어 추가 설명을 드리도록 하겠습니다. 

 

axes

Series를 바탕을 axes를 적용해 봤습니다. 다음 예시를 참조해 주시길 바랍니다. 

example)

#axes example for Series
 
import pandas as pd
 
import numpy as np
 
= pd.Series(np.random.randn(5))   #Series 생성
 
print ("Series :")
 
print (s)   # Series 출력
 
print ("axes example result:")
 
print (s.axes)  # axes 값 출력
cs

result) 

Series :
 
0   -0.306927
 
1    1.199654
 
2    0.594395
 
3    1.089860
 
4   -0.427623
 
dtype: float64
 
axes example result:
 
[RangeIndex(start=0, stop=5, step=1)]
cs

위에 보이는 결과 [RangeIndex(start=0, stop=5, steop=1)]는 실제 Label인 [0,1,2,3,4]을 컴팩트한 결과입니다. 

 

empty 

empty메소드는 True/False중 하나를 리턴합니다. 즉, Series가 비어 있을 경우 True 입니다. 

example) 

import pandas as pd
 
import numpy as np
 
= pd.Series(np.random.randn(5))
 
print (s)
 
print ("Empty (T)/ Not Empty(F) :")
 
print (s.empty)
cs

result) 

0   -0.106665
 
1   -1.075598
 
2   -0.089072
 
3    0.100825
 
4   -0.194466
 
dtype: float64
 
Empty (T)/ Not Empty(F) :
 
False
cs

위의 empty메소드를 실행해서 결과를 얻어보니 False 입니다. 즉, Series가 비어 있지 않기 때문에 다음과 같이 나옵니다. 

 

ndim/size

이번에는 2가지 메소드에 대해서 값이 살펴보겠습니다. ndim은 실제 1입니다. Series의 경우 1차원이기 때문에 1입니다. size의 경우 Series의 크기 자체를 나타냅니다. Series의 맴버 갯수를 나타내줍니다. 

example) 

import pandas as pd
 
import numpy as np
 
= pd.Series(np.random.randn(5))   # Series 생성 맴버가 5개인 
 
print (s)
 
print ("ndim :")
 
print (s.ndim)  #Series의 ndim값 출력 
 
print ("size : ")
 
print (s.size)  #Series의 size 값 출력
cs

result) 

0    0.553033
 
1   -1.081708
 
2   -0.528762
 
3   -1.702079
 
4    0.979454
 
dtype: float64
 
ndim :
 
1
 
size : 
 
5
cs

 

위에서 Series를 생성한 코드를 본바와 같이 size값이 5가 나왔습니다. ndim의 경우 많이 사용하지 않습니다. Series의 경우 1이기 때문이죠. 하지만 size는 많이 사용됩니다. 

 

values

values의 경우 Series라는 컨테이너에 저장된 모든 값을 출력해줍니다. 

example) 

import pandas as pd
 
import numpy as np
 
= pd.Series(np.random.randn(5))   # Series 생성 맴버가 5개인
 
print (s)
 
print ("value : ")
 
print (s.values)  #Series의 데이터 값 출력
cs

result)

0   -1.412269
 
1    0.239935
 
2    1.500163
 
3   -0.251543
 
4   -0.830635
 
dtype: float64
 
value : 
 
[-1.41226939  0.23993484  1.50016288 -0.25154308 -0.83063534]
cs

이와 같이 Series에 선언되어 있는 값들을 배열 형태로 출력해주고 있습니다. 

 

head/tail

head(a)은 경우 처음부터 a번째 열까지만 출력하는 함수입니다. 이와 반대로 tail(a)은 뒤에서 a번째 열부터 마지막까지 출력하는 함수입니다. 

example)

import pandas as pd
 
import numpy as np
 
= pd.Series(np.random.randn(5))   # Series 생성 맴버가 5개인
 
print (s)
 
print ("head 3: ")
 
print (s.head(3))  #Series의 앞에서 3번째 줄까지 데이터 값 출력
 
print ("tail 2 : ")
 
print (s.tail(2))  #Series의 뒤에서 2번째부터 데이터 값 출력
cs

result) 

0    0.288357
 
1   -0.087177
 
2    1.168177
 
3   -1.144658
 
4    0.063062
 
dtype: float64
 
head 3
 
0    0.288357
 
1   -0.087177
 
2    1.168177
 
dtype: float64
 
tail 2 : 
 
3   -1.144658
 
4    0.063062
 
dtype: float64
cs

위와 같이 head/tail에 대해 한번 살펴봤습니다. 

 

이번 포스팅은 Series에서 사용될 수 있는 기본 메소드의 기능에 대해서 살펴봤습니다. 파이썬[Python]은 많은 사람들이 알다시피, 매우 많은 용도와 다양한 형태의 모듈등을 제공하고 있지만, 기본기능이 우선시 되어야지만, 이런 모듈등을 잘 사용할 수 있습니다. 

 

아마도 다음 포스팅은 DataFrame에 대한 기본 메소드 기능에 대해서 살펴볼 것입니다. 혹 궁금하시거나 문의 사항 있으시면 언제든지 댓글 및 방명록에 글 남겨주시길 바랍니다. 감사합니다. 

반응형
Comments