Appia의 IT세상

파이썬[Python] Pandas, DataFrame의 행(Row)기반의 중복된 데이터 삭제하기 본문

Python/Python Pandas

파이썬[Python] Pandas, DataFrame의 행(Row)기반의 중복된 데이터 삭제하기

Appia 2020. 11. 13. 07:13
반응형

파이썬[Python] Pandas, DataFrame의 행(Row)기반의 중복된 데이터 삭제하기

 

이전 포스팅에서는 중복된 데이터를 출력해주는 부분에 대해서 포스팅을 해봤습니다. 이번 포스팅에서는 앞선 포스팅과 연계하여, 중복된 부분에 대해서 삭제하는 방법에 대해서 이야기를 해보고자 합니다. 

먼저 다음과 같은 함수를 이용하시면 중복된 부분에 대해서 삭제할 수 있습니다. 

dataframe.drop_duplicates(subset ,keep  inplace = True)

위의 옵션의 파라미터 조건중 keep의 경우 3가지로 입력할 수 있습니다. 

keep parameter

parameter설명

False

중복된 부분에 대해 모두 삭제

'first'

첫번째 항목 유지

'last'

마지막 항목 유지

위의 부분을 토대로 코드를 작성해보도록 하겠습니다. 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
import pandas as pd
 
# Series 생성
 
ds = {'Name': pd.Series(['Choi''Kim''Lee''Park','Choi']),
 
      'Age': pd.Series([2526252325]),
 
      'Rating': pd.Series([2.563.204.63.8,2.56])}
 
# DataFrame 생성
 
df = pd.DataFrame(ds)
 
print(df)  # 출력 DataFrame
 
df.drop_duplicates(subset ='Name',keep = False, inplace = True)
 
print(df)
cs

위의 코드를 실행하면 다음과 같은 결과가 나타납니다. 

1
2
3
4
5
6
7
8
9
10
   Name  Age  Rating
0  Choi   25    2.56
1   Kim   26    3.20
2   Lee   25    4.60
3  Park   23    3.80
4  Choi   25    2.56
   Name  Age  Rating
1   Kim   26     3.2
2   Lee   25     4.6
3  Park   23     3.8
cs

만약 Keep 부분을 다음과 같이 'first'로 변경하였다면 다음과 같은 결과가 나타납니다. 

1
2
3
4
5
6
7
8
9
10
11
   Name  Age  Rating
0  Choi   25    2.56
1   Kim   26    3.20
2   Lee   25    4.60
3  Park   23    3.80
4  Choi   25    2.56
   Name  Age  Rating
0  Choi   25    2.56
1   Kim   26    3.20
2   Lee   25    4.60
3  Park   23    3.80
cs

 

파이썬[Python] Pandas, DataFrame의 행(Row)기반의 중복된 데이터 찾기, 선택한 열(Column)기반 중복데이터 찾기

 

파이썬[Python] Pandas, DataFrame의 행(Row)기반의 중복된 데이터 찾기, 선택한 열(Column)기반 중복데이터

파이썬[Python] Pandas, DataFrame의 행(Row)기반의 중복된 데이터 찾기 종종 작업을 하다보면, 본의 아닌 이유로 중복된 데이터를 입력하게 되는 경우가 있습니다. 저의 경우 최근에 주식 관련된 데

appia.tistory.com

이번 포스팅에서는 간단하게 중복된 데이터프레임(DataFrame)에 대해서 삭제하는 방법에 대해서 간단히 살펴봤습니다. 생각보다 많이 필요로 하고 도움이 되는 부분입니다. 혹 궁금하신점이나 문의 사항이 있으시면 언제든지 댓글 및 방명록에 글 남겨주시길 바랍니다. 감사합니다. 

반응형
Comments