일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- python
- 파워포인트
- 파이썬3
- 오피스
- 파이썬GUI
- 안드로이드
- 윈도우10
- Windows11
- 파이썬
- Excel
- matlab
- office
- git
- Android
- pandas
- 윈도우11
- 비주얼베이직
- windows
- pyqt5
- pythongui
- 아웃룩
- 깃
- 문자열
- Windows10
- Outlook
- win32com
- VBA
- python3
- html
- 엑셀
목록판다스 (7)
Appia의 IT세상
파이썬[Python] Pandas, DataFrame의 Row/Column의 Index을 통해서 특정 위치의 값 출력하기 이번 포스팅에서는 DataFrame의 특정 위치의 값을 출력하는 방법에 대해서 이야기를 해보고자 합니다. 먼저, 예시 데이터는 다음과 같은 형태의 데이터를 가지고 있습니다. 그래서, 만약 다음의 빨간색 보이는 글자가 보이는 부분만 따로 출력해야할 때가 있습니다. Name Age Rating 0 Choi Nan 2.56 1 Kim 26.0 3.20 2 Lee 25.0 4.60 3 Park 23.0 3.80 4 Choi 25.0 2.56 그럴 경우에 어떻게 해야하는 지에 대해서 알아보고자 합니다. 먼저, 다음과 같은 Method을 활용하시면 됩니다. at[Row 값, "Column이름"]..
파이썬[Python] Pandas, DataFrame의 행(Row)기반의 중복된 데이터 찾기 종종 작업을 하다보면, 본의 아닌 이유로 중복된 데이터를 입력하게 되는 경우가 있습니다. 저의 경우 최근에 주식 관련된 데이터를 파싱해오고, 여러개의 데이터를 병합하는 과정에서 중복된 데이터가 존재하게 되었습니다. 그래서 처음에는 관련된 부분들을 손수 삭제하기 시작했는데, 어느 순간 그 부분이 손으로 하기에는 너무 많은 존재가 되어 버렸습니다. 그래서 이번에는 관련해서 행(Row)기반으로 중복된 데이터를 찾는 방법에 대해서 포스팅을 해보고자 합니다. 먼저 샘플 코드를 보면 다음과 같습니다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 import pandas as pd # Series 생성 d..
이번 포스팅에서는 Numpy데이터을 외부 추출하는 방법에 대해서 살펴볼려고 합니다. 물론 Pandas등을 통해서 CSV 파일로 추출하는 방법들을 매우 대중화 되어 있습니다. 그래서 많은 분들은 일정한 단계를 걸쳐 Pandas를 이용한 CSV파일로 추출을 합니다. 저는 바로 Pandas DataFrame으로 변환하여 CSV파일을 추출하는 방법과 바로 Numpy에서 CSV 파일을 추출하는 방법에 대해서 살펴보겠습니다. Pandas DataFrame으로 변환하여 CSV파일 추출하기 실제 Numpy array를 Dataframe으로 변환하여 CSV파일을 추출하기 위해서는 다음 단계를 걸쳐야 합니다. 1. numpy array을 pandas DataFrame으로 변경 2. CSV 파일로 저장 그럼 다음 예시를 통..
종종 재무 관련된 부분들을 살펴볼 때 흔히들 많이 날짜부분들을 인덱스로 많이 사용하고 합니다. 실제 많은 서적이나 예시등에서도 관련된 부분들을 사용하고 있습니다. 그래서 이번에는 Pandas에서도 관련된 함수에 대해서 한번 살펴보고자 합니다. 우선 Pandas에서도 다음과 같은 함수를 통해서 일련된 날짜 생성등을 활용할 수 있게 지원하고 있습니다. date_range() 그럼 이를 바탕으로 간단한 예를 살펴보도록 하겠습니다. example) import pandas as pd print (pd.date_range('1/1/2020', periods=5))cs result) DatetimeIndex(['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-04', '20..
Pandas에서는 아시다시피 DataFrame을 매우 중요한 역할입니다. 하지만, 사용자가 원하는 데이터 값을 얻고자 한다면 반드시 정렬하는 등의 값이 필요로 합니다. 이 부분에 대해서는 크게 2가지 형태로 정렬할 수 있습니다. 크게 Column, Row의 인덱스(Label)을 바탕으로 정렬할 수 있습니다. 또한 값을 바탕으로 정렬할 수 있습니다. 그 방법에 대해서 살펴보겠습니다. 그럼 다음 예시에 보이는 데이터 값을 바탕으로 정렬를 진행해보고자 합니다. example) import pandas as pd udf=pd.DataFrame([[11,21],[14,24],[12,22],[13,23],[10,20],[15,25]], index=[1,4,2,6,3,0], columns=['N2','N1']) pr..
앞서 Pandas 포스팅에서는 Pandas의 가장 많이 사용되는 객체인 DataFrame에 대해서 알아봤습니다. 그래서 이번에는 DataFrame의 구성하는 항목인 Series에 대해서 알아보고자 합니다. Series Series는 다음과 같은 형태의 데이터 구성을 가지고 있습니다. 이 부분은 당연히, Data Frame의 한 Column으로 구성될 수 있습니다. 그럼 위와 같은 Series를 생성하는 부분에 대해서 살펴보도록 하겠습니다. 일단 다음과 같은 형태로 series를 선언할 수 있습니다. pandas.Series(data, index, dtype, copy) data - series를 구성할 데이터ㅡ ndarray, list, constants index - Optional한 부분 dtype ..
앞서 포스팅에서는 Pandas을 설치 하는 방법과 Anaconda를 설치하는 방법에 대해서 살펴봤습니다. 실제 Pandas에 대해서 이야기를 하고자 가장 기초적인 설치에 대해서 포스팅을 해봤습니다. 그러면, 이번 포스팅은 간단히 Pandas에 대해서 이야기를 하면서 데이터를 읽어와서 Data frame을 만드는 방법에 대해서 이야기를 하고자 합니다. 데이터 사이언스 및 빅데이터 관련된 곳에서는 Python Pandas를 많이 사용합니다. 하지만, 엑셀 또한 매우 많은 분석 기능 및 편리성들을 제공하고 있습니다. 하지만, 상당히 많은 사용자들이 엑셀을 사용하지 않고, Python Pandas를 사용하는 이유는 무엇일까요? 다음과 같은 이유라고 생각합니다. Excel은 Python보다 프로그램을 만드는 데에..