일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 파이썬GUI
- 아웃룩
- 안드로이드
- 엑셀
- Android
- 문자열
- Windows11
- 파이썬3
- 깃
- Outlook
- html
- pyqt5
- 파이썬
- win32com
- 오피스
- 비주얼베이직
- pandas
- 파워포인트
- VBA
- 윈도우10
- Excel
- office
- python3
- matlab
- 윈도우11
- pythongui
- windows
- python
- Windows10
- git
목록pandas (17)
Appia의 IT세상
파이썬[Python] Pandas, DataFrame의 특정 Column을 그래프 출력하기 Pandas의 DataFrame을 매우 활용성이 높습니다. 그래서 특정 모듈에서는 데이터 값을 DataFrame으로 나타내고 합니다. 많은 사용자들은 이렇게 취득하게 된 데이터에 데이터에 대해서 matplotlib과 연결하여 plot화를 진행합니다. 그래서 이번 포스팅에서는 DataFrame의 특정 Column을 이용한 그래프 출력하는 방법에 대해서 포스팅을 해보고자 합니다. 먼저, 편하게 진행을 위해서 Pandas 와 Matplotlib 모듈에 대해서 사전 설치 진행 후에 다음 블로그의 내용을 진행해주심이 도움이 될 것으로 보입니다. 파이썬[Python] Pandas 설치하기(pip), 아나콘다(Anaconda)..
파이썬[Python] Pandas, DataFrame의 Row/Column의 Index을 통해서 특정 위치의 값 출력하기 이번 포스팅에서는 DataFrame의 특정 위치의 값을 출력하는 방법에 대해서 이야기를 해보고자 합니다. 먼저, 예시 데이터는 다음과 같은 형태의 데이터를 가지고 있습니다. 그래서, 만약 다음의 빨간색 보이는 글자가 보이는 부분만 따로 출력해야할 때가 있습니다. Name Age Rating 0 Choi Nan 2.56 1 Kim 26.0 3.20 2 Lee 25.0 4.60 3 Park 23.0 3.80 4 Choi 25.0 2.56 그럴 경우에 어떻게 해야하는 지에 대해서 알아보고자 합니다. 먼저, 다음과 같은 Method을 활용하시면 됩니다. at[Row 값, "Column이름"]..
파이썬[Python] Pandas, DataFrame / Series의 맴버의 값이 존재하는지 확인하는 방법 이번 포스팅은 Pandas를 사용하는 사람들에게 DataFrame 또는 Series의 맴버들의 값이 Null값이 있는지 확인하는 방법에 대해서 이야기를 해보고자 합니다. 예전에 관련된 부분에 대해서 간단히 포스팅을 한적이 있었습니다. 파이썬[Python] 변수의 Null인지 아닌지 확인하는 방법 파이썬[Python] 변수의 Null인지 확인하는 방법 흔히 변수가 Null 인지 확인을 해야하는 경우가 있습니다. 이럴 경우 여러가지 방법이 있습니다. 크게 3가지 정도로 이야기 할 수 있는데, 이 방법 appia.tistory.com 물론 위의 방법을 통해서도 가능하지만, 그 보다는 Pandas에서 제..
파이썬[Python] Pandas, DataFrame의 행(Row)기반의 중복된 데이터 삭제하기 이전 포스팅에서는 중복된 데이터를 출력해주는 부분에 대해서 포스팅을 해봤습니다. 이번 포스팅에서는 앞선 포스팅과 연계하여, 중복된 부분에 대해서 삭제하는 방법에 대해서 이야기를 해보고자 합니다. 먼저 다음과 같은 함수를 이용하시면 중복된 부분에 대해서 삭제할 수 있습니다. dataframe.drop_duplicates(subset ,keep inplace = True) 위의 옵션의 파라미터 조건중 keep의 경우 3가지로 입력할 수 있습니다. keep parameter parameter설명 False 중복된 부분에 대해 모두 삭제 'first' 첫번째 항목 유지 'last' 마지막 항목 유지 위의 부분을 토대..
파이썬[Python] Pandas, DataFrame의 행(Row)기반의 중복된 데이터 찾기 종종 작업을 하다보면, 본의 아닌 이유로 중복된 데이터를 입력하게 되는 경우가 있습니다. 저의 경우 최근에 주식 관련된 데이터를 파싱해오고, 여러개의 데이터를 병합하는 과정에서 중복된 데이터가 존재하게 되었습니다. 그래서 처음에는 관련된 부분들을 손수 삭제하기 시작했는데, 어느 순간 그 부분이 손으로 하기에는 너무 많은 존재가 되어 버렸습니다. 그래서 이번에는 관련해서 행(Row)기반으로 중복된 데이터를 찾는 방법에 대해서 포스팅을 해보고자 합니다. 먼저 샘플 코드를 보면 다음과 같습니다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 import pandas as pd # Series 생성 d..
이번 포스팅에서는 실제 많은 데이터를 관리하는 엑셀 또는 CSV 파일 형태에서 Pandas의 DataFrame으로 바로 가져오는 방법을 알아보고자 합니다. 실제 많은 데이터들이 CSV 형태로 되어 있다 보니, 파일 불러오기 등을 활용해서 불러 오는 경우도 많습니다. 하지만, 이럴 경우 열이 끝나는 곳까지 루프를 돌려야 하고, 또한 여러가지로 복잡합니다. CSV파일 DataFrame으로 가져오기 그래서 Pandas에서 제공하는 부분을 활용해서 한번 CSV파일을 바탕으로 DataFrame을 생성하는 방법에 대해서 살펴보고자 합니다. 먼저 그럼 다음 데이터를 바탕으로 진행을 해보겠습니다. 혹 저의 코드를 따라 하실 분들을 위해서, 위의 파일또한 다음과 같이 첨부드립니다. 그럼 이제부터는 한번 파일을 가지고 작..
이번 포스팅에서는 Numpy데이터을 외부 추출하는 방법에 대해서 살펴볼려고 합니다. 물론 Pandas등을 통해서 CSV 파일로 추출하는 방법들을 매우 대중화 되어 있습니다. 그래서 많은 분들은 일정한 단계를 걸쳐 Pandas를 이용한 CSV파일로 추출을 합니다. 저는 바로 Pandas DataFrame으로 변환하여 CSV파일을 추출하는 방법과 바로 Numpy에서 CSV 파일을 추출하는 방법에 대해서 살펴보겠습니다. Pandas DataFrame으로 변환하여 CSV파일 추출하기 실제 Numpy array를 Dataframe으로 변환하여 CSV파일을 추출하기 위해서는 다음 단계를 걸쳐야 합니다. 1. numpy array을 pandas DataFrame으로 변경 2. CSV 파일로 저장 그럼 다음 예시를 통..
종종 재무 관련된 부분들을 살펴볼 때 흔히들 많이 날짜부분들을 인덱스로 많이 사용하고 합니다. 실제 많은 서적이나 예시등에서도 관련된 부분들을 사용하고 있습니다. 그래서 이번에는 Pandas에서도 관련된 함수에 대해서 한번 살펴보고자 합니다. 우선 Pandas에서도 다음과 같은 함수를 통해서 일련된 날짜 생성등을 활용할 수 있게 지원하고 있습니다. date_range() 그럼 이를 바탕으로 간단한 예를 살펴보도록 하겠습니다. example) import pandas as pd print (pd.date_range('1/1/2020', periods=5))cs result) DatetimeIndex(['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-04', '20..
이전 포스팅에서는 loc()를 이용하여 각 인덱스(label) 값을 바탕으로 데이터를 선별하는 방법에 대해서 살펴봤습니다. 하지만, 생각보다 키값 또는 인덱스 값을 정확히 알고 있는 사람들이 많지 않을 수 있습니다. 따라서, 이번 포스팅에서는 이전 포스팅과는 달리, 숫자를 이용한 범위 지정 또는 데이터를 선택하는 방법에 대해서 살펴보고자 합니다. 이와 같은 숫자를 이용하여 데이터를 선택하거나 범위를 지정하는 방식에 사용되는 함수는 다음과 같습니다. iloc() - 숫자를 이용한 범위 또는 데이터 선택 그럼 예시를 보면서 하나식 살펴보도록 하겠습니다. example) 특정 열까지 데이터 출력 import pandas as pd import numpy as np df = pd.DataFrame(np.rand..
Pandas에서는 아시다시피 DataFrame을 매우 중요한 역할입니다. 하지만, 사용자가 원하는 데이터 값을 얻고자 한다면 반드시 정렬하는 등의 값이 필요로 합니다. 이 부분에 대해서는 크게 2가지 형태로 정렬할 수 있습니다. 크게 Column, Row의 인덱스(Label)을 바탕으로 정렬할 수 있습니다. 또한 값을 바탕으로 정렬할 수 있습니다. 그 방법에 대해서 살펴보겠습니다. 그럼 다음 예시에 보이는 데이터 값을 바탕으로 정렬를 진행해보고자 합니다. example) import pandas as pd udf=pd.DataFrame([[11,21],[14,24],[12,22],[13,23],[10,20],[15,25]], index=[1,4,2,6,3,0], columns=['N2','N1']) pr..