Appia의 IT세상

파이썬[Python] 구글 리뷰 엑셀로 추출하기 본문

Python/Python 응용

파이썬[Python] 구글 리뷰 엑셀로 추출하기

Appia 2023. 1. 26. 06:45
반응형

파이썬[Python] 구글 리뷰 엑셀로 추출하기

파이썬[Python] 구글 리뷰 엑셀로 추출하기

이전 포스팅에서 구글 앱 평점 및 리뷰 크롤링하기라는 주제로 포스팅을 해봤습니다. 하지만, 작업을 하다보니, 작업스럽게 결과물 자체를 파일로 가져가야하고, 이 부분에 대해서 어떤 형태가 좋을까 고민을 많이 해봤습니다. 실제로 가장 간단하게  많이하는 방법은 바로 csv 파일 형태로 추출하는 것입니다. 하지만, 이모티콘 등을 표시하는데에 제약이 많고, 그런 부분들을 고려했을 때, 엑셀로 추출하는 것을 방법 또한 괜찮은 방법이라는 것을 인지하고 있습니다. 그래서 이번 포스팅에서는 앞선 포스팅에서 추출한 리뷰를 엑셀로 추출하는 방법에 대해서 간단히 이야기를 해보고자 합니다. 

 

파이썬[Python] 구글 앱 평점 및 리뷰 크롤링하기

 

파이썬[Python] 구글 앱 평점 및 리뷰 크롤링하기

파이썬[Python] 구글 앱 평점 및 리뷰 크롤링하기 이전에 다양한 경로로 저에게 많은 부탁을 하신 분들이 있습니다. 그중 한 앱 개발자분께서는 저의 경쟁사 게임의 리뷰에 대해서 크롤링을 요청

appia.tistory.com

 

일단, 다음과 같은 순서로 진행이 필요로합니다. 

1. Pandas 모듈 불러오기 

2. 저장된 결과값을 DataFrame으로 변경하기 

3. Excel로 추출하기 

 

그럼 위의 포스팅에서 사용한 코드를 약간 수정하여 다음과 같이 작성을 하였습니다. 

import google_play_scraper as gps
import pandas

country = 'us'
lang = 'ko'
id = 'com.simplywerx.compass3d'

result_a  = gps.reviews_all(
    id,
    sleep_milliseconds=2000,  # defaults to 0
    lang=lang,  # defaults to 'en'
    country=country,  # defaults to 'us'
    sort=gps.Sort.NEWEST,  # defaults to Sort.MOST_RELEVANT
    filter_score_with=None  # defaults to None(means all score)
)

df1 = pandas.DataFrame(result_a)

df1.to_excel('Data.xls')

이 부분을 바탕으로 다음과 같이 엑셀로 추출한 결과를 확인할 수 있습니다. 

엑셀로 추출한 결과

이와 같은 방법으로 추출한 결과에 대해서 엑셀로 추출할 수 있습니다. 생각보다 나오는 결과가 매우 간단한 것을 알 수 있습니다. 실제로, review_all의 결과가 dictionary 형태들의 List들로 구성이 되어서 이와같이 추출하기에 매우 용이합니다. 

 

파이썬[Python] 구글 앱 평점 및 리뷰 클롤링을 위한 google_play_scraper 설치하기

 

파이썬[Python] 구글 앱 평점 및 리뷰 클롤링을 위한 google_play_scraper 설치하기

파이썬[Python] 구글 앱 평점 및 리뷰 클롤링을 위한 google_play_scraper 설치하기 예전에 주변 사람들에게 현재 개발하고 유지 보수하고 있는 앱들에 대한 평점 및 리뷰를 크롤링 해줄 수 있냐는 문의

appia.tistory.com

 

이번 포스팅에서는 파이썬[Python] 구글 리뷰 엑셀로 추출하기라는 주제로 포스팅을 해봤습니다. 실제 이 부분들을 다른 사람들은 크몽등에서 의뢰를 하기도 하고, 이 부분을 바탕으로 통계 및 CS등에서 사용하기도 합니다. 본인이 필요하신 부분에서 잘 활용하시길 바랍니다. 감사합니다. 

반응형
Comments