Appia의 IT세상

[파이썬 크롤링]네이버 주식 시가 총액 코스닥전체 항목 출력하기 본문

Python/Python Crawler[크롤러]

[파이썬 크롤링]네이버 주식 시가 총액 코스닥전체 항목 출력하기

Appia 2021. 9. 27. 06:42
반응형

[파이썬 크롤링]네이버 주식 시가 총액 코스닥전체 항목 출력하기

[파이썬 크롤링]네이버 주식 시가 총액 코스닥전체 항목 출력하기

이전 포스팅에서는 네이버 금융에 있는 정보를 토대로, 코스피 지수 종목들의 항목들을 출력하는 방법에 대해서 포스팅을 해봤습니다. 물론 저의 경우 코스피위주의 투자를 하기 때문에 이와 같은 방식으로 투자 종목들을 선별하는데, 제 글을 보시는 분들중에 코스닥에 있는 종목들에 대해서도 출력하고싶어 하시는 분들이 있을 수 있겠다라는 생각을 해보게 되었습니다. 그래서 이전 포스팅을 바탕으로 약간의 변화를 줘서, 코스닥에 있는 종목들에 대해서 출력하는 포스팅을 해보도록 하겠습니다. 

 

먼저, 이전에서 했던것와 같이 네이버 금융에서 어떤 부분들을 참고해야하는지에 대해서 살펴봤습니다. 이전과 비교해서 사이트 이름에 다음과 같은 부분들이 추가되었습니다. 

(코스피) https://finance.naver.com/sise/sise_market_sum.naver?&page=
(코스닥) https://finance.naver.com/sise/sise_market_sum.naver?sosok=1&page=

네이버 금융 시가 총액에서의 코스닥 부분

그리고 나서, 마지막 페이지의 수를 확인해봅니다. 좌측 하단에 보이는 부분과 같이 페이지가 31페이지까지 있는 것을 알 수 있습니다. 

네이버 금융 시가 총액에서의 코스닥 부분(마지막 페이지) 

위의 부분을 바탕으로 이전 포스팅에서 작성했던 코드를 약간의 변경을 주었습니다. 그럼 코드를 살펴보겠습니다. 

import requests
from bs4 import BeautifulSoup

def return_value(address):
    res = requests.get(address)
    soup = BeautifulSoup(res.content, 'html.parser')

    section = soup.find('tbody')
    items = section.find_all('tr', onmouseover="mouseOver(this)")
    for item in items:
        basic_info = item.get_text()
        sinfo = basic_info.split("\n")
        print("\t" + sinfo[1] + "\t\t" + sinfo[2] + "\t\t\t" + sinfo[3])

baseaddress = 'https://finance.naver.com/sise/sise_market_sum.naver?sosok=1&page='
for i in range(1,32):
    return_value(baseaddress+str(i))

위의 코드를 실행하면 다음과 같은 화면이 나타납니다. 

	1		셀트리온헬스케어			115,200
	2		에코프로비엠			470,600
	3		엘앤에프			190,400
	4		에이치엘비			60,300
	5		펄어비스			87,400
	6		셀트리온제약			156,600
<중간 생략>
	1506		이베스트이안스팩1호			2,165
	1507		케이프이에스제4호			2,260
	1508		대호특수강우			1,590
	1509		지유온			220
	1510		에이아이비트			174
	1511		소프트센우			33,500

이와 같은 방법으로 코스닥의 전체항목을 시가총액순으로 출력할 수 있습니다. 

[파이썬 크롤링]네이버 주식 시가 총액 코스피전체 항목 출력하기

이번 포스팅은 [파이썬 크롤링]네이버 주식 시가 총액 코스닥전체 항목 출력하기라는 주제로 포스팅을 해봤습니다. 실제로는 이 부분들 외에도 많은 정보들을 참조하여 투자의 지표로 만듭니다. 이런 부분들을 참조하고 유용하여 본인이 원하는 정보들을 바탕으로 투자지표를 만드시길 바랍니다. 감사합니다. 

반응형
Comments