[TIL] 네이버 종목토론실 스크래핑
Holly Yoon
필요한 라이브러리 불러오기 # requests, bs4, pandas 불러오기 import requests from bs4 import BeautifulSoup as bs import pandas as pd 네이버 종목토론실에서 게시글의 정보(제목, 링크)를 불러오기 board_url : 종목토론실의 url은 code_no, page_no으로 구성되어있으며, 해당 정보는 pagination을 클릭하여 network탭에서 확인할 수 있다. str.replace() : 게시글의 url을 수집하기 위해서 a태그의 title attribute를 이용하려고 합니다. 이를 위해서는 제목 상의 '[덧글갯수]' 해당 부분을 삭제해주어야한다. 정규식을 사용한다 (\s* : space 존재 \d+ : 여러개의 숫자가 옴)..