coding
파이썬 독학 17일차 pagination 페이지 탐색
다아는사람
2022. 9. 17. 00:00
728x90
반응형
SMALL
이제 직업 목록을 파싱해오는 것은 끝났다.
그 다음으로 중요한 페이지를 공부해볼 것이다.
사이트의 job list는 한 페이지만 있지 않다. 여러개의 페이지가 있으며
몇 개의 페이지가 있는지 알아 냈다면 각 페이지에 browser.get을 요청할 것이다.
페이지를 살펴보니 총 6개의 pagination <li>가 있다.
이 전 포스팅과 같은 방법으로 가져오면 끝
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from bs4 import BeautifulSoup
def get_page_count(keyword):
options = Options()
options.add_argument("--no-sandbox")
options.add_argument("--disable-dev-shm-usage")
base_url ="https://www.indeed.com/jobs?q="
pagination = webdriver.Chrome(options=options)
pagination.get(f"{base_url}{keyword}")
soup = BeautifulSoup(pagination.page_source, 'html.parser')
pagination = soup.find('ul', class_="pagination-list")
pages = pagination.find_all('li', recursive = False)
print(pagination.page_source)
# print(len(pages))
get_page_count("python")
EZ
728x90
반응형
LIST