파이썬으로 웹 스크랩하기9/10

파이썬으로 웹 스크랩하기9/10 h1 정보를 가져와 보도록 하겠습니다. 위의 코드는 BeautifulSoup에서 html을 가져와서 원하는 부분의 값을 가져오는 부분을 추가한 소스입니다. html을 selenium을 가져와서 BeautifulSoup을 이용하면 좀더 쉽게 html 소스의 내용을 가져올 수 있습니다. 위와 같이 h1의 내용을 가져오는 것을 확인할 수 있습니다. requests 를 사용하는 것과 selenuim을 사용하는것의 차이는 사실상 거의 없습니다. 작업을 하다 찾은건데 […]

파이썬으로 웹 스크랩하기8/10

파이썬으로 웹 스크랩하기8/10 셀레늄을 이용하여 html 가져오기 셀레늄을 사용하기 위해서는 드라이버를 가져와야 합니다. 크롬 드라이버를 다운로드 받기 위해서는 아래 주소에 접속해서 가져오면 됩니다. https://sites.google.com/a/chromium.org/chromedriver/downloads 위의 사이트에서 ChromeDriver 2.40을 클릭하면 아래와 같이 다운로드 할수 있는곳이 나옵니다. 위에서 사용중인 OS의 드라이버를 다운로드 받습니다. html을 가져오는 소스는 아래와 같습니다. 위의 코드를 실행하면 아래와 같은 결과를 얻을수 있습니다. 너무 […]