파이썬으로 웹 스크랩하기
과거에는 컴퓨터하는것과 인터넷 하는것은 동일하지 않았습니다. 현재에 컴퓨터 하다는 인터넷 하다와 동일시 되고 있습니다. 최소한 인터넷을 하지 않아도 네트워크로 연결된 무엇인가를 하는것입니다.
파이썬으로 웹 페이지를 스크랩하기 위한 방법은 세가지 방법이 있습니다.
1. webbrowser
2. requests
3. Beautiful Soup
4. Selenium
위의 네가지 방법으로 인터넷의 웹페이지를 읽어와서 분석하는 방법에 대해서 알아보도록 하겠습니다.
파이썬으로 웹 스크랩하기1/10
첫번째 방법
webbrowser로는 웹 브라우저를 여는 역할을 하고 있습니다. 웹페이지 내용은 가져오지 못하지만 유용하게 사용할 때가 있겠지요.
위의 코드는 네이브 웹페이지를 브라우저로 여는 작업을 수행합니다.
웹브라우저로 다음 홈페이지가 열리는 것을 확인할 수 있습니다.
첫번째 방법은 html을 가져와서 파싱하는 작업은 없고 웹브라이저를 실행시켜주는 역할을 하고 있습니다. 스크립트로 브라우저를 실행하는 경우에 유용하게 사용될 것입니다.