파이썬으로 웹 스크랩하기1/10

파이썬으로 웹 스크랩하기



과거에는 컴퓨터하는것과 인터넷 하는것은 동일하지 않았습니다. 현재에 컴퓨터 하다는 인터넷 하다와 동일시 되고 있습니다. 최소한 인터넷을 하지 않아도 네트워크로 연결된 무엇인가를 하는것입니다.

 

파이썬으로 웹 페이지를 스크랩하기 위한 방법은 세가지 방법이 있습니다.



1. webbrowser

2. requests

3. Beautiful Soup

4. Selenium



위의 네가지 방법으로 인터넷의 웹페이지를 읽어와서 분석하는 방법에 대해서 알아보도록 하겠습니다.

 

파이썬으로 웹 스크랩하기1/10

첫번째 방법

 

webbrowser로는 웹 브라우저를 여는 역할을 하고 있습니다. 웹페이지 내용은 가져오지 못하지만 유용하게 사용할 때가 있겠지요.



 

위의 코드는 네이브 웹페이지를 브라우저로 여는 작업을 수행합니다.

 

 

 

웹브라우저로 다음 홈페이지가 열리는 것을 확인할 수 있습니다.

 

첫번째 방법은 html을 가져와서 파싱하는 작업은 없고 웹브라이저를 실행시켜주는 역할을 하고 있습니다. 스크립트로 브라우저를 실행하는 경우에 유용하게 사용될 것입니다.

 

파이썬으로 웹 스크랩하기1/10

파이썬으로 웹 스크랩하기2/10

파이썬으로 웹 스크랩하기3/10

파이썬으로 웹 스크랩하기4/10

파이썬으로 웹 스크랩하기5/10

파이썬으로 웹 스크랩하기6/10

파이썬으로 웹 스크랩하기7/10

파이썬으로 웹 스크랩하기8/10

파이썬으로 웹 스크랩하기9/10

파이썬으로 웹 스크랩하기10/10

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다

This site uses Akismet to reduce spam. Learn how your comment data is processed.