파이썬으로 웹 스크랩하기7/10 그러면 h1을 어떻게 찾아오는지 확인해보도록 하겠습니다. 위와같이 BeautifulSoup를 사용하여 h1 태그의 내용을 가져와 보겠습니다. 아래는 위의 결과를 가져온 화면입니다. 보이시나요? daum의 h1은 이미지로 되어있으며 http://www.daum.net/ 으로 링크가 되어있는것을 확인할 수 있습니다. 위와같이 BeautifulSoup를 이용하면 웹페이지내에서 원하는 정보를 쉽게 가져올수 있습니다. 정규표현식등 별도로 파싱하는 작업을 하지 않아도 DOM 구조로 되어있는 문서는 모두 가져올수 […]
태그 글 보관함:파이썬
파이썬으로 웹 스크랩하기6/10
파이썬으로 웹 스크랩하기6/10 daum.net의 웹페이지를 확인해보도록 하겠습니다. 크롬에서 daum.net으로 접속해보도록 하겠습니다. 위와같이 웹페이지에 접속하고 F12키를 클릭하면 아래와 같이 개발자 도구가 나타납니다. 상단의 화살표를 클릭하면 화면에 가져다 대면 우측에 해당 하는 html이 오른쪽 화면에 나타나게 됩니다. HTML을 보면 위에 나와있는 DOM구조처럼. 하이라키 구조를 가지는것을 확인할 수 있습니다. 우측상단의 아이콘을 클릭하고 클릭하면 개발자 도구는 브라우저 윈도우와 떨어져 […]