파이썬으로 웹 스크랩하기6/10 daum.net의 웹페이지를 확인해보도록 하겠습니다. 크롬에서 daum.net으로 접속해보도록 하겠습니다. 위와같이 웹페이지에 접속하고 F12키를 클릭하면 아래와 같이 개발자 도구가 나타납니다. 상단의 화살표를 클릭하면 화면에 가져다 대면 우측에 해당 하는 html이 오른쪽 화면에 나타나게 됩니다. HTML을 보면 위에 나와있는 DOM구조처럼. 하이라키 구조를 가지는것을 확인할 수 있습니다. 우측상단의 아이콘을 클릭하고 클릭하면 개발자 도구는 브라우저 윈도우와 떨어져 […]
카테고리 글 보관함:파이썬
파이썬으로 웹 스크랩하기5/10
파이썬으로 웹 스크랩하기5/10 세번째는 Beautiful Soup을 이용해서 읽어온 html의 내용을 분석하는 방법에 대해서 알아보도록 하겠습니다. html을 읽어오기 위해서는 DOM에 대해서 알아야 하는데요. “문서 객체 모델(DOM; Document Object Model)은 객체 지향 모델로써 구조화된 문서를 표현하는 형식이다. DOM은 플랫폼/언어 중립적으로 구조화된 문서를 표현하는 W3C의 공식 표준이다. DOM은 또한 W3C가 표준화한 여러 개의 API의 기반이 된다.DOM은 HTML 문서의 […]