파이썬으로 웹 스크랩하기4/10

파이썬으로 웹 스크랩하기4/10 이번에는 읽어온 내용을 파일로 저장하는 방법에 대해서 알아보도록 하겠습니다. 이전 강좌 파이썬으로 파일 다루기에서 파일을 읽고 쓰는 방법에 대해서 알아보았었습니다. 이방법을 잘 이용하여 읽어온 html내용을 저장해보도록 하겠습니다. requests 모듈로 부터 읽어온 html파일은 e:\test\daum.html로 저장하는 코드입니다. 위의 코드를 실행하면 아래와 같은 결과를 얻을수 있습니다. 오류가 났는데요. UniCodeEncodeError이 났습니다. 이번에는 open을 “wb”옵션으로 open해 보도록 […]

파이썬으로 웹 스크랩하기3/10

파이썬으로 웹 스크랩하기3/10 만약 웹페이지 주소가 틀린경우는 어떻게 나올까요? 확인해보도록 하겠습니다. 웹페이지 주소에 https://www.daum3.net 이라고 넣고 실행시켜 보도록 하겠습니다. 위와 같이 오류가 발생한것을 확인할 수 있습니다. 이번에는 읽어온 웹페이지의 글자수를 출력해 보도록 하겠습니다. response.text는 결과값의 문자열을 돌려 줍니다. 아래와 같이 232341글자로 이루어 졌다는 것을 확인할 수 있습니다. 그러면 이러한 텍스트가 어떻게 이루어져 있는지 출력해 보겠습니다. […]