1. BeautifulSoup를 이용한 크롤링 준비 작업

2018. 5. 18. 21:20Coding/Python

728x90

파이썬 설치 강좌는 많으니, 건너뛰겠습니다.

맥으로 진행하지만,

파이썬으로 하기에  윈도우도 같습니다.


아마도 4단계로 나눠서,

아래와 같이 진행될꺼 같습니다.



1장. 준비작업 

2장. 음원차트 크롤링

3장. List, Dict(사전형) / CSV, Json

4장. 이미지 추출







0. 환경

python이 설치되어있고, 환경변수가 등록되어있는 상태

Chrome 브라우져




1. 설치

터미널이나 cmd창에서

pip install requests

pip install BS4

입력해서 requests와 Beautifulsoup를 설치해줍시다.





2. 설치 확인

pip list

입력해서 아래와 같이 잘 설치 되었는지 확인합니다.

파란표시가 다 설치됬으면 끝.

파이썬 처음 설치한거면, 위처럼 많이 뜨지 않고,

[표시한 3개+기본적으로 있는 3개] 정도해서

6개 정도가 리스트에 뜨는게 맞습니다.



requests는 원하는 웹 페이지를 가져오는거라 생각하시면되고,

BS4는 BeautifulSoup를 이용해서 requests로 가져온 내용중, 필요한 내용을 추출해내는 역할을 한다고 생각하면 됩니다.







728x90