프로그램/데이터마이닝

웹 크롤링(scrapy) 강좌

네오류이 2021. 1. 12. 13:57
728x90
반응형

출처 : http://clien.net/cs2/bbs/board.php?bo_table=lecture&wr_id=296511

 

=============

 

하다보니 python, scrapy를 이용한 웹 크롤링 관련 동영상 강좌를 만들었습니다.

 

scrapy는 웹 크롤링을 위한 framework입니다.

다양한 파서를 지원하며, 로깅, 파이프라인, 링크 재귀 호출 등의 크롤링과 관련된 풍부한 기능을 제공하는 라이브러리입니다.

관심 있으신 분은 보시면 유용할 것 같습니다.

 

마지막에는 예제로 클리앙, 보배드림의 게시판 리스트를 분석하고 데이터를 획득하는 내용을 code로 설명드리고 있습니다.

 

동영상 강좌

https://www.youtube.com/playlist?list=PLWUxS6i2fXtip8sHElwRUubwWfLowlFA4

 

내용

1. 웹환경의 이해

2. 웹 크롤링_개발환경 구축

3. 웹크롤링_beautifulsoup4 & scrapy

4. 웹 데이터 저작권 및 사이트 정책

5. scrapy 구조

6. scrapy 실전

 

source code

https://github.com/onecue/scrapy_community

 

ppt

https://docs.google.com/presentation/d/1zYRXs6k_yDUqgbmBook17Wxz2zmCnpNdifUKDittDOc/edit?usp=sharing

https://docs.google.com/presentation/d/1dKQcrR8bQxh5Ji3FLLFA5sMPAVB1FO4uH9jMXCbzd2E/edit?usp=sharing

https://docs.google.com/presentation/d/1r_uJlPzxhBt8q6NxUYZBdf4MdOPFAJ6FCOpSpArWz10/edit?usp=sharing

 

PS. 다음 동영상은 'Deep Learning, TensorFlow 기초'를 준비 중입니다.

728x90
반응형

'프로그램 > 데이터마이닝' 카테고리의 다른 글

하둡 이란?  (0) 2021.01.13
하둡 에코시스템  (0) 2021.01.13
MS - 데이터 마이닝 개념  (0) 2021.01.12
MS - 리프트 차트(Analysis Services - 데이터 마이닝)  (0) 2021.01.12
데이터마이닝 알고리즘  (0) 2021.01.12