티스토리 뷰

카테고리 없음

크롤링 허용범위

tonirr 2020. 1. 18. 18:30

네이버 api를 통한 블로그 크롤링을 시도하였으나 썸네일이 나오지 않아 request로 할 수 있는 다른방법을 찾아보았으나 네이버에서 막아놓아 접근할 수 없었다.

 

알아보니 내가 크롤링 하고자 하는 사이트의 마지막에 /robots.txt를 입력하면 로봇이 접근할 수 있는 허용범위가 나타나게 되는데 네이버는 모든 사용자에게 disallow해놓은 상태였다.

 

따라서 request만으로는 내가 원하는 정보를 가져올 수 없고 다른방법인 selenium을 통해 가져오는 방법을 찾아보아야겠다.

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함