web crawling
selenium 속도문제 url 직접연결, multiprocessing
tonirr
2020. 1. 18. 18:30
selenium을 메인화면부터 접근시키니 시간이 굉장히 오래걸렸다.
그래서 파라미터까지 url에 넣고 블로그 검색화면으로 바로 들어갈 수 있게 만들었다.
그렇게 하니 속도가 2배정도 빨라졌고 속도문제는 어느정도 해결이 될 것 같다.
그래도 서비스라고 하기엔 너무 느린속도이긴하다.
- 해야할 것
- 상단에 나타낼 정보 추가적으로 크롤링
- multiprocessing 적용해서 속도가 더 향상될 수 있는지 확인
– “takes 0 positional arguments but 1 was given” 오류가 나서 파라미터에 query를 추가해서 해결
– 이상하게도 실행이 2번됨 그리고 빨라지지도 않음 방법을 다시 고민해봐야 할 것 같음