티스토리 뷰
selenium을 메인화면부터 접근시키니 시간이 굉장히 오래걸렸다.
그래서 파라미터까지 url에 넣고 블로그 검색화면으로 바로 들어갈 수 있게 만들었다.
그렇게 하니 속도가 2배정도 빨라졌고 속도문제는 어느정도 해결이 될 것 같다.
그래도 서비스라고 하기엔 너무 느린속도이긴하다.
- 해야할 것
- 상단에 나타낼 정보 추가적으로 크롤링
- multiprocessing 적용해서 속도가 더 향상될 수 있는지 확인
– “takes 0 positional arguments but 1 was given” 오류가 나서 파라미터에 query를 추가해서 해결
– 이상하게도 실행이 2번됨 그리고 빨라지지도 않음 방법을 다시 고민해봐야 할 것 같음
'web crawling' 카테고리의 다른 글
[web crawling] jsoup select로 파싱하기 vs 정규식으로 파싱 하기 (0) | 2020.07.28 |
---|---|
웹크롤링 robots.txt (0) | 2020.01.18 |
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 클래스
- Java
- BFS
- 입출력장치
- 재귀함수
- 구조체
- C++
- 인접리스트
- C
- 세마포어
- Stack
- 인접행렬
- 알고리즘
- stackframe
- 병행프로세스
- 동적프로그래밍
- 이진탐색
- 스텍
- 교착상태
- 운영체제
- dfs
- 배열
- 자료구조
- client side rendering
- react
- 최단경로
- 소프트웨어
- 퀵정렬
- server side rendering
- javascript
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
글 보관함