Day 8 - 크롤링(3)
이번 글에서는 우선 알라딘의 원페이지 및 순회 크롤링 실습을 정리하고, browserless 크롤링에 대해 다룰 것이다. 우선 알라딘 사이트에서 베스트셀러 목록의 원페이지 크롤링을 실습한 것이다. div태그로 설정되어 있는 책 한 권마다의 block에서, li태그로 설정되어 있는 것 중 작가 목록만 가져오는 과정이 어려웠다. 다행히 몇 번 오류와 수정을 통해 수행할 수 있었다. 원페이지 크롤링을 토대로 알라딘의 주간 베스트셀러 전체 목록에 대한 순회 크롤링 역시 수행했다. 각 block마다 li태그로 설정되어 있는 순서가 달라서, 작가 목록만 가져오는 과정이 복잡했고, if문으로 일단 해결했지만 다른 효율적인 방법을 찾아봐야겠다는 생각을 했다. 그 이후 requests 라이브러리를 이용한 browserl..
2022.10.14