융무의 기술블로그
article thumbnail

xpath를 통해서 내가 원하는 부분만 가져오도록 하자.

혼자 selenium을 공부하면서 많은 블로그들을 보면서 독학을 했었다. 

내가 원하는 곳을 크롤링 하는 곳이 없어서 다른 사이트들 코드를 보면서 공부했었다.

 

http://www.menupan.com/restaurant/bestrest/bestrest.asp?pt=rt&areacode=jj201'

 

맛집TOP1000 - 매일매일 맛있게 메뉴판닷컴

2019년 11월 25일 오전 0시 40분 기준

www.menupan.com

이렇게 한페이지에 있는 모든 가게들을 순차적으로 들어가서 내가 데이터 분석을 하는데 있어 원하는 부분만을 가져오기 위해 selenium패키지를 이용해서 코드를 짜보려고 한다.

 

이렇게 실행을 아래와 같이 데이터프레임을 만들수 있는데 df.to_csv('맹수') 식으로 csv형태의 파일로 저장할수있다.

xpath를 잘 공부하다 보면 크롤링을 간단한 코드로 유용하게 사용할 수 있을거 같다.

profile

융무의 기술블로그

@융무

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!