금융빅데이터연합학회 Find-A에서 NLP팀으로 활동하면서 평소 배우고 싶었던 ‘웹 크롤링’을 공부할 기회가 있었다.한 번 공부한 것을 놓치지 않도록 기록에 남겨보자. Google Chrome 개발자 도구에서 XPath 찾기
XPath는 XML 문서에서 특정 element에 접근하기 위한 경로를 지정하는 언어라고 한다.HTML이 웹페이지의 표시되는 것을 구성한다면 XPath는 그 표시되는 것의 기능과 내부 연결을 담당하는 셈이다.이 XPath가 웹 크롤링의 대상, 방법 등을 지정하는 도구로 사용되기 때문에 XPath를 찾는 방법부터 알아둘 필요가 있다.Google Chrome 기준 1) 상단 메뉴바 맨 오른쪽 ‘설정’ – ‘도구 더 보기’ – “개발자도구” 클릭 나오는 개발자도구 왼쪽 맨 위의 “직사각형 + 화살표” 버튼 클릭→ XPath 찾고 싶은 소스에 클릭 2) XPath를 찾고 싶은 소스 우클릭 – “스캔”
Google Chrome 설정 – 도구 더 보기 – 개발자 도구
우클릭 – 검사
이렇게 간편하게 화면 오른쪽에 XPath가 표시되는 것을 확인할 수 있다.XPath가 뜨는 걸 확인했기 때문에 웹 크롤링을 할 준비가 된 것 같다.
참고 자료
참고 자료