◽ Spring, SpringBoot

[Spring - (6) ] 특정 사이트 값 추출하기(웹 크롤링) - Jsoup

참고 : https://coding-start.tistory.com/31, https://gbsb.tistory.com/83

jsoup 라이브러리 추가하기 - pom.xml


1
2
3
4
5
<dependency>
  <groupId>org.jsoup</groupId>
  <artifactId>jsoup</artifactId>
  <version>1.11.2</version>
</dependency>

  위의 코드를 pom.xml에 넣어준다.

 

예시 : 네이버 날씨 정보 크롤링 하기 - Controller


1
2
3
4
5
6
7
8
        String URL = "https://weather.naver.com/rgn/cityWetrMain.nhn";
        Document doc = Jsoup.connect(URL).get();
        Elements elem = doc.select(".tbl_weather tbody>tr:nth-child(1)");
        String[] str = elem.text().split(" ");
        Elements elem2=doc.select(".tbl_weather tbody>tr:nth-child(1) img");
 
        model.addAttribute("test1", elem);
        model.addAttribute("test2", elem2);
Color Scripter

3번째 라인 결과물은 아래의 그림과 같다.

 

결과 - jsp


1
2
3
4
<body>
<P>  The Test is ${test1 }  </P>
<P>  The Test is ${test2 }  </P>
</body>

푸터바