Jsoup 3

[Crawling] 닌텐도 온라인 스토어 크롤링하기 2022.12.28

Introduce 주제 닌텐도 온라인 스토어 사이트의 게임 타이틀, 발매일 및 가격 크롤링 개발환경 IDE : Eclipse EE JDK : 14.0.1 Java 라이브러리 : jsoup-1.14.3.jar 타겟 사이트 https://store.nintendo.co.kr/games?game_category=15%2C23%2C24%2C19%2C43&publisher=14 타겟 데이터 타이틀 발매일 가격 게임 정보 크롤링 1) Jsoup의 connect() 메서드를 이용해 Connection 객체를 얻은 후 get() 메서드로 Document 타입의 doc에 저장 // 타겟 사이트 final String URL = "https://store.nintendo.co.kr/games?game_category=15..

[Java] Jsoup을 이용하여 웹 크롤링하기 2022.12.11

IDE : Eclipse EE JDK : 14.0.1 OS : Windows 10 1) Java Project에 Jsoup 라이브러리 추가 Jsoup은 기본으로 제공하는 라이브러리가 아님 Jsoup을 사용하기위해서는 프로젝트에 추가해줘야 함 Jsoup 라이브러리 다운 받기 Download and install jsoup Download and install jsoup jsoup is available as a downloadable .jar java library. The current release version is 1.15.3. What's new See the 1.15.3 release announcement for the latest changes, or the changelog for the ..

[Java] Jsoup 라이브러리 2022.12.10

Jsoup 이란? real-world HTML을 다루기위한 Java 라이브러리 URL을 fetch하고 HTML5 DOM의 method 와 CSS selector를 사용하여 데이터를 추출 및 처리하는 편리한 API를 제공 URL, 파일, 문자열을 통해 HTML을 파싱할 수 있음 String html = "" + "Parsed HTML into a doc."; Document doc = Jsoup.parse(html); parse(String html, String baseUri) 인자로 들어온 html을 파싱하는 메소드 - html : 파싱하기위한 HTML - baseUri : 상대경로를 절대경로로 확인하기위해 사용되는 argument parse(String html) DOM traversal 또는 CSS..