Tek değiştirmeniz gereken elinizdeki dosya türünün uzantısı. Ben bir html dosyasını kullandım ancak bu aşağıdaki gibi html kodları içeren bir text dosyası ya da başka bir dosya türü de olabilirdi.
HTML DOSYASI
<html> <head> <title> Java4Fun - JSOUP DERSLERİ </title> </head> <body> <p>Java İle HTML Dosyası Nasıl Okunur</p> <p>JSoup Kullanarak Text Dosyasındaki HTML Verisini Parçalama</p> </body> </html>
HelloWorld.java
import java.io.File; import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; public class HelloWorld { public static void main(String[] args) { try { File file = new File("K:/index.html"); Document doc = Jsoup.parse(file, "UTF-8"); System.out.println("Sayfa Başlığı : " + doc.title() + "\n"); //P etiketini tasiyan tum elementleri getir Elements elements = doc.getElementsByTag("p"); //Elements nesnesi icerisindeki her bir p elementinin icerigini yaz for (Element e : elements) { System.out.println(e.text()); } } catch (IOException e) { e.printStackTrace(); } } }#KAYNAK
http://jsoup.org/cookbook/input/load-document-from-file
0 yorum:
Yorum Gönder