17 Mayıs 2014 Cumartesi

JSoup - Dosyadan HTML Verisi Okumak

Javada JSoup kütüphanesini kullanarak bilgisayarınızdaki bir html dosyasını veya html etiketleri içeren bir metin dosyası gibi başka dosyalardaki html verisinin nasıl ayrıştırıldığını öğrenmek için aşağıdaki örneğe göz atın.

Tek değiştirmeniz gereken elinizdeki dosya türünün uzantısı. Ben bir html dosyasını kullandım ancak bu aşağıdaki gibi html kodları içeren bir text dosyası ya da başka bir dosya türü de olabilirdi.

HTML DOSYASI 

<html>
<head>
<title> Java4Fun - JSOUP DERSLERİ </title>
</head>

<body>

<p>Java İle HTML Dosyası Nasıl Okunur</p>
<p>JSoup Kullanarak Text Dosyasındaki HTML Verisini Parçalama</p>

</body>
</html>

HelloWorld.java

import java.io.File;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

public class HelloWorld {

 public static void main(String[] args) {

   try 
   {
       File file = new File("K:/index.html");
       Document doc = Jsoup.parse(file, "UTF-8");
       System.out.println("Sayfa Başlığı : " + doc.title() + "\n");
      
       //P etiketini tasiyan tum elementleri getir
       Elements elements = doc.getElementsByTag("p");
     
       //Elements nesnesi icerisindeki her bir p elementinin icerigini yaz
       for (Element e : elements) 
       {
            System.out.println(e.text());
       }
   } 
   catch (IOException e) 
   {
       e.printStackTrace();
   }

 }
}
#KAYNAK
http://jsoup.org/cookbook/input/load-document-from-file 

0 yorum:

Yorum Gönder

Java4Fun Copyright © 2011 | Template created by O Pregador | Powered by Templates de luxo