Java

Java-Doc/Docx Dosyasının İçeriğini Okuma

Merhaba arkadaşlar. Bu yazıda sizlere doc ve docx dosyalarının içeriğinin nasıl okunabileceğini anlatmaya çalışacağım.

Dosyalar ile işlem yaptığımızda bazen içeriğini okumaya ihtiyacımız olur. Ama Java ile direk Microsoft dökümanlarını okuyamayız. Bunun için Apache Vakfı bazı .jar dosyaları hazırlamış. (Apache de olmasa halimiz haraptı 😀 ) .jar dosyalarını indirmek için burayı kullanabilirsiniz. Adresten POI 3.10.1 available başlığı altından Binary Distribution bölümünden  tar.gz ya da zip uzantılı dosyayı indirin arkadaşlar ve bir klasöre çıkartın.

Adsız

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Daha sonra  Java projesi açın ve Libraries kısmını aşağıdaki resimdeki gibi düzenleyin. Kullancağınız .jar dosyaları poi-3.10.1 ve ooxml-lib klasörleri içinde yer almaktadır.

Adsız

 

 

 

 

 

 

 

 

 

 

 

 

Daha sonra kodunuzu şu şekilde düzenleyin:

 

Örneğin benim bilgisayarımın masaüstünde bir ödev dosyası var. Bu dosyasının okunmasını sağlayacağım. Öncelikle dosyanın okunması için  FileInputStream ile akış başlatıyorum. Daha sonra bu dosyayı okuyup bilgilerini tutacak bir XWPFWordExtractor nesnesi tanımlıyorum ve bu nesneye bilgiler XWPFDocument sınıfına akış başlattığım nesneyi göndererek alınıyor.

Ekran Çıktısı

Örneğin ödevin içeriği şu şekilde:

Adsız

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Konsol çıktısı:

Adsız

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Başka bir yazıda görüşmek üzere sağlıcakla kalın arkadaşlar.