Merhaba arkadaşlar. Bu yazıda sizlere doc ve docx dosyalarının içeriğinin nasıl okunabileceğini anlatmaya çalışacağım.
Dosyalar ile işlem yaptığımızda bazen içeriğini okumaya ihtiyacımız olur. Ama Java ile direk Microsoft dökümanlarını okuyamayız. Bunun için Apache Vakfı bazı .jar dosyaları hazırlamış. (Apache de olmasa halimiz haraptı 😀 ) .jar dosyalarını indirmek için burayı kullanabilirsiniz. Adresten POI 3.10.1 available başlığı altından Binary Distribution bölümünden tar.gz ya da zip uzantılı dosyayı indirin arkadaşlar ve bir klasöre çıkartın.
Daha sonra Java projesi açın ve Libraries kısmını aşağıdaki resimdeki gibi düzenleyin. Kullancağınız .jar dosyaları poi-3.10.1 ve ooxml-lib klasörleri içinde yer almaktadır.
Daha sonra kodunuzu şu şekilde düzenleyin:
package javaapplication1; import java.io.*; import org.apache.poi.xwpf.extractor.XWPFWordExtractor; import org.apache.poi.xwpf.usermodel.XWPFDocument; public class JavaApplication1 { public static void main( String[] args ) { try { FileInputStream fis = new FileInputStream("C:\Users\ilkay\Desktop\ödev.docx"); XWPFWordExtractor oleTextExtractor =new XWPFWordExtractor(new XWPFDocument(fis)); System.out.print(oleTextExtractor.getText()); } catch (Exception e) { e.printStackTrace(); } } }
Örneğin benim bilgisayarımın masaüstünde bir ödev dosyası var. Bu dosyasının okunmasını sağlayacağım. Öncelikle dosyanın okunması için FileInputStream ile akış başlatıyorum. Daha sonra bu dosyayı okuyup bilgilerini tutacak bir XWPFWordExtractor nesnesi tanımlıyorum ve bu nesneye bilgiler XWPFDocument sınıfına akış başlattığım nesneyi göndererek alınıyor.
Ekran Çıktısı
Örneğin ödevin içeriği şu şekilde:
Konsol çıktısı:
Başka bir yazıda görüşmek üzere sağlıcakla kalın arkadaşlar.
[…] kod parçasında da daha önce Java İle Doc/Docx Dosyasını Okuma yazımda anlattığım işlemi yapıyoruz. Bir string nesnesi içinde okunan bilgiler tutuluyor ve […]