같은 라이브러리를 이용해서 PDF를 바로 XLS로 변환하는 방식도 있는데 XML로 변환 후 XLSX로 변환하는 방식을 추천하길래 따라서 해봤습니다.
간단한 텍스트가 있는 PDF는 꽤 괜찮게 변환이 되는데 아쉬운점은 표가 삽입되어있다거나 하는 경우는 변환이 원활하지 않았습니다.
일단은 참고로 남겨두기 위해 작성해두는 것이니 만약 이 글을 보시는 분이 계시다면 참고로만 봐주세요.
변환을 위해서는 aspose pdf, cells 라이브러리가 필요합니다.
해당 라이브러리의 다른 버전이나 추가 정보가 필요하신 분들은 아래 링크를 참고하세요.
https://mvnrepository.com/artifact/com.aspose/aspose-pdf/20.3
https://mvnrepository.com/artifact/com.aspose/aspose-cells/20.3
먼저 Repository를 추가해줍니다. (저는 maven을 사용했습니다.)
<repository>
<id>aspose</id>
<url>https://artifact.aspose.com/repo/</url>
</repository>
그리고 dependency 추가
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>20.3</version>
</dependency>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-cells</artifactId>
<version>20.3</version>
</dependency>
aspose-pdf는 pdf와 관련된 라이브러리이고 aspose-cells는 엑셀과 관련된 라이브러리입니다.
두 라이브러리를 함께 사용해서 PDF 파일을 엑셀로 변환 할 수 있습니다.
Document doc = new Document("2020_03.pdf");
ExcelSaveOptions excelSave = new ExcelSaveOptions();
doc.save("2020_03.xml", excelSave);
Workbook workbook = new Workbook("2020_03.xml");
workbook.save("2020_03.xlsx", SaveFormat.XLSX);
[JAVA] pdfbox 텍스트 구분자 넣기 (0) | 2020.11.21 |
---|---|
[JAVA] PDF 파일 텍스트 읽기 (0) | 2020.04.09 |
[JAVA] try-with-resources와 Multi-catch Exceptions (0) | 2016.08.27 |
[JAVA] 자바에서 자바스크립트 실행 (0) | 2016.02.17 |
[egov] 전자정부프레임워크로 인한 package javax.servlet.jsp.tagext does not exist 오류 (0) | 2015.08.05 |