헉!!/jsp, java
[JAVA] PDF to XLS
권태성
2020. 4. 9. 21:48
같은 라이브러리를 이용해서 PDF를 바로 XLS로 변환하는 방식도 있는데 XML로 변환 후 XLSX로 변환하는 방식을 추천하길래 따라서 해봤습니다.
간단한 텍스트가 있는 PDF는 꽤 괜찮게 변환이 되는데 아쉬운점은 표가 삽입되어있다거나 하는 경우는 변환이 원활하지 않았습니다.
일단은 참고로 남겨두기 위해 작성해두는 것이니 만약 이 글을 보시는 분이 계시다면 참고로만 봐주세요.
변환을 위해서는 aspose pdf, cells 라이브러리가 필요합니다.
해당 라이브러리의 다른 버전이나 추가 정보가 필요하신 분들은 아래 링크를 참고하세요.
https://mvnrepository.com/artifact/com.aspose/aspose-pdf/20.3
https://mvnrepository.com/artifact/com.aspose/aspose-cells/20.3
먼저 Repository를 추가해줍니다. (저는 maven을 사용했습니다.)
<repository>
<id>aspose</id>
<url>https://artifact.aspose.com/repo/</url>
</repository>
그리고 dependency 추가
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>20.3</version>
</dependency>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-cells</artifactId>
<version>20.3</version>
</dependency>
aspose-pdf는 pdf와 관련된 라이브러리이고 aspose-cells는 엑셀과 관련된 라이브러리입니다.
두 라이브러리를 함께 사용해서 PDF 파일을 엑셀로 변환 할 수 있습니다.
Document doc = new Document("2020_03.pdf");
ExcelSaveOptions excelSave = new ExcelSaveOptions();
doc.save("2020_03.xml", excelSave);
Workbook workbook = new Workbook("2020_03.xml");
workbook.save("2020_03.xlsx", SaveFormat.XLSX);
728x90