4월에 만지작 거리던 프로젝트를 11월 말에야 다시 열어보게 되었는데.. pdf 파일 내 텍스트 추출은 https://blog.taeseong.me/394에서 했던 대로 처리를 했지만 표 같은 양식이 있는 파일들은 텍스트를 파싱하기에 좀 어려움이 있어서 어떻게 해야하나 하다가 아래 방법으로 해결했습니다. File source = new File(filePath); PDDocument pdfDoc = PDDocument.load(source); PDFTextStripper pts = new PDFTextStripper() { @Override protected void writeString(String text, List textPositions) throws IOException { writeString..
같은 라이브러리를 이용해서 PDF를 바로 XLS로 변환하는 방식도 있는데 XML로 변환 후 XLSX로 변환하는 방식을 추천하길래 따라서 해봤습니다. 간단한 텍스트가 있는 PDF는 꽤 괜찮게 변환이 되는데 아쉬운점은 표가 삽입되어있다거나 하는 경우는 변환이 원활하지 않았습니다. 일단은 참고로 남겨두기 위해 작성해두는 것이니 만약 이 글을 보시는 분이 계시다면 참고로만 봐주세요. 변환을 위해서는 aspose pdf, cells 라이브러리가 필요합니다. 해당 라이브러리의 다른 버전이나 추가 정보가 필요하신 분들은 아래 링크를 참고하세요. https://mvnrepository.com/artifact/com.aspose/aspose-pdf/20.3 https://mvnrepository.com/artifact/..
개인적으로 만들고 있는 프로그램에서 PDF 파일 내 텍스트를 가져와야하는 일이 있어서 사용했던 소스를 간략하게 정리해봅니다. pdfbox를 사용해서 PDF 파일을 읽어올 것이기 때문에 pdfbox dependency를 추가하거나 jar를 받습니다. https://mvnrepository.com/artifact/org.apache.pdfbox/pdfbox/2.0.19 org.apache.pdfbox pdfbox 2.0.19 사용법은 아주 간단합니다. String fileName = "2020_03.pdf"; File source = new File(fileName); PDDocument pdfDoc = PDDocument.load(source); String text = new PDFTextStripper..
CentOS 7 환경에서 MariaDB 10.1을 10.3으로 업데이트하며 남긴 내용입니다. https://mariadb.com/kb/en/upgrading-from-mariadb-101-to-mariadb-102/ MariaDB 사이트의 가이드를 참고했습니다. 1. MariaDB Repo 변경 # vi /etc/yum.repos.d/MariaDB.repo [mariadb] name = MariaDB baseurl = http://yum.mariadb.org/10.3/centos7-amd64 gpgkey=https://yum.mariadb.org/RPM-GPG-KEY-MariaDB gpgcheck=1 2. innodb_fast_shutdown=0 설정 # mysql -uroot -p --execute="..
웹 개발을 하면서 가장 귀찮은 부분이 기능을 테스트하기 위해 수 많은 입력 값들을 넣어야하는 것이었습니다.그 작업을 대신해주는 많은 방법들이 있지만 저는 Selenium을 사용해봤습니다.Selenium은 테스트 뿐만 아니라 브라우저에서 일어나는 수 많은 동작을 자동화해주는 도구입니다.Selenium의 공식 홈페이지 자바나 파이썬 같은 소스에서 자동화 코드를 작성할 수 있지만 이 포스트에서는 가장 기본적인 Selenium-IDE를 이용하여웹 브라우저에서 실행하는 사용자 동작을 레코딩하여 반복 실행하는 내용을 정리하고자 합니다. Selenium-IDE를 이용하기 위해서는 Firefox 브라우저가 필요합니다.그런데 최신 버전의 Firefox 브라우저에서 Selenium-IDE을 사용할 때 문제가 있어 여러 환..
PostgreSQL에서 테이블 데이터 조회시 아래와 같은 오류가 발생할때 조치 방법입니다. ERROR: character with byte sequence 0xe2 0x80 0xa4 in encoding "UTF8" has no equivalent in encoding "EUC_KR" 이 에러는 클라이언트의 인코딩 타입이 맞지 않아서 발생하는 에러입니다. 아래의 커맨드로 클라이언트 인코딩을 수정하고 다시 조회하면 정상적으로 실행이됩니다.(psql 명령으로 PostgreSQL에 접속 후에 사용해야합니다.)#show client_encoding; --현재 인코딩 값 확인 #set client_encoding = 'utf8'; --인코딩 값 변경#show client_encoding; --변경된 인코딩 값 확인
자동으로 데이터를 주기적으로 갱신하는 등 처리가 필요할때 스레드를 구현하지 않고 손 쉽게 사용할 수 있는 방법으로 Timer를 이용하는 방법이 있습니다. Timer.scheduledTimer(timeInterval: 20.0, target: self, selector: #selector(ViewController.getDataReload), userInfo: nil, repeats: true) 사용 방법은 위와 같은데요. timeInterval에 반복 주기(초)를 넣고 selector에 실행하고자 하는 함수를 넣어주면됩니다.물론 repeats를 true로 하여야 반복됩니다.
- Total
- Today
- Yesterday
- zero
- Spring
- MySQL
- 오브젝티브 C
- 오브젝트 C
- 아이폰 어플리케이션
- Objective C
- Objective-C
- 아이폰
- 아이폰 개발
- tomcat
- MAC OSX 10.7
- Java
- IT
- Programming
- 티스토리챌린지
- JavaScript
- 자바
- SQL
- Spring Framework
- iPhone
- oracle
- 제이쿼리
- Object C
- 자바스크립트
- JSP
- iOS 개발
- jQuery
- 오블완
- iBATIS
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |