pdf 텍스트 추출 쉬워요

pdf 텍스트 추출 알고 계신가요? 종종 피디에프로 작성된 문서의 글씨를 복사해야하는 일이 생기고는 하는데요, 보호되어 있는 파일은 원활한 진행이 불가능 합니다. 보호설정이 되어있지 않아도 원본의 형태가 유지되지 못하고 깨지는 등의 상황이 발생할 수 있는데요, 이때는 다른 확장자로 변환한 뒤 작업을 하는것이 좋습니다. pdf의 텍스트 추출은 어떻게 진행해야 하는지 알아보도록 하겠습니다.

pdf 텍스트 추출을 변환작업을 이용하여 진행하려 할 때는 이지피디에프를 사용하는 것이 좋습니다. smallpdf와 같은 편집 홈페이지를 이용하는 것도 좋은 방법이긴 하지만 아무래도 정보가 담긴 파일을 인터넷에 올리다 보니 꺼림칙 할 수 있습니다. 참고로 자동으로 파일을 삭제한다고는 하니 이 점 알아두시길 바랍니다.

이지를 실행시키면 처음에 메뉴를 선택할 수 있는 팝업이 표시됩니다. 열기/생성/변환/병합 총 네가지 메뉴인데 생성과 병합은 말그대로 새로운 피디에프를 생성할 수 있고, 여러 피디에프 파일을 하나로 병합할 수 있는 메뉴입니다. 변환메뉴는 잘 알아두셔야할 점이 있는데요, MS 오피스의 확장자에서 PDF로 의 변경만 가능합니다. 이 3개의 메뉴는 알아두시고 이후에 잘 활용해보시길 바라며 열기메뉴를 선택한 뒤 pdf 텍스트 추출을 위한 변경작업을 할 파일을 선택하도록 합니다.


파일을 열면 왼쪽에서는 문서가 모두 한장씩 나뉘는것을 볼 수 있고 우측에서는 선택한 페이지를 확대해서 볼 수 있습니다. 확장자 변경과는 관련 없으니 무시하셔도 좋으며 좌측상단에 있는 파일을 눌러 텍스트로 저장을 선택하도록 합니다. 이 외에 한글, 피피티, 워드, 엑셀 등으로도 저장할 수 있으니 알아두시길 바랍니다.

변경하고 싶은 페이지의 범위를 직접 설정 할 수 있는데요, 페이지의 숫자를 적어넣으면 됩니다. 원하는 부분만 변경하고 싶을때 이용하시면 되겠습니다.

변경된 파일은 메모장의 확장자를 갖게 되며 글씨들이 깨지지 않고 형태를 유지하며 표시되는것을 확인할 수 있습니다. pdf 텍스트 추출은 이처럼 변경작업을 통해 순조롭게 진행할 수 있으니 천천히 따라해보시길 바랍니다.



댓글

Designed by JB FACTORY