본문 바로가기
IT

이미지, pdf파일을 텍스트로 변환하는 방법 (OCR 사이트)

by 콩코미 2021. 11. 21.
문자 인식 사이트/프로그램
구글 드라이브(Google Drive) OCR, 알PDF OCR 기능 사용하기

 

사진 속에 있는 글자를 문서로 옮겨야 하는 상황일 때, 몇 글자가 안된다면 타이핑하는 게 편하지만 그게 아니라 글자가 많을 때는 일일이 타이핑하기가 쉽지 않은데요. 사진 속 글자를 텍스트로 추출해주는 OCR(광학 문자인식, Optical Character Recognition) 기술이 예전에는 정확도가 많이 떨어졌는데, 요즘엔 딥러닝 기술의 발전으로 OCR 정확도도 높은 편이어서 직접 타이핑하기가 곤란한 경우 OCR로 텍스트를 추출하여 필요한 부분만 고쳐 쓰면 돼서 시간도 단축하고 보다 효율적으로 작업이 가능하게 되었습니다.
이번 포스팅에서는 구글 드라이브와 알PDF에서 OCR 문자 인식을 사용하는 방법을 소개해드리려고 합니다. 저는 처음에 OCR이 가능한 사이트를 찾고 있다가, 구글 드라이브에서 가능하다는 정보를 얻고 뭔가 매치가 안된다고 생각했는데요. 생각보다 구글 드라이브에서는 다양한 기능을 많이 제공하고 있어서 OCR 기능 또한 정말 잘 되어있는 것을 확인할 수 있었습니다. OCR 기능이 필요하신 분들은 이번 포스팅을 참고하셔서 진행해보시길 바랍니다.

OCR-무료-사이트-프로그램

 




방법 1 : 구글 드라이브(Google Drive) OCR 기능 사용하기

1. 스마트폰으로 사진을 찍습니다. 저는 미드 대본의 일부를 찍어보았습니다.

이미지-텍스트로-변환


2. '공유' 버튼을 눌러줍니다.

 

이미지-구글드라이브로-공유하기



3. 밑으로 내리다 보면 구글 드라이브가 있습니다. 클릭해줍니다.

사진파일-구글드라이브에-저장



4. 액세스 허용 메시지가 뜨면 허용을 해주세요.

구글드라이브-사진저장

 


5. 문서 제목을 지정해주시고 구글 드라이브 계정 확인 후 '저장'버튼을 눌러줍니다.

구글드라이브에-사진-저장하기-스마트폰

 



6. 포털 사이트에서 구글 드라이브를 검색하여 구글 드라이브에 접속합니다.

구글드라이브-접속


7. '드라이브로 이동'을 눌러 줍니다.

구글드라이브로-이동


8. 방금 저장했던 이미지 파일을 찾아서 [마우스 오른쪽 버튼]→[연결 앱]→[Google 문서]를 클릭합니다.

구글문서-ocr



※ 만약 PC에서 저장한 사진을 텍스트로 변환하고 싶은 경우에는 [새로 만들기]→[파일 업로드]를 통하여 업로드해주시면 됩니다.


9. 'Google 문서'를 클릭하면 이렇게 텍스트로 변환이 된 것을 볼 수 있는데요. 상당히 높은 정확도로 추출된 것을 확인할 수 있었습니다.

구글드라이브-OCR





방법 2 : 알PDF에서 OCR 문자 인식 기능 사용해보기


1. 포털사이트에서 알pdf를 검색하여 나오는 '알PDF 공식 다운로드- PDF 뷰어/리더, 변환/편집-알툴즈-내 PC 필수품'을 클릭하여 공식 다운로드 페이지로 이동하여 줍니다.

알PDF-다운로드


2. '설치하기'를 클릭하여 알PDF 설치 파일을 다운로드해줍니다.

알pdf-설치


3. 다운로드가 완료되면 다운로드 폴더로 이동하여 알pdf 설치 파일('ALPDF302.exe')을 실행시켜 줍니다.

알pdf-설치파일



4. '동의' → '설치 시작(N)'버튼을 눌러 설치를 시작합니다.

알pdf-ocr



5. 저는 기본 설정으로 설치할 거기 때문에 '빠른 설치(N)'를 누르겠습니다. 상세 설정하여 설치하실 분들은 '사용자 지정'버튼을 눌러 설정하시기 바랍니다.

 

 

알pdf-설치과정



6. 설치가 완료되었습니다. '확인' 버튼을 눌러 설치를 종료합니다.

알pdf-문자인식기능



7. 알PDF 메인화면입니다. [홈 버튼]→[파일 열기]를 클릭해줍니다.

알pdf-파일열기



9. 사진 파일을 변환할 거기 때문에 파일 형식에서 'All files(*.*)'로 바꿔주신 후, 이미지 파일을 선택하고 '열기'를 눌러줍니다.(Pdf 파일이어도 파일 선택 후 열기 버튼을 누르시면 됩니다.)

알pdf-이미지파일-열기


10. 문서가 열렸으면 상단의 '문자인식(OCR)'을 눌러줍니다.(혹은 알림에서 문자인식(OCR) 수행 버튼을 눌러줍니다.)

 

알pdf-문자인식해보기



11. 문자 인식만 해볼 것이기 때문에 '아니오'를 눌러줍니다.

알pdf-문자인식기능-OCR



12. 문자인식(OCR) 기능을 처음 사용하시는 분이라면 이 과정에서 다운로드해야 한다고 창이 뜰 텐데, '다운로드' 버튼을 클릭해줍니다.


13. 다운로드 한 폴더로 가서 'ALPDF_OCR_Plugin 30.exe'를 실행시켜 줍니다.

알PDF-OCR플러그인-설치

 


14. 설치 파일을 열면 실행 중인 알pdf를 닫으라고 하는데 닫아주고 설치를 계속 진행합니다.


15. [동의함]에 체크하고 '다음' 버튼을 눌러준 뒤 '설치'를 눌러줍니다.

알pdf-OCR설치


16. 설치가 완료되면 아까 진행했던 9번 동작(파일 열기)을 반복해줍니다.


17. 다시 상단의 '문자인식(OCR)' 버튼을 눌러주고, 저장할 거냐고 뜨면 '아니요'를 클릭해줍니다.


18. '적용' 버튼을 눌러줍니다.

알PDF-텍스트변환-문자인식



19. 사진 속 글자들이 편집이 가능한 텍스트로 추출이 된 것을 확인할 수 있습니다.

알PDF-문자인식-OCR기능





지금까지 Google Drive와 알pdf에서 사진 속 글자를 텍스트로 추출하는 OCR 기능을 사용하는 방법을 알아보았습니다.
차이점이 있다면 구글 드라이브는 프로그램 설치할 필요 없이 사이트에 접속해서 진행하였고, 알pdf는 프로그램 설치가 필요했던 점이었는데요. 성능은 모두 뛰어나니 추가 기능 필요 여부 등 잘 따져봐서 원하시는 방법으로 사용하시면 되겠습니다^^

 

댓글