티스토리 뷰
[업데이트 2019.05.20 10:02]
이번 포스팅에서는 Tesseract라는 OCR엔진에 대해 설치부터 실행까지 알아보도록 하겠습니다.
Python까지 지원하여 간단히 OCR을 수행해볼 수 있었습니다. Python으로 실행 가능하기 때문에 웹서비스로 만들어서 OCR 기능을 수행하는 웹어플리케이션을 만들 수도 있을 것 같습니다.
이번 포스팅에서는 Windows 10 x64 기준으로 설치 및 실행까지 알아보도록 하겠습니다.
1. Tesseract 설치
아래의 위치로 접속하게되면, tesseract-ocr-w64-setup-v4.1.0.20190314 (rc1) (64 bit) 다운로드 링크를 확인 하실 수 있습니다. 다운로드 링크를 클릭하여 설치 파일을 다운로드합니다. (2019.05.20 기준 버전)
https://github.com/UB-Mannheim/tesseract/wiki
설치중에 Additional language data(download) 부분에서 한글 인식을 원하시면 Korean을 선택하시면 됩니다.
설치가 완료되면 x64 O/S기준 기본 경로인 "C:\Program Files\Tesseract-OCR"에 설치되어 있음을 확인할 수 있습니다.
바탕화면의 내 PC > 속성 > 고급 시스템 설정 > 환경변수 > 시스템 변수 > Path에 위의 경로를 Command Prompt 수행후 어느 위치에서나 실행 가능하도록 추가합니다.
2. Tesseract 테스트
Command Prompt를 실행후 다음의 command line usage를 따라 테스트를 수행하여 정상적으로 설치 되었는지 확인합니다.
tesseract imagename outputbase [-l lang] [--oem ocrenginemode] [--psm pagesegmode] [configfiles...]
위와 같이 테스트 이미지를 만든 후 실행합니다. 다음은 Tesserect OCR 실행 후 검출한 결과입니다. 일부 특수문자가 오인식 되었으나 설치된 Tesserect OCR이 정상 동작함을 알 수 있습니다.
c:\>tesseract test.png stdout -l eng
Test Tesserect OCR
1@#$%*
c:\>
3. Tesseract Python Package 설치 및 테스트
Command Prompt에서 Tesseract Python Package를 다음과 같이 pip를 통해 설치합니다.
pip install pytesseract
자세한 내용은 아래 링크를 참고 하시기 바랍니다.
https://github.com/madmaze/pytesseract
설치 완료후 아래와 같이 Python 코드를 수행합니다.
try:
from PIL import Image
except ImportError:
import Image
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract'
print(pytesseract.image_to_string(Image.open('test.png')))
아래의 스크린샷의 경우 위의 코드를 쥬피터 노트북에서 실행한 결과입니다. 정상적으로 수행되었음을 확인할 수 있습니다.
이번 포스팅에서는 Tesserect OCR 설치 및 실행에 대해 간단히 정리해보았습니다.
감사합니다.
* 참고
[1] https://github.com/tesseract-ocr/tesseract
- Total
- Today
- Yesterday
- 2D Game
- #TensorFlow
- #ApacheZeppelin
- Sea Bottom
- Meow
- aws #cloudfront
- Badge
- ate
- Mask R-CNN
- Library
- Jekyll and Hyde
- #ELK Stack
- English
- OST
- Worry
- GOD
- #ApacheSpark
- 도커
- sentence test
- Physical Simulation
- ILoop Engine
- #REST API
- belief
- Memorize
- Game Engine
- project
- docker
- some time ago
- SSM
- Ragdoll
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |