본문 바로가기
Programming/Python

[Python] Tesseract OCR 이미지 추출하기

by 코딩하는 금융인 2023. 7. 15.

안녕하세요.

오늘은 이미지에 텍스트를 추출하는 광학 문자 인식 기술인 OCR을 파이썬으로 간단하게 구현하는 방법에 대해 알아보겠습니다.

 

 파이썬 Tesseract OCR 구현하기

▣ OCR이란?

광학 문자 인식(통칭 Optical character recognition; OCR)은 사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것

- 대출 서류, 수표 입금 및 기타 금융 거래에 필요한 서류 작업을 처리하고 확인할 수 있는 뱅킹 산업 등 여러 산업에서 쓰여지고 있음 (Ex. Clova OCR)

 

▣ 파이썬 Tesseract

Google의 Tesseract-OCR 엔진을 래핑한 라이브러리

: Description 보러가기

 

pytesseract

Python-tesseract is a python wrapper for Google's Tesseract-OCR

pypi.org

 

: 설치하러가기

- 위 링크를 타고 빨간 박스를 클릭하여 설치 진행

- 추후 파이썬 코드에 cmd 경로 tesseract 파일 잘 들어가 있는지 확인

 

: 실제 활용해보기

pip install pytesseract

- 샘플 이미지 (FINANCIAL MARKET)

샘플 이미지

import numpy as np
import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r'C:/Program Files/Tesseract-OCR/tesseract' # 경로 설정하기 
image_ = 'C:/Users/코딩하는 금융인/Desktop/배경화면/financial_market.jpg'
image_np = np.array(Image.open(image_))
text = pytesseract.image_to_string(image_np)
print(text)

# 'FINANCIAL MARKET'
반응형

댓글