[Python] Tesseract OCR 이미지 추출하기

안녕하세요.

오늘은 이미지에 텍스트를 추출하는 광학 문자 인식 기술인 OCR을 파이썬으로 간단하게 구현하는 방법에 대해 알아보겠습니다.

파이썬 Tesseract OCR 구현하기

▣ OCR이란?

광학 문자 인식(통칭 Optical character recognition; OCR)은 사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것

- 대출 서류, 수표 입금 및 기타 금융 거래에 필요한 서류 작업을 처리하고 확인할 수 있는 뱅킹 산업 등 여러 산업에서 쓰여지고 있음 (Ex. Clova OCR)

▣ 파이썬 Tesseract

Google의 Tesseract-OCR 엔진을 래핑한 라이브러리

: Description 보러가기

pytesseract

Python-tesseract is a python wrapper for Google's Tesseract-OCR

pypi.org

: 설치하러가기

- 위 링크를 타고 빨간 박스를 클릭하여 설치 진행

- 추후 파이썬 코드에 cmd 경로 tesseract 파일 잘 들어가 있는지 확인

: 실제 활용해보기

pip install pytesseract

- 샘플 이미지 (FINANCIAL MARKET)

import numpy as np
import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r'C:/Program Files/Tesseract-OCR/tesseract' # 경로 설정하기 
image_ = 'C:/Users/코딩하는 금융인/Desktop/배경화면/financial_market.jpg'
image_np = np.array(Image.open(image_))
text = pytesseract.image_to_string(image_np)
print(text)

# 'FINANCIAL MARKET'

'Programming > Python' 카테고리의 다른 글

[Python] 환율 정보 가져오기 (4)	2023.12.20
[Python] 파이썬 엑셀 이미지 삽입하기 (2)	2023.11.13
[Python] 텍스트 정렬 메소드 (rjust, ljust, center) (1)	2023.04.18
[Python] 테스트 데이터 만들기 Faker (8)	2023.04.10
[Python] 클립보드 Pyperclip (복사/붙여넣기) (2)	2023.03.26