안녕하세요.
오늘은 이미지에 텍스트를 추출하는 광학 문자 인식 기술인 OCR을 파이썬으로 간단하게 구현하는 방법에 대해 알아보겠습니다.
파이썬 Tesseract OCR 구현하기
▣ OCR이란?
광학 문자 인식(통칭 Optical character recognition; OCR)은 사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것
- 대출 서류, 수표 입금 및 기타 금융 거래에 필요한 서류 작업을 처리하고 확인할 수 있는 뱅킹 산업 등 여러 산업에서 쓰여지고 있음 (Ex. Clova OCR)
▣ 파이썬 Tesseract
Google의 Tesseract-OCR 엔진을 래핑한 라이브러리
: 설치하러가기
- 위 링크를 타고 빨간 박스를 클릭하여 설치 진행
- 추후 파이썬 코드에 cmd 경로 tesseract 파일 잘 들어가 있는지 확인
: 실제 활용해보기
pip install pytesseract
- 샘플 이미지 (FINANCIAL MARKET)
import numpy as np
import pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = r'C:/Program Files/Tesseract-OCR/tesseract' # 경로 설정하기
image_ = 'C:/Users/코딩하는 금융인/Desktop/배경화면/financial_market.jpg'
image_np = np.array(Image.open(image_))
text = pytesseract.image_to_string(image_np)
print(text)
# 'FINANCIAL MARKET'
반응형
'Programming > Python' 카테고리의 다른 글
[Python] 환율 정보 가져오기 (4) | 2023.12.20 |
---|---|
[Python] 파이썬 엑셀 이미지 삽입하기 (2) | 2023.11.13 |
[Python] 텍스트 정렬 메소드 (rjust, ljust, center) (1) | 2023.04.18 |
[Python] 테스트 데이터 만들기 Faker (8) | 2023.04.10 |
[Python] 클립보드 Pyperclip (복사/붙여넣기) (2) | 2023.03.26 |
댓글