OCR 기능으로 스캔 문서 텍스트 추출하기
스캐너로 문서를 저장하거나 휴대폰으로 촬영한 문서는 대부분 이미지 기반의 PDF로 만들어집니다. 이런 파일은 일반적인 변환 방식으로는 편집이 불가능하고, 단순히 그림처럼만 볼 수 있습니다. 이럴 때 필요한 기술이 바로 OCR(Optical Character Recognition, 광학 문자 인식)입니다. OCR은 이미지 속 글자를 분석해 텍스트로 변환해 주는 기능으로, 학업, 업무, 연구 등 다양한 상황에서 활용도가 높습니다. 이번 글에서는 OCR의 원리, … 더 읽기