요즘 집에 있는 종이 책을 북스캐너로 스캔 후 OCR로 txt 추출 및 pdf 전자책화 해서 보거나 보관하는 게 유행 중입니다. ocr, 스캔, pdf 앱 등등 리눅스용으로 좋은 거 뭐가 있나요?
기억이 가물가물 하긴 한데, tesseract-OCR 이란 프로그램을 사용할 수 있습니다.
한글인식 데이터 셋도 어느정도 축적이 되서 인식도 어느정도 수준까지는 올라와 있긴 한데
완전하다라고 하기엔 자간 문제나 복잡한 기호 인식에서 오인률이 좀 있습니다.
개인적인 사용 목적에 스캔이라면 간편하게 스마트폰을 이용한 스캔 방식을 추천 드리고 싶네요.
vflat 앱 추천 드립니다.