제가 텍스트를 많이 다루다보니 확장자가 pdf, md, txt 등등 많은데요. 특히 pdf는 ocr을 하여 저장하고 있습니다.
그런데 albert라는 검색 엔진이 있는 것 같은데, 여기서는 pdf나 txt의 내용을 검색해도 나오지 않더라고요. 혹시 하모니카에서 손쉽게(터미널로 해당 디렉토리에서 훑어 찾는법은 알고 있습니다.) 텍스트 파일 내용을 검색해서 찾을 수 있는 방법이 있을까요??
++ 추가적으로 하모니카에서 ocr 기능을 사용할 수 있을까요? 하모니카에서 pdf 내용을 복사 또는 검색 등을 할 수 있었으면 좋겠습니다!
기본 검색엔진으로는 어렵고 recoll 이라는 프로그램을 이용하면 pdf, hwp, ppt 등의 문서도 검색 가능합니다.
아래 링크의 프로젝트를 참고해보세요.
https://github.com/hamonikr/recoll
하모니카 7.0 사용자라면 아래와 같이 설치해볼 수 있습니다.
sudo apt update
sudo apt install recoll=1.31.7-hamonikr1