테서랙트(tesseract)는 리눅스용 오픈소스 광학문자인식(OCR) S/W이다. 오픈소스이므로 무료로 사용할 수 있다. 테서랙트의 깃허브(github) 페이지는 아래의 링크로 가면 된다. 100개 이상의 언어를 지원하며, 데비안/우분투 기반 배포판의 경우 공식 S/W 저장소에 이미 포함되어 있으므로 apt-get 명령어로 설치하면 된다. # S/W 저장소 갱신 sudo apt-get update # tesseract-ocr 설치 sudo apt-get install tesseract-ocr # 영어(eng), 한국어(kor, hang), 일본어용(jpn, jpan) 파일 설치 sudo apt-get install tesseract-ocr-eng tesseract-ocr-ko