텍스트

Category
아이템: 
포스트 갯수11

리눅스에서 PDF 파일을 텍스트(txt) 파일로 변환

By 반달가면 | 2023년 1월 11일 | 
리눅스에서 PDF 파일을 텍스트 파일로 변환하는 방법이다. 데비안/우분투 기준으로 poppler-utils 패키지에 포함된 pdftotext를 이용하면 된다. 만약 해당 패키지가 없다면 설치해 주면 되겠다. # S/W 저장소 정보 갱신 sudo apt-get update # 패키지 설치 sudo apt-get install poppler-utils 이제 변환을 해 보자. 예를 들어 my_text.pdf 파일을 텍스트 파일로 변환하여 my_text.txt로 저장하고 싶다면 아래와 같이 하면 된다. pdftotext my_text.pdf my_text.txt

links / lynx - 리눅스용 텍스트 웹브라우저

By 반달가면 | 2022년 5월 17일 | 
텍스트 기반의 웹브라우저 lynx는 전부터 알고 있었는데, 팅커보드S(Tinkerboard S)에 설치한 암비안(Armbian)에서 설치하려고 하니, 패키지가 없다는 오류가 발생했다. 그래서 인터넷을 좀 찾아보니, links라는 텍스트 기반의 웹브라우저가 있다. 암비안에서도 설치가 가능했다. sudo apt-get install links links를 조금 사용해 보니, 웹페이지를 열람하는데는 적합하지 않았다. 영문 페이지는 괜찮은 것 같은데, 한글 페이지가 제대로 표시되지 않는다. 뭔가 별도로 설정을 해 주어야 하는 부분이 있는지 모르겠는데, 어쨌든 links와는 달리 lynx는 한글 페이지도 잘 표시된다. # 반달가면 블로그 보기 (한글이 제대로 표시되지 않음) links bahn

espeak - 텍스트를 음성으로 변환(text-to-speech, TTS)

By 반달가면 | 2021년 3월 3일 | 
espeak은 텍스트를 입력 받아서 음성합성을 해 주는 프로그램이다. 영어가 기본이고 그 외에 추가적인 언어를 지원하긴 하는데, 아쉽게도 한국어는 포함되어 있지 않다. 발음이 썩 자연스럽지는 않지만 문서의 내용을 귀로 들어서 대략의 파악하는 동시에 뭔가 다른 문서 작업을 해야 하는 등 텍스트로부터 음성합성이 필요할 경우에는 그럭저럭 사용할 수 있을 듯. 데비안/우분투 계열 리눅스 배포판에서는 S/W 저장소를 통해 설치 가능한 듯. 리눅스 민트 19.3 XFCE에서 아래와 같이 설치했다. # S/W 저장소 정보 갱신 sudo apt-get update # espeak 설치 sudo apt-get install espeak 텍스트 파일을 읽어서 내용을 음성으로 출력하려면 -f 옵션

유니티를 이용해 웹의 텍스트 파싱이 잘 안 될때

By 개발자 SPRING | 2019년 5월 10일 | 
웹 서버에 올려 둔 text 파일을 유니티를 통해 파싱해 출력하게 만들었습니다. public Text TEXT; void Start() { StartCoroutine(GetText()); } IEnumerator GetText() { WWW www = new WWW("텍스트 파일 url"); yield return www; TEXT.text = www.text.ToString (); } 그랬더니 PC에서 테스트할 때는 멀쩡히 잘 나오다가, apk로 빌드 후에 스마트 기기에서는 공백으로 나오더군요.처음엔 웹에 무슨 접근 제한이 있나... 생각했는데 PC에서는 어디에서라도 해당 텍스트 파일이 잘 열리길래 다른 문제라고 알게 됐습니다. 잠깐 찾아 보니 BOM이라는 파일 첫머리의 규