ICONV
Posts
2 posts[bash: iconv] iconv를 이용한 텍스트 인코딩 확인
인코딩이 불분명한 텍스트 파일이 있을 경우 iconv를 이용하는 간단한 셸 스크립트를 작성해서 인코딩을 확인해 볼 수 있다. 캐럭터 인코딩을 변환해주는 도구인 iconv에 대한 기본적인 내용은 이전 게시물을 참고하자. 여기로 방법은 단순하다. iconv에서 지원하는 인코딩 목록 전체를 가지고 현재 내 리눅스 시스템에서 사용중인 인코딩(통상 UTF-8)으로 한번씩 다 변환해 보는 것이다. 이걸 수작업으로 하기가 귀찮으므로 스크립트를 만들어서 하면 된다. 먼저, iconv에서 지원하는 인코딩 목록을 출력해 보자. # 지원하는 캐럭터 인코딩 목록 확인 iconv -l | more 437// 500// 500V1// ... iconv 버전에 따라 출력이 다를 수도 있겠는데, 어쨌든 데
맥에서 파일 인코딩 일괄 변환
보통 텍스트 파일의 인코딩이 윈도우용으로 되어 있는 경우가 많다.cp949라는 인코딩을 많이 사용한다.이를 utf8로 바꾸기 위해 리눅스 계열에선 iconv를 사용한다. 여러 파일에 대해 일괄 작업을 하려면 살짝 쉘 스크립팅을 해야 한다.특히 맥에 설치된 iconv는 옵션이 살짝 다르다.iconv를 실행하면 인코딩 변환 결과가 화면으로 출력된다.그런데 출력을 파일로 해주는 옵션이 맥에선 없다. (--output 불가)그래서 리다이렉션을(화면 출력을 파일로) 사용해야 한다. 예를 들어 자막 파일이 들어 있는 폴더에서 아래의 명령을 실행한다. $ find . -type f -name '*.smi' -exec sh -c 'iconv -f CP949 -t UTF-8 "$0" > "$0.tmp"' '{}'



