ICONV

포스트: 2|조회수: 0|ORGANIZATION
Items

Posts

2 posts

[bash: iconv] iconv를 이용한 텍스트 인코딩 확인

반달가면|2017년 8월 4일

인코딩이 불분명한 텍스트 파일이 있을 경우 iconv를 이용하는 간단한 셸 스크립트를 작성해서 인코딩을 확인해 볼 수 있다. 캐럭터 인코딩을 변환해주는 도구인 iconv에 대한 기본적인 내용은 이전 게시물을 참고하자. 여기로 방법은 단순하다. iconv에서 지원하는 인코딩 목록 전체를 가지고 현재 내 리눅스 시스템에서 사용중인 인코딩(통상 UTF-8)으로 한번씩 다 변환해 보는 것이다. 이걸 수작업으로 하기가 귀찮으므로 스크립트를 만들어서 하면 된다. 먼저, iconv에서 지원하는 인코딩 목록을 출력해 보자. # 지원하는 캐럭터 인코딩 목록 확인 iconv -l | more 437// 500// 500V1// ... iconv 버전에 따라 출력이 다를 수도 있겠는데, 어쨌든 데

맥에서 파일 인코딩 일괄 변환

My Blog|2017년 1월 12일

보통 텍스트 파일의 인코딩이 윈도우용으로 되어 있는 경우가 많다.cp949라는 인코딩을 많이 사용한다.이를 utf8로 바꾸기 위해 리눅스 계열에선 iconv를 사용한다. 여러 파일에 대해 일괄 작업을 하려면 살짝 쉘 스크립팅을 해야 한다.특히 맥에 설치된 iconv는 옵션이 살짝 다르다.iconv를 실행하면 인코딩 변환 결과가 화면으로 출력된다.그런데 출력을 파일로 해주는 옵션이 맥에선 없다. (--output 불가)그래서 리다이렉션을(화면 출력을 파일로) 사용해야 한다. 예를 들어 자막 파일이 들어 있는 폴더에서 아래의 명령을 실행한다. $ find . -type f -name '*.smi' -exec sh -c 'iconv -f CP949 -t UTF-8 "$0" > "$0.tmp"' '{}'