12 мар. 2010 г.

Меняем кодировку файлов

Возникла необходимость перекодировать пару десятков файлов из cp1251 в UTF-8.

Погуглив немного, нашел в форумах упоминание утилиты "recode".
Сам я не приветствую установку дополнительных утилит, но если других вариантов нет, пришлось ставить.

Recode оказалась в репозитории Ubuntu, поэтому делаем:

$sudo apt-get install recode
...и пользуемся.

Для быстрого перекодирования группы файлов родился мини-скрипт:

mkdir 1
ls -1 | (
while read file;
do
cat "./$file" | recode CP1251..UTF-8 > "./1/$file";
done;
)

2 комментария:

morbo комментирует...

Чуваааак! Ты не знаешь про iconv?

iconv -f CP1251 -t UTF-8 file.txt > file.utf8.txt

Unknown комментирует...

Ну вот когда надо было не вспомнил :)

Я так и думал, что есть более правильное решение!

Спасибо!

Сказывается недостаток системного программирования под юникс... в студенчестве занимался программированием под винду, ну небыло тогда инета вообще :) неоткуда было инфу взять...

Чувствую надо программить начинать под линукс, но на работе пока времени нет :)

Если в школе - вузе не успел пощупать, на работе уже не успеваешь все сделать! :) у нас так многие...