Як визначити кодування текстового файлу

Кодуванням тексту в файлах цифрових документів називають спосіб зіставлення послідовностей байт символам мови. Існує безліч різних кодувань для різних мов. Визначити кодування текстового файлу можна за допомогою ряду програмних засобів.
Як визначити кодування текстового файлу
Вам знадобиться
  • - Microsoft Office Word;
  • - KWrite;
  • - Mozilla Firefox;
  • - enca.
Інструкція
1
Використовуйте редактор Microsoft Office Word, якщо він встановлений на комп'ютері, для визначення кодування текстового файлу. Запустіть цю програму. У головному меню виберіть пункт «Файл» і «Відкрити ...» або натисніть клавіші Ctrl + O. У отобразившейся діалозі перейдіть до потрібного каталогу і виділіть файл. Натисніть кнопку «Відкрити». Якщо кодування тексту відрізняється від CP1251, автоматично відкриється діалог «Перетворення файлу». Активуйте в ньому опцію «Інша» і підберіть кодування, використовуючи список, що знаходиться праворуч. При виборі правильного кодування в полі «Зразок» буде виведений читається текст.
2
Застосуйте текстові редактори, що допускають вибір кодування тексту джерела. Хорошим прикладом подібного програми є KWrite (працює в середовищі KDE в UNIX-подібних системах). Завантажте текстовий файл в редактор. Потім просто перебирайте кодування, поки не відобразиться читається текст (у KWrite для цього використовується розділ Encoding меню Tools).
3
Аналогічно текстовому редактору для визначення кодування файлу можна використовувати і браузер. Скористайтеся Mozilla Firefox. Запустіть цю програму. Якщо воно не встановлене, завантажте відповідний дистрибутив з сайту mozilla.org і інсталюйте його. Відкрийте в браузері текстовий файл. Для цього виберіть у головному меню пункти «Файл» і «Відкрити файл ...» або натисніть Ctrl + O. Якщо завантажений текст відобразився коректно, розгорніть розділ «Кодування» меню «Вид» і дізнайтеся кодування з назви пункту, на якому встановлена позначка. В іншому випадку підберіть даний параметр шляхом вибору різних пунктів того ж меню, а також його розділу «Додаткові».
4
Застосуйте спеціалізовані утиліти для визначення кодувань текстових файлів. В UNIX-подібних системах можна використовувати enca. При необхідності встановіть цю програму за допомогою доступних менеджерів пакетів. Виведіть список доступних мов, виконавши команду:

enca --list languages



Визначте кодування текстового файлу, вказавши його ім'я за допомогою опції -g і мова документа за допомогою опції -L. Наприклад:

enca -L russian -g /home/vic/tmp/aaa.txt.


Увага, тільки СЬОГОДНІ!