Почему вместо букв показываются иероглифы

Почему взамен букв показываются иероглифы

Изредка полученное электронное письмо может взамен текста содержать крайне затейливую смесь символов и графических знаков, напоминающую иероглифы, которую с чьей-то «легкой руки» окрестили «крякозябрами». Это случается не только с текстом писем, но и с содержимым веб-страниц, некоторых текстовых файлов и даже с надписями в интерфейсе компьютерных программ.


При сохранении и воспроизведении на экране букв, цифр, знаков препинания и других текстовых элементов операционная система компьютера использует особые таблицы. В них все эти символы помещены в сурово определенном порядке. Когда вы сберегаете какой-нибудь документ, содержащий текст, то в файл записываются не сами буквы и цифры, а их порядковые номера в этой таблице. Когда же вы открываете такой документ, то происходит обратная операция – приложение читает из файла номера символов и выводит на странице соответствующие им знаки из таблицы. Эти таблицы называют «комплектами символов» (Character Set, сокращенно CharSet) либо «кодировками».Таких таблиц существует достаточно много – несколько десятков. Вначале весь конкурирующий изготовитель компьютерного программного обеспечения создавал свою собственную таблицу символов, после этого создавались таблицы для разных национальных алфавитов с непременным включением английского, потом, по мере улучшения операционных систем, создавались их варианты для новых вероятностей и т.д. Если текст, записанный и сохраненный с применением одной такой таблицы после этого открыть с применением иной, то итогом и будет то самое, что мы называем словом «крякозябры» – номера символов останутся бывшими, но знаки им соответствующие в этой таблице будет вовсе другими.Указание кодировки, которую компьютерное приложение должно применять для отображения текстового содержимого файла, записывается в служебное поле этого файла. Если текст передается по сетям, то указание кодировки отправляется в служебном поле передаваемого пакета информации. В HTML-коде веб страниц для хранения наименования примененной кодировки предуготовлен особый тег. В письме электронной почты кодировка передается в служебных полях совместно с информацией об отправителе, получателе и т.д. Если указание кодировки любым из перечисленных методов отсутствует, то с крякозябрами придется бороться вручную – попытайтесь подобрать необходимую кодировку средствами используемого приложения. Такая функция предусмотрена и в браузере, и в почтовом заказчике, а текстовый редактор (скажем, Microsoft Word) сам пытается определить верную кодировку по косвенным знакам.Кажется, сегодня наконец-то сделан эталон таблицы символов, тот, что удовлетворяет всех – его назвали «Юникод» (Unicode). Но переход на него еще только совершается, следственно с крякозябрами придется сталкиваться еще несколько лет.

Понравилась статья? Поделиться с друзьями:
Добавить комментарий