Skip to content

Текстовая информация

С точки зрения компьютера текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа \(=\), \((\), \(\&\) и т.п. и даже пробелы между словами.

Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В компьютер же они попадают в двоичном коде. Это значит, что каждый символ представляется двоичным кодом.

Таблицы кодировки

Таблицы кодировки — таблицы, где каждому символу, буквам, цифрам, а также специальным знакам присвоен уникальный номер — код символа. Существует множество разнообразных кодировок, наиболее распространённой и универсальной на данный момент является кодировка UTF-8. Также существуют такие таблицы, как ASCII, UNICODE и многие другие.

Можно условно выделить несколько составных частей, которые могут присутствовать в таблицах кодировок:

  • десятичные цифры;
  • символы латинского алфавита;
  • управляющие символы;
  • символы других алфавитов;
  • знаки препинания, псевдографики, скобки и другие символы.

Десятичные цифры

Цифры от \(0\) до \(9\).

Символы латинского алфавита

Соответствуют латинскому алфавиту и делятся на заглавные и прописные.

Управляющие символы

Управляющие — это символы, которым не приписано графическое представление, но которые используются для управления устройствами. Сейчас многие управляющие символы или не используются вообще, или используются не по назначению.

Современные стандарты требуют обязательного наличия лишь восьми управляющих символов — \0, \a, \b, \t, \n, \v, \f и \r.

\0 или NUL

Пустой символ (NULL). Этот символ ничего не делает. Некоторые приложения изображают его как пробел, но это неправильно. Часто \0 используют для обозначения конца цепочки символов. Также может использоваться для передачи данных в случае отсутствия данных.

\a или BEL

Звуковой сигнал (BELL). Если этот символ послать на принтер или на терминал, то ничего не напечатается, но послышится звуковой сигнал.

\b или BS

Возврат на шаг (BACKSPACE). Перемещает позицию печати на один символ назад. На принтерах может использоваться для наложения одного символа на другой, например a BS ^ = â.

\t или HT

Горизонтальная табуляция (HORIZONTAL TABULATION). Перемещает позицию печати к следующей позиции горизонтальной табуляции.

\n или LF

Перевод строки (LINE FEED). Перемещает позицию печати на одну строку вниз (исходно — без возврата каретки).

\v или VT

Вертикальная табуляция (VERTICAL TABULATION). Перемещает позицию печати к следующей позиции вертикальной табуляции.

\f или FF

Прогон страницы, смена страницы (FORM FEED). Выбрасывает текущую страницу и начинает печать со следующей.

\r или CR

Возврат каретки (CARRIAGE RETURN). Перемещает позицию печати в крайнее левое положение (исходно — без перевода на следующую строку). В Microsoft Windows, для разделения строк используется сочетание кодов возврата каретки CR и перевода строки LF.

Символы национального алфавита

Соответствуют кириллическому алфавиту и делятся на заглавные и прописные.

Символы других алфавитов

Собственно символы других алфавитов. Как и латинские и кириллические обычно делятся на заглавные и прописные.

Знаки препинания, псевдографики, скобки и другие символы

Содержат пунктуационные знаки, скобки, символы для рисования и другие символы.

Символами ASCII даже можно рисовать.

Например так:

Простая ASCII графика Простая ASCII графика

Простая ASCII графика

Или так:

ASCII графика ASCII графика

ASCII графика

Или даже вот так:

Сложная ASCII графика Сложная ASCII графика

Сложная ASCII графика

Список использованных источников

  1. Коды символов ASCII [Электронный ресурс] URL: https://dic.academic.ru/dic.nsf/ruwiki/11979 (дата обращения: 12.07.2022)
  2. Кодировка текста ASCII (Windows 1251, CP866, KOI8-R) и Юникод (UTF 8, 16, 32) — как исправить проблему с кракозябрами [Электронный ресурс] URL: https://javarush.ru/groups/posts/1418-kodirovka-teksta-ascii-windows-1251-cp866-koi8-r-i-junikod-utf-8-16-32--kak-ispravitjh-problemu (дата обращения: 12.07.2022)

Last update: July 17, 2022
Created: July 14, 2022

Comments