При вводе в компьютер символьной информации символы (буквы, цифры, знаки), которые вводятся кодируются определенными комбинациями нулей и единиц, а при выводе их для чтения человеком (на монитор или принтер) по коду символа строится изображение символа и используется Таблица CP1251
Каждому символу назначается код — последовательность из фиксированного количества нулей и единиц с взаимно однозначным соответствием. Используя одну двоичную цифру (один бит) можно закодировать всего 2 символа. Двохбітових комбинаций может быть четыре→00; 01, 10, 11, то есть 22, с помощью трех битов можно получить восемь различных комбинаций нулей и единиц (23). Оптимальное количество символов, которые используются при наборе различных текстов, равна примерно 250 (буквы латинские и кириллица, заголовочні и строчные, знаки препинания, цифры, математические знаки, элементы псевдографики). В двоичной системе такое количество символов может быть закодирована последовательностью из 8 бит (28=256), т. е. одним байтом. Если каждому символу алфавита поставить в соответствие некоторое целое число, то с помощью двоичного кода можно однозначно кодировать текстовую информацию. Восемь двоичных разрядов достаточно для кодирования 256 различных символов. Этого хватит, чтобы изобразить различными комбинациями восьми битов все символы английского, украинского и русского языков, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и общепринятые специальные символы.
Для того, чтобы весь мир одинаково кодировал текстовые данные, нужны единые таблицы кодирования. Для английского языка, захватившего де-факто нишу международного средства общения Институт стандартизации США (ANSI — American National Standard Institute) ввел в действие систему кодирования ASCII (American Standard Code for Information Interchange — стандартный код информационного обмена США). В системе ASCII закреплены две таблицы кодирования — базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255. Первые 32 коды базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств (в первую очередь производителям компьютеров и печатающих устройств). В этой области размещаются так называемые управляющие коды, которым не соответствуют никакие символы языков, и, соответственно, эти коды не выводятся ни на экран, ни на устройства печати, но ими можно управлять тем, как производится вывод прочих данных. Начиная с кода 32 и заканчивая кодом 127 размещены коды символов английского алфавита, знаков препинания, цифр, символов арифметических действий и некоторых вспомогательных символов. Базовая таблица кодировки ASCII приведена в таблице 2.
Поддержка производителей оборудования и программ вывела американский код ASCII на уровень международного стандарта, и национальным системам кодирования пришлось «отступить» во вторую, расширенную часть системы кодирования, определяет значение кодов с 128 по 255. Отсутствие единого стандарта в этой области привела к множественности одновременно действующих кодировок. Только в России можно указать три действующие стандарты кодирования и еще два устаревших.
Для кодирования символов русского и украинского языков, известное как система кодировки Windows-1251, была введена «извне» — компанией Microsoft, но, учитывая широкое распространение операционных систем и других продуктов этой компании на Украине и в России, она глубоко закрепилась и нашла широкое распространение (таблица 3). Это кодирование используется на большинстве компьютеров, работающих под управлением операционных систем Windows.
Другое распространенное кодировка носит название КОИ-8 (код обмена информацией, восьмизначный) — ее происхождение относится ко временам действия Совета Экономической Взаимопомощи государств Восточной Европы. Сегодня кодировка КОИ-8 имеет значительное распространение в компьютерных сетях на территории России и в российском секторе Интернета.
Таблица 2. Базовая таблица кодировки ASCII
32 пропуск | 48 0 | 64 @ | 80 Г | 96 ‘ | 112 p |
33 ! | 49 1 | 65 А | 81 Q | 97 а | 113 q |
34 « | 50 2 | 66 B | 82 R | 98 b | 114 r |
35 # | 51 3 | 67 C | 83 S | 99 c | 115 s |
36 $ | 52 4 | 68 D | 84 Т | 100 d | 116 t |
37 % | 53 5 | 69 Е | 85 U | 101 e | 117 u |
38 & | 54 6 | 70 F | 86 V | 102 f | 118 v |
39 ‘ | 55 7 | 71 G | 87 W | 103 g | 119 w |
40 ( | 56 8 | 72 Н | 88 X | 104 h | 120 x |
41) | 57 9 | 73 I | 89 В | 105 i | 121 в |
42 * | 58 : | 74 J | 90 Z | 106 j | 122 z |
43 + | 59 ; | 75 K | 91 [ | 107 k | 123 { |
44 , | 60 < | 76 L | 92 \ | 108 i | 124 | |
45 — | 61 = | 77 М | 93 ] | 109 m | 125 } |
46 . | 62 > | 78 N | 94 ^ | 110 n | 126 ~ |
47 / | 63 ? | 79 В | 95 _ | 111 0 | 127 |
Таблица 3. Кодировку Windows 1251
128 Ђ | 144 ђ | 176 ° | 192 А | 208 Г | 224 а | 240 г | |
129 Ѓ | 145 ‘ | 161 Ў | 177 ± | 193 Б | 209 С | 225 б | 241 с |
130 , | 146 ‘ | 162 ў | 178 I | Сто девяносто четыре | 210 Т | 226 в | 242 т |
131 ѓ | 147 « | 163 Ј | 179 i | 195 Г | 211 В | 227 г | 243 в |
132 « | 148 « | 164 ¤ | 180 г | 196 Д | 212 Ф | 228 д | 244 ф |
133… | 149 — | 165 Г | 181 μ | 197 Е | 213 X | 229 э | 245 х |
134 † | 150 — | 166 ¦ | 182 ¶ | 198 Же | 214 Ц | 230 же | 246 ц |
135 ‡ | 151 — | 167 § | 183 · | 199 3 | 215 Ч | 231 с | 247 ч |
136 ? | 152 | 168 Е | 184 е | 200 И | 216 Ш | 232 и | 248 ш |
137 ‰ | 153 ™ | 169 © | 185 № | 201 И | 217 Щ | 233 и | 249 щ |
138 Љ | 154 љ | 170 Есть | 186 есть | 202 К | 218 Ъ | 234 к | 250 ъ |
139 < | 155 > | 171 « | 187 » | 203 Л | 219 Ы | 235 л | 251 ы |
140 Њ | 156 \ | 188 j | 204 М | 220 Ь | 236 м | 252 ь | |
141 Ќ | 157 : | 173 — | 189 S | 205 Н | 221 Э | 237 н | 253 э |
142 Ћ | 158 ћ | 174 ® | 190 s | 206 В | 222 Ю | 238 в | 254 ю |
143 Џ | 159 џ | 175 Й | 191 й | 207 П | 223 Я | 239 п | 255 я |