UTF-1

UTF-1

UTF-1 — метод преобразования универсального набора символов или Юникода в поток байтов. Из-за ряда проблем не получил признания и был быстро заменён UTF-8.

Описание

Подобно UTF-8, UTF-1 представляет собой кодировку переменной ширины[англ.], обратно совместимую с ASCII. Каждый символ Юникода представлен либо одним байтом, либо последовательностью двух, трёх или пяти байтов. В терминологии Юникода эти числа называются кодовыми точками.[1] Все символы ASCII представляют собой один байт (символы от U+0080 до U+009F также являются однобайтовыми). UTF-1 пытался соответствовать стандарту ISO/IEC 2022[англ.].

См. также

  • Сравнение кодировок Юникода[англ.]
  • C0 and C1 control codes[англ.]

Примечания

  1. Абсолютный минимум об Unicode на 2023 год (всё ещё — никаких оправданий!) / Хабр

Ссылки

  • Формат преобразования Юникода (UTF)
Перейти к шаблону «Кодировки символов»
Кодировки символов
Исторические
кодировки
докомп.
семафорная (Макарова)
телеграфные
комп.
6-битная
УПП
RADIX-50
EBCDIC
КОИ-7
ISO 646
современное
8-битное
представление
Многобайтные