Перейти к первому, предыдущему, следующему, последнему разделу, оглавлению.


ProgrammerBook.ru: Обратите внимание, что

  1. данный документ является переводом документа «Hypertext Markup Language - 2.0 - Characters, Words, and Paragraphs»;
  2. данный документ может содержать неточности, опечатки и ошибки перевода;
  3. официальным документом по данной тематике является оригинальный документ на английском языке, расположенный на сайте W3C.

Символы, Слова и Абзацы

HTML агенту пользователя следует представлять тело HTML документа, как совокупность вёрстки абзацев и предотформатированного текста. За исключением элементов предварительного форматирования (PRE, XMP, LISTING, TEXTAREA) каждый блок структурированного элемента рассматривается как абзац, принимая символы данных в его содержимое и содержимое его элементов-потомков, связывая их и разделяя результат на слова, разделённые пробелом, табуляцией или символами конца записи (и, возможно, символами тире). Последовательность слов верстается как абзац, разбивая его на строки.

Набор Символов HTML Документа

Набор символов документа указанный в разделе SGML Объявление для HTML должен поддерживаться HTML агентами пользователей. Он включает в себя графические символы Латинского Алфавита No. 1, или просто Latin-1. Latin-1 включает в себя 191 графический символ, в том числе алфавиты большинства западноевропейских языков. (24) (25)

В SGML приложениях, использование управляющих символов ограничено для того, чтобы увеличить вероятность успешного обмена в разнородных сетях и операционных системах. В наборе символов HTML документа допускается использование только трёх управляющих символов: Горизонтальная Табуляция, Возврат Каретки и Перевод Строки (позиция кода -- 9, 13 и 10 соответственно).

ОТД HTML ссылается на набор сущностей Дополненного Latin 1, допускающий мнемоническую репрезентацию выбранных символов Latin 1, используя только широко поддерживаемый набор ASCII символов. Например:

Kurt Gödel был известным логиком и математиком.

Смотрите раздел Набор Сущностей Символов ISO Latin 1 для ознакомления с таблицей сущностей «Дополненного Latin 1», а так же раздел HTML Набор Закодированных Символов для ознакомления с таблицей позиций кода [ISO 8859-1] и управляющих символов в HTML наборе символов документа.


Перейти к первому, предыдущему, следующему, последнему разделу, оглавлению.