|
BEARBEITEN
Verwendung Das Zeichen U+FEFF darf bei der Umkodierung in eine Codepage entfallen, da es nicht sichtbar ist und keine Auswirkung auf die Darstellung hat.
Bei der Kodierung von Texten in UTF-16 ist es als erstes Zeichen vorgeschrieben, um die Byte-Reihenfolge festzulegen. In der Little-Endian-Kodierung (UTF-16LE, Low Byte First) wird es als xFF xFE abgelegt, in der Big-Endian-Kodierung (UTF-16BE, High Byte First) als xFE xFF. Da die falsche Byte-Reihenfolge U+FFFE ergibt, was für alle Zeiten als "Not-a-character" festgeschrieben wurde, kann man an diesen beiden Bytes einer 16-Bit-Datei die Kodierungen UTF-16LE und UTF-16BE unterscheiden. Daher wird es auch als Byte Ordering Mark (BOM) bezeichnet. In der Kodierung UTF-8 wird U+FEFF als xEF xBB xBF abgelegt. Für UTF-8 ist es zulässig, aber nicht vorgeschrieben, dieses Zeichen (also diese Drei-Byte-Sequenz) an den Dateianfang zu setzen. Viele Editoren tun dies bereits und erkennen bereits UTF-8 an dieser Markierung. Wenn am Anfang einer Datei die merkwürdige Zeichenfolge  zu sehen ist, dann wurde eine UTF-8-Datei mit einer nicht-UTF-8-fähigen Software geöffnet. |
|
|
BEARBEITEN
Synonyme Byte Ordering Mark (BOM)
|
|
|
HINZUFüGENÄHNLICHE ZEICHEN
|
| < CHARACTER > | BLOCK | PROPERTIES |