Die folgende Tabelle enthält den Teil eines Zeichensatzes, der die Thai-Zeichen enthält. Die Nummerierung der Zeilen und Spalten bezieht sich auf einen Nicht-Unicode-Zeichensatz, bei dem die Zeichen in der oberen Hälfte des 1-Byte-ASCII-Codes untergebracht sind. Die Adresse eines Zeichens (und damit den Code) kann man ermitteln, indem Zeilen- und Spaltenwert addiert werden.
Das Zeichen GO GAI hat demnach den Wert 161 in der Codetabelle, wie Sie leicht nachrechnen können.
Heutzutage hat sich allerdings der sog. Unicode durchgesetzt, der Zeichen mit mehr als 8 Bit beschreibt und daher fast unbeschränkt viele Zeichen für alle Sprachen dieser Welt zur Verfügung stellt. Für ein Unicode-Zeichen wird dem ASCII-Code der konstante Wert 3424 hinzuaddiert.
Auffällig ist, dass Tonzeichen und einige Vokale mehrfach in der Tabelle enthalten sind. Warum? Sie liegen in unterschiedlichen Höhen im Zeichensatz, so dass ein entsprechend ausgerüstetes Schreib-Programm Zeichen genauer zusammen setzen kann. Beispiel:
Ein Konsonant ohne Vokal, aber mit Tonzeichen wird normalerweise so geschrieben: Zumindest erzeugt die Tastatur standardmäßig die Codes dafür. Ein intelligentes Programm könnte jedoch erkennen, dass der für einen eventuellen Vokal reservierte Platz in diesem Fall nicht notwendig ist und für die Anzeige und den Druck das Tonzeichen durch ein tiefer liegendes ersetzen und daraus machen. Sieht doch besser aus!
Die Ersetzung darf jedoch nicht stattfinden, wenn ein Vokal über dem Konsonanten steht: und nicht so .
Das Ersetzen durch alternativ vorhandene Codes sollten wir allerdings dem verwendeten Programm überlassen. Das nämlich ersetzt nur für die Anzeige und lässt den gespeicherten Code unverändert, so dass andere Programme auch damit fehlerfrei arbeiten können. Also: keineswegs die alternativen Zeichen selbst eintippen.