ベトナム語はいったいどんな文字コードなんだろう?と調べてみました。
今日でこそ Unicode にベトナム語の装飾ゴテゴテの文字が収録されていたり、結合文字で解決できる訳ですが、それ以前はどうしていたのかと-つまり、日本で言うところの Shift-JIS とか JIS X 0201 とかに対応するモノは…という話で。
探してみると”VISCII”, “TCVN “というモノがあるそうです。
この”VISCII”、コード表を見てみると、もはや反則技とも思えるような荒技が繰り広げられておりました。
制御領域にも派手に文字が割り当てられております。
0×80-0x9Fは文字で埋まっています。
0×02, 0×05, 0×06, 0×14, 0×19, 0x1E にも文字が割り当てられております。
いいのかよ…
確かに、0x1F以下に定義されている文字は、ベトナム語ではほぼ出現することが無い文字(組み合わせとしてはあり得る)なので、まぁいいっちゃいいのでしょうが…
なお、各種資料をあさってみると、RFC 1456 と共にカリフォルニア州で作られたらしいので、ベトナムの国家規格という訳ではありません。
一方の”TCVN”の文字コードは、”TCVN 5712″。こちらは国家規格で、日本的には”JIS”みたいなもんでしょう。
文字コード表はこちら。
まるでISO-2022 シリーズのような表です。
まぁ、実際には、Unicodeを使うのが一般的なのですが、こんなのもありますって話で。


