ベトナム語の文字コード-VISCII

ベトナム語はいったいどんな文字コードなんだろう?と調べてみました。
今日でこそ Unicode にベトナム語の装飾ゴテゴテの文字が収録されていたり、結合文字で解決できる訳ですが、それ以前はどうしていたのかと-つまり、日本で言うところの Shift-JIS とか JIS X 0201 とかに対応するモノは…という話で。

探してみると”VISCII”, “TCVN “というモノがあるそうです。

この”VISCII”、コード表を見てみると、もはや反則技とも思えるような荒技が繰り広げられておりました。

制御領域にも派手に文字が割り当てられております。
0x80-0x9Fは文字で埋まっています。
0x02, 0x05, 0x06, 0x14, 0x19, 0x1E にも文字が割り当てられております。

いいのかよ…
確かに、0x1F以下に定義されている文字は、ベトナム語ではほぼ出現することが無い文字(組み合わせとしてはあり得る)なので、まぁいいっちゃいいのでしょうが…

なお、各種資料をあさってみると、RFC 1456 と共にカリフォルニア州で作られたらしいので、ベトナムの国家規格という訳ではありません。

一方の”TCVN”の文字コードは、”TCVN 5712″。こちらは国家規格で、日本的には”JIS”みたいなもんでしょう。
文字コード表はこちら
まるでISO-2022 シリーズのような表です。

まぁ、実際には、Unicodeを使うのが一般的なのですが、こんなのもありますって話で。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Spam Protection by WP-SpamFree