[xyzzy:07031] Re: internal-char-table について
- Subject: [xyzzy:07031] Re: internal-char-table について
- From: chiyu <ma11092c@xxxxxxxxxxxxxxxxx>
こんにちは。chiyu@ふくおか、といいます。
# 注音字母を覚えてみたくて、xyzzyで動くtyping練習ゲームを
# 作ろうとして、注音とピンインの対応データを入力中。
# ハングル版(IME使用)は出来たので、それをちょっと
# 改良するだけ。
# でも、実は、とてもゲームと呼べる代物ではないので、
# すぐに飽きちゃうかもしれませんが。(Cの教科書によくある
# コマンドラインのtypingゲームそのもの!なんです。)
さて、
亀井さん writes:
> そもそも GB2312-80 には「広」に相当する文字が存在しな
> いので。CNS 11643 の後ろの方にあるみたいですが、これは
> 未サポートです。よく知りませんが、簡体字だと「广」に似
> ている字が「広」に相当するのではないでしょうか。
GB2312には存在しませんが、EUC-GBの上位互換コードである
GBKには存在します。
GBKでの2バイト文字は、81-FEが1バイト目で、
40-7E,80-FEが2バイト目になっているそうです。
日中之星やcWnnでは、多分GBKの拡張部分は使えないと思います。
WindowsのMS HeiやMS Songフォントは、GBKフォントです。
朝鮮語のフォントも同様のコードがあります。
KSX1001(旧KSC5601)完成型コード(EUC-KR)の上位互換コードとして
UHC(Unified Hangul Code 統合型ハングルコード)というのが
あります。
GBKは公式な規格だそうですが、UHCはMicrosoft社独自の
規格だそうです。
なお、大陸中国では、2001年3月一杯でGB2312の使用は禁止され、
GB18030の使用が義務づけられたのだそうです。
GB18030はGBKの(従ってGB2312の)上位互換コードで、
4バイトコードの部分に残りのユニコードの文字を
入れる*予定*なのだそうです。
参考webページ
http://www.jaet.gr.jp/gb18030/
以上。お元気で。