[xyzzy:03863] Re: 同じ多言語でも
- Subject: [xyzzy:03863] Re: 同じ多言語でも
- From: masahito henmi <henmi@xxxxxxxxxxxxx>
- X-mailer: Denshin 8 Go V321.2b5
亀井さん、こんにちは。
|| めちゃですね。あの紹介。本当にあんな事できるんですか?
|まあ、うそは書いてないですけどね(UTF-7 以外)。逸見さん
|の知らん間にちっとは進化しているのですよ。
(笑)
そうそう、ここに書いてあることが、さっぱりわからなくって、
↓
<h4>Thu Jan 06 2000 Version 0.1.2.117(こっそり公開)</h4>
どういう意味なんだろうと首をかしげていたところです。
ファイルの名前をつけて保存メニューでも選択できるのは、
ShiftJIS,JIS,EUC,UniCode(I),UniCode(M),UTF-8のまんま
増えてないみたいだし。
どうやって使うんだろうと・・・
<ul>
<li>なんとなくCP932以外の文字セットをサポート。とりあえず今のところ認識できるのは、
<ul>
<li>CP932(US-ASCII + JIS X 0201 + JIS X 0208)
<li>JIS X 0212
<li>ISO 8859-1〜5, 7, 9, 10 右半分
</ul>
こんだけ。コードポイントにはまだ多少空きがあるので、GB 2312-80 / KS C 5601-1987(KS C 5601-1992は無理) / Big-5 は入れようと思えば入るんだけど、どーしょーかなー。
<li>それに伴って、文字セット(言語)ごとにフォントを指定できるようにした。ロシア語・ギリシャ語に対して日本語フォントを指定すると表示がメタメタになるが、それはそういう仕様。
<li>ファイル入出力、コード変換系を丸ごと書き直し。だいたい動くと思うが、いまいち自信なし。
<li>UTF-16のへなちょこサポート。ついでに、Unicode系の知らない文字を含むファイルを読んで書いても壊さない
ようにしたつもり。ただしへなちょこなので、まともに表示とかはできない。また、サロゲートペアと知らない文字は、2文字にマップされているため、下手に編集すると壊れてしまう。
|ただ、今のところは単に表示が出来るだけで、多言語をウリ
|にできるほどのものではないので(ウリにしようとも思って
|ないけど)、あの紹介を見て多言語マニアのみなさんに変に
|期待されても困るなと……。
関係ないですけど、最近reference.xmlでPERLのXML::DOMを使っているんですが、
そいつでUnicodeでやってます。
で、文字化けを見つけてしまって・・・
全角の−とか〜とか(一部の文字で)Unicodeで入れたのを、XML::DOMで処理して
ShiftJisに出力すると結果が文字ばけしてしまいます。
xyzzyとJcode.pmの変換表に差があるのかなーと、想像しているんですが。
p.s.17日の19:25〜つい先ほどまでで、うちのページも約1000回アクセス
あったみたい。
------------------------------------------------------------
逸見雅人 Masahito Henmi henmi@xxxxxxxxxxxxx
♪あなたの願いも仕事もうまくいきますように・・・