[xyzzy:04521] Re: エンコーディング, C-h
- Subject: [xyzzy:04521] Re: エンコーディング, C-h
- From: 堀川 久 <vzw00011@xxxxxxxxxxx>
- X-mailer: Datula version 1.50.06 for Windows
こんにちは。
KAMEI Tetsuya <kamei@xxxxxxxxxxxx>さんの
Message-Id: <200005121644.BAA25439@xxxxxxxxxxxxxxx>から
>> もう少し。UTF-8はLEとBEの区別がないのでBOMは必要ないように思うのです
>> が,Unicode signature入りのUTF-8の定義はどこでされているのでしょうか?
>
>現在のところ、どこにも定義されていないと思います(たぶ
>ん)。少なくとも Unicode Standard と RFC2279 には、BOM
>を付けろとも付けるなとも書いてありません(たぶん)。個人
>的には BOM を付けるのは意味がないと考えますが、世の中
>には BOM 付きのファイルも多数存在しているわけで、しょ
>うがないので以下のページを参考に両者を区別しています。
>
>http://www-4.ibm.com/software/developer/library/utfencodingforms/index.html
了解しました。
Unicode 3.0で定義されているのは,UTF-8, UTF-16BE, UTF-16LEだけのよう
です。
http://www.unicode.org/unicode/reports/tr17/tr17-3
BOM付きを扱えて「たぶん」損はないのですが,BOMなしをutf-8にしてBOM付
きをutf-8-wsぐらいにした方がいいような気もします。あと,
M-x list-coding-systems
できるとよさそう。
--
HORIKAWA Hisashi (堀川 久)
http://www2.airnet.ne.jp/pak04955/
mailto:vzw00011@xxxxxxxxxxx