[Date Prev] [Date Index] [Date Next]
[Thread Prev] [Thread Index] [Thread Next]

[xyzzy:04521] Re: エンコーディング, C-h



 こんにちは。

KAMEI Tetsuya <kamei@xxxxxxxxxxxx>さんの
Message-Id: <200005121644.BAA25439@xxxxxxxxxxxxxxx>から
>>  もう少し。UTF-8はLEとBEの区別がないのでBOMは必要ないように思うのです
>> が,Unicode signature入りのUTF-8の定義はどこでされているのでしょうか?
>
>現在のところ、どこにも定義されていないと思います(たぶ
>ん)。少なくとも Unicode Standard と RFC2279 には、BOM 
>を付けろとも付けるなとも書いてありません(たぶん)。個人
>的には BOM を付けるのは意味がないと考えますが、世の中
>には BOM 付きのファイルも多数存在しているわけで、しょ
>うがないので以下のページを参考に両者を区別しています。
>
>http://www-4.ibm.com/software/developer/library/utfencodingforms/index.html

 了解しました。

 Unicode 3.0で定義されているのは,UTF-8, UTF-16BE, UTF-16LEだけのよう
です。
	http://www.unicode.org/unicode/reports/tr17/tr17-3

 BOM付きを扱えて「たぶん」損はないのですが,BOMなしをutf-8にしてBOM付
きをutf-8-wsぐらいにした方がいいような気もします。あと,
	M-x list-coding-systems
できるとよさそう。

-- 
HORIKAWA Hisashi (堀川 久)
http://www2.airnet.ne.jp/pak04955/
mailto:vzw00011@xxxxxxxxxxx

Index Home