[Date Prev] [Date Index] [Date Next]
[Thread Prev] [Thread Index] [Thread Next]

[xyzzy:07277] Re: 文字コード判定失敗



皆様お答えいただき、ありがとうございます。

えっと、
xyzzyの吐き出すテキストは、どうやら正常に読めるらしいです。

Cygwin(今となってはバージョン不詳)でHTML tidy をコンパイルして
使っていたのですが・・・
tidy の吐き出したファイルを、読み込ませようとすると文字コード判定
に失敗してしまうのでした。

Cygwinを今朝バージョンアップして、さらに行末コードをUNIXスタイルに
して試したら・・・
やっぱり、しくじっているので、行末コードには関係ないらしい。

はっ(・o・)、今気づいたんだけど、c-u M-x rev TAB してみたら・・・
テキストにラテン文字が混じっているわ。
ローマ字を&Oclik;とか書いてあったはずが、いつのまにか実態のコードになって、
メムマモな四角い羊羹に・・・なってしまっているわ(;_;)。

&ほげほげ; がないテキストをtidyで処理したのを、読ませると「問題なし!」
ということらしい。
なんだぁ、tidyにメムマモ現象が存在したのが原因だったのね〜。

お騒がせしてすみませんでした。(_○_)ぺこぺこ。

amei> | iso-2022のテキストで、行の終端がDOSスタイルのになっていると、
kamei> | S-JISとして、読み込む癖があるようです。
kamei> 
kamei> そうすか? エンコーディングの判定に行末コードは影響しな
kamei> いはずですが。再現するテキストがあって、人に見られても

Index Home