[xyzzy:07277] Re: 文字コード判定失敗
- Subject: [xyzzy:07277] Re: 文字コード判定失敗
- From: jc5m-ootk@xxxxxxxxxxxxxxx (Masaya Ohtsuki)
- X-mailer: Message Editor Version 2.3.5
皆様お答えいただき、ありがとうございます。
えっと、
xyzzyの吐き出すテキストは、どうやら正常に読めるらしいです。
Cygwin(今となってはバージョン不詳)でHTML tidy をコンパイルして
使っていたのですが・・・
tidy の吐き出したファイルを、読み込ませようとすると文字コード判定
に失敗してしまうのでした。
Cygwinを今朝バージョンアップして、さらに行末コードをUNIXスタイルに
して試したら・・・
やっぱり、しくじっているので、行末コードには関係ないらしい。
はっ(・o・)、今気づいたんだけど、c-u M-x rev TAB してみたら・・・
テキストにラテン文字が混じっているわ。
ローマ字を&Oclik;とか書いてあったはずが、いつのまにか実態のコードになって、
メムマモな四角い羊羹に・・・なってしまっているわ(;_;)。
&ほげほげ; がないテキストをtidyで処理したのを、読ませると「問題なし!」
ということらしい。
なんだぁ、tidyにメムマモ現象が存在したのが原因だったのね〜。
お騒がせしてすみませんでした。(_○_)ぺこぺこ。
amei> | iso-2022のテキストで、行の終端がDOSスタイルのになっていると、
kamei> | S-JISとして、読み込む癖があるようです。
kamei>
kamei> そうすか? エンコーディングの判定に行末コードは影響しな
kamei> いはずですが。再現するテキストがあって、人に見られても