アカウント名:
パスワード:
# このようにすることでクライアント側の原因が一つ減るはずです。 ## 私の推論に誤りがあれば御指摘下さい>識者および slashmaster
> 四項目しかありません。ご指摘のUnicodeは見あたらないようです。
サーバ側で様々な文字コードを解釈できるのが理想的な状態というか本質的な解決策なのかもしれませんが、手っ取り早い方法としては hinata さんの方で歩み寄って UTF-8 の使えるウェブブラウズ環境を整えることで解決できるのではないかと思います。
大変申し訳ありませんが、hinata さんの環境は私の使った事が無いモノなので、私が助言できるのはここまでです。 # だ、誰か続きを…(汗
> 解決は無理かもしれません
Classic環境のInternet Explorer 5.1.7で確認してみました。
たしかに、ユーザー設定の署名と自己紹介のテキストエリアで文字化けが発生していました。ただし、文字コード自体は正しくて、フォントがなぜか欧米フォントになっているようです。実際、テキストエリアの内容をコピーして、SimpleTextにペーストしたところ正常に表示されました。
CSSの問題かとも思って、CSSを切ってみたのですが、問題は解決されませんでした。IE 5.1.7 for Macのバグではないかという気もします。
とりあえず、手許の環境では解決しました。
「初期設定」の「言語/フォント」の「既定の文字セット」をUTF-8にして、フォントの指定を「固定ピッチフォント」はOsaka-等幅に、それ以外はOsakaにしたところ、正常に表示されるようになりました。
# IE for Macは久しく触っていなかったので、設定を忘れていました。バグを疑って悪かった > IE for Mac。
> 念のためにUTF-8 → ASCII → EUC-JP → Shift_JIS → 7bit JISの順番で文字コードを推測
直感的には 日→英→日→日→日、と推測しているようで、なんだか不安になってきます。 どんな方法がより良いのかは判りませんが、私は UTF-8 → ISO 2022-JP(7bit JIS?) → EUC-JP → Shift_JIS → ASCII、という推測順序の方が良さゲに思います。 # 私見ですが、UTF-8, ISO 2022-JP は今後も活用されるコード、EUC-JP, Shift_JIS は現状のスタンダードだが衰退する(させるべき)、最後の砦が ASCII、という感じ。
なお、余談ですが、UTF-8 に導入によって所謂 CJK 統一コードとなったわけですが、C な国のコードや K の国のコードを恒常的に使用するユーザが現れた場合の挙動、というのはある程度確認なさっているのでしょうか?
最初に公開βが告知された時、(今は消えている)テスト用の記事へのコメントに CJK コードのテストコメントと思われるものが散見されましたが、タレコみや日記、記事本文や、本スレッドの趣旨である署名や自己紹介欄などへの適用がイマイチ心配です。 # そういえば、Perl に tait モードというのがあることを思い出しましたが、活用なさってますよね?
> NoGoodさんは文字集合と文字コードを少し混同してませんか?
FAQ かどこかに… Slashdot Japan Wiki [osdn.jp] にまとめておきます orz お手数をおかけして申し訳ありませんでした。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike
文字化けします… (スコア:1)
MacOS9.2のIE5.1.6使用です。
文字が化けるのには慣れっこなオールドMacユーザーですが…とりあえず一言ご報告を。そんな風に見えているひとも(ほんの数パーセントかもしれませんが)いてるんですよーっという表明になれば…。
我慢してくれって言われそうですが。
Re:文字化けします… (スコア:1)
もしできるなら、そのように設定を変更してからもう一度試して結果をコメントして下さい。
# このようにすることでクライアント側の原因が一つ減るはずです。
## 私の推論に誤りがあれば御指摘下さい>識者および slashmaster
mobile ID portable_NoGood [slashdot.jp] 併用中
Re:文字化けします… (スコア:1)
そもそも、日本語には
自動判別
JIS
シフトJIS
EUC
の四項目しかありません。ご指摘のUnicodeは見あたらないようです。とりあえずかたっぱしから変更して試してみましたが、文字化けは直りませんでした。
Re:文字化けします… (スコア:1)
サーバ側で様々な文字コードを解釈できるのが理想的な状態というか本質的な解決策なのかもしれませんが、手っ取り早い方法としては hinata さんの方で歩み寄って UTF-8 の使えるウェブブラウズ環境を整えることで解決できるのではないかと思います。
大変申し訳ありませんが、hinata さんの環境は私の使った事が無いモノなので、私が助言できるのはここまでです。
# だ、誰か続きを…(汗
mobile ID portable_NoGood [slashdot.jp] 併用中
Re:文字化けします… (スコア:1)
解決は無理かもしれませんが、とりあえず、何が原因かは分かって非常にすっきりしています。助かりました(ぺこり)
Re:文字化けします… (スコア:1)
mobile ID portable_NoGood [slashdot.jp] 併用中
Re:文字化けします… (スコア:1)
Classic環境のInternet Explorer 5.1.7で確認してみました。
たしかに、ユーザー設定の署名と自己紹介のテキストエリアで文字化けが発生していました。ただし、文字コード自体は正しくて、フォントがなぜか欧米フォントになっているようです。実際、テキストエリアの内容をコピーして、SimpleTextにペーストしたところ正常に表示されました。
CSSの問題かとも思って、CSSを切ってみたのですが、問題は解決されませんでした。IE 5.1.7 for Macのバグではないかという気もします。
Re:文字化けします… (スコア:1)
とりあえず、手許の環境では解決しました。
「初期設定」の「言語/フォント」の「既定の文字セット」をUTF-8にして、フォントの指定を「固定ピッチフォント」はOsaka-等幅に、それ以外はOsakaにしたところ、正常に表示されるようになりました。
# IE for Macは久しく触っていなかったので、設定を忘れていました。バグを疑って悪かった > IE for Mac。
Re:文字化けします… (スコア:1)
よろしくお願いします。
Re:文字化けします… (スコア:1)
# オライリーの CJK 本が見たい瞬間…
直感的には 日→英→日→日→日、と推測しているようで、なんだか不安になってきます。
どんな方法がより良いのかは判りませんが、私は UTF-8 → ISO 2022-JP(7bit JIS?) → EUC-JP → Shift_JIS → ASCII、という推測順序の方が良さゲに思います。
# 私見ですが、UTF-8, ISO 2022-JP は今後も活用されるコード、EUC-JP, Shift_JIS は現状のスタンダードだが衰退する(させるべき)、最後の砦が ASCII、という感じ。
なお、余談ですが、UTF-8 に導入によって所謂 CJK 統一コードとなったわけですが、C な国のコードや K の国のコードを恒常的に使用するユーザが現れた場合の挙動、というのはある程度確認なさっているのでしょうか?
最初に公開βが告知された時、(今は消えている)テスト用の記事へのコメントに CJK コードのテストコメントと思われるものが散見されましたが、タレコみや日記、記事本文や、本スレッドの趣旨である署名や自己紹介欄などへの適用がイマイチ心配です。
# そういえば、Perl に tait モードというのがあることを思い出しましたが、活用なさってますよね?
mobile ID portable_NoGood [slashdot.jp] 併用中
Re:文字化けします… (スコア:1)
ページの文字コードはUTF-8なので、普通のブラウザだとPOSTされるデータもUTF-8で送られてきます。また、UTF-8なバイト列はとても特徴的なので判別がかなり確実にできますので、一番目です。
ASCIIはhigh-bitがひとつも立っていないバイト列なので、確実に判別できます。UTF-8だが日本語などが一文字も含まれてない場合はASCIIと等価です。頻度が比較的高く、誤判定もまずないので、二番目です。
EUC-JPとShift_JISは自動判別が必ずうまくいくわけではありません。現在の環境がEUC-JPなため、判別できない場合はEUC-JP優先にしました。
7bit JISは完全にトチ狂ったブラウザのためのオマケです。
NoGoodさんは文字集合と文字コードを少し混同してませんか?UTF-8はCJKだけでなくいろいろな言語の文字を含む文字集合であるUnicodeのエンコーディングです。ASCIIは(基本的には)Alpha-Numericな文字のみ、EUC-JPとShift_JISは細かい違いはあれど基本的にはおなじ日本語の文字をカバーする同じ文字集合の異なるエンコーディングです。
新システムでは文字集合としてUnicodeを採用しています。そして、そのUnicodeのすべてを表現する文字コードとしてUTF-8を使っています。上に上げられている他の文字コードはいずれもUTF-8より表現できる文字が少ないです。文字コードの推測にはUTF-8とASCII以外は日本語用の文字コードしか推測対象に入ってないので、中国語や韓国語用の文字コード(例えばBig5やEUC-KR)で何かがPOSTされてくると、誤判定(例えばEUC-KRとEUC-JPは判定不可な気がします)されるか、変換不可で弾かれます。同じハングル文字でもUTF-8だと意図通りに受付けられます。
UTF-8で表現できる範囲内では特に使える文字種は制限していないので、現地のローカルな文字コードではなくUTF-8でPOSTすれば、コメントや日記、記事本文や自己紹介、署名など、あらゆるものを韓国語や中国語だけでなく、右から左にかかれるアラビア語、更には古代ルーン文字などで書く事が技術的には可能です。将来、なんらかの理由によりどうしても避けられない限り、日本語の文字のみの文字集合に制限する、という事は考えていません。
Re:文字化けします… (スコア:1)
今回御教示いただいた内容で理解できたつもりです。
ありがとうございます。
FAQ かどこかに… Slashdot Japan Wiki [osdn.jp] にまとめておきます orz
お手数をおかけして申し訳ありませんでした。
mobile ID portable_NoGood [slashdot.jp] 併用中