アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
物事のやり方は一つではない -- Perlな人
EUC-JP to UTF-8 (スコア:1, 参考になる)
# こっちに書いてあっちで見るの
Re:EUC-JP to UTF-8 (スコア:2, 参考になる)
euc-jp utf8n
\ 0x5C 0x5C
~ 0x7E 0x7E
 ̄ 0xA1B1 0xEFBFA3
― 0xA1BD 0xE28095
\ 0xA1C0 0x5C
~ 0xA1C1 0xE3809C
∥ 0xA1C2 0xE28096
… 0xA1C4 0xE280A6
- 0xA1DD 0xE28892
¥ 0xA1EF 0xEFBFA5
¢ 0xA1F1 0xC2A2
£ 0xA1F2 0xC2A3
¬ 0xA2CC 0xC2AC
のように変換されていますね。
ここで、全角逆斜線 (Fullwidth Reverse Solidus, euc-jp:
Re:EUC-JP to UTF-8 (スコア:1)
データベースの移行時にはMySQL 4.1の持つ変換テーブルを使っています。具体的にはいまEUC-JPが入ってるMySQL 4.0なデータベースをそのままmysqldump(1)して、文字コード変換機能が付いたMySQL 4.1でset names ujisした上で変換をmysql(1)に任せてUTF-8なテーブルに収納しています。
直接testに全角逆斜線を入力した場合は問題ないので、MySQLの変換テーブルの不備の様です。ググったところ、MySQL日本語の旅 [timedia.co.jp]というサイトに考察がまとめらていました。これをベースに移行スクリプトの改善を試みます。
Re:EUC-JP to UTF-8 (スコア:1)
リンク先のページを読みましたが、
※1: 新キャラクタセットcp932,eucjpmsとは何か [timedia.co.jp]
※2: 全角のバックスラッシュ(\) はどう変換されるか [timedia.co.jp]
eucjpms については言及がなかったため検索してみましたところ、MySQL 4.1.12 (2005/6/29 現在の 4.1 系最新版) には eucjpms は入っていない [mysql.gr.jp]そうで、ujis から utf8 へのコンバートは少々面倒そうですね……。