異体字の場合は現代文芸と「お名刺」印刷以外からの要求事項(教科書編纂や住民登録処理等)が厳然としてある。
カナや英数字の二重コード問題はJIS C 6226-1978の策定ミス [asahi.com]であることが明白(リンク先はISO646だが、シングルバイトのカナも同じ構想があった。)。とはいえ、今となってはひらがなの不在や原稿用紙との対応に欠けるという弱点を持ったX0201のカナをフェードアウトさせるのが筋。過去データを読む以外の意義しかない。文芸するならPNGですべき。
HTTP レベルの話をすると、
HTTP 1.1 (RFC 2616) [urn]
14.2 Accept-Charset
で
The Accept-Charset
request-header field can be used to indicate what
character sets are acceptable
for the response.
とされているので、form に対してクライアントが送る文字コードを指定するのには使えなさそうな風味。
話を混ぜるのはやめよう (スコア:5, 参考になる)
技術的な視点:
Mail と NetNews で MIME を使わない場合:
日本語のメッセージには ISO-2022-JP を使うから
いわゆる「半角カナ」(JIS X 0201の右半分)は使えない。
独自で使えるようにしてある実装はあるが、それは違反。
MIME を使う場合:
いわゆる「半角カナ」を利用できるエンコーディングであれば
普通に使うことができる
WWW の場合:
MIME と同様
ちなみに、各地の掲示板などで、「半角カナは化けるから
使用禁止」とあったのは、
a. 仕様の不備
(FORM のコードの指定方法が以前は未定義だった)
b. a. に基づく一部の古いブラウザの実装の不備やバグ
(最近のは大丈夫です)
c. 掲示板のプログラムが腐ってる
(今でも腐ってるのけっこうあると思います…)
によってじっさいに化けていたからなわけですが、
今ではもう無視できる話です。
文字コード概念での視点:
現在主流の文字コードは、原則的には文字を字形でなく、
その意味で規定し、名前を割り当てる。
ISO-2022 系のエンコーディングでは、複数の文字集合を
組み合わせて使う場合、同じ文字(同じ名前の文字)
については、原則としては互換目的以外では、
コードを割り当てる領域の番号が小さいものを使う
ことになっている。「全角英数字」や「半角カナ」
を互換目的以外に使うべきではない
Unicode でも「互換文字」である部分の文字は
原則として使うべきではない。化けるようなプログラムはステ。
現実:
文字を意味でとらえる概念はまったくもって一般的に
なっていない。みな「字形」をそのよりどころとしている。
MIME をフルサポートしてるメーラ/ニュースリーダが普及
しきってるわけではないのが現状。少なくともメールにおいて
は、ISO-2022-JP 以外を使うのはまだ非現実的。
よって少なくともこの分野においては使うべきではない。
WWW においてはその点の問題はほぼ存在しないから、
コンテンツ作成者の主義主張の問題次第。
私見:
文字の意味的には同じだから、文字幅などの字形には意味が
無いというのは正論だが現実を見ていない。実装がある前の
論理的な話ならともかく、現実には、いわゆる「半角カナ」
を半角で表示しない実装はほぼ無く、そうなるとそこに意味
が生じてしまうのは必然である。
実際、パソコン通信時代からある「半角カナ」を利用した用語
群には、「半角カナであること自体に意味がこめられている」
のが共通のお約束。そういった背景を把握せずに機械的に非難
するのは無粋。
半角カナなどの互換文字と、「はしご高」などの異体字
は、厳密には方向性は違うけど、目にみえる実際の問題として
は同種。後者の文字コードとしての割り当てを願う人は、
前者に文句をつける筋合いは無いはず(藁
世間は確実に「文字を増やす」方向に動いており、その中で
「半角カナ」という意味をもってしまったものが消えるとは
とうてい思えない。
ついで。2ch の AA は、そもそも「MSゴシック依存」であり、
半角カナ以前。気にするほうが間抜け。
Re:話を混ぜるのはやめよう (スコア:2, すばらしい洞察)
で、お決まりの突っ込み……どうして「MS」「P」が全角英字なんだー。
鵜呑みにしてみる?
Re:話を混ぜるのはやめよう (スコア:3, すばらしい洞察)
Re:話を混ぜるのはやめよう (スコア:1)
カナや英数字の二重コード問題はJIS C 6226-1978の策定ミス [asahi.com]であることが明白(リンク先はISO646だが、シングルバイトのカナも同じ構想があった。)。とはいえ、今となってはひらがなの不在や原稿用紙との対応に欠けるという弱点を持ったX0201のカナをフェードアウトさせるのが筋。過去データを読む以外の意義しかない。文芸するならPNGですべき。
当方が対応を異ならせる理由としては、こんなもの。
Re:話を混ぜるのはやめよう (スコア:1)
そもそも様々なOSで閲覧されるWebにおいて、特定のOSにのみ存在するフォントに依存するものを作る、というのがいかがなものかと思いますね。今ならモナーフォントというのも一応ありますが、「MS Pゴシックアート」が最初に作られたころにはそんなものはなかったでしょうから、色々な環境の人がいる、ということに対する配慮が足りなかったとは言えるでしょう。
Re:話を混ぜるのはやめよう (スコア:1)
プロポーショナルフォントでいいとおもうし、
プロポーショナルフォントで一番スタンダードなのは、
「MS P ゴシック」なわけだから、それでいいんじゃないかな
2ちゃんねるなどのインターネットの掲示板でアスキーアートが発展したのは、
むかしのBBSやnetnewsの世界では固定ピッチフォント中心だったのが、
インターネットではプロポーショナルが普及し、またOS市場をWindowsが制覇し、
「MS P ゴシック」が共通基盤になったからだとおもう
ちなみに、インターネットで、日本のAAがすごいのは、
全角スペース(半角スペースだとhtmlでは1文字に省略される)があるのと
プロポーショナルフォントがあるからって聞いたような気がする
# 半角スペースの連続は、 をつかってもできるけどね・・・
Re:話を混ぜるのはやめよう (スコア:1)
うーむ、そういうものなのですか(私はアスキーアートを書かないからよくわからない)。
そうか? 「MS P ゴシック」がスタンダードなのはあくまでWindows系OSに限った話でしょう。
確かにWindowsが最もシェアを獲得したのは事実かも知れないが、だからといって「Windows以外の環境なんてどうでもいいや」ということになるわけではない。Windowsだって、BSD/OS, FreeBSD, Linux, MacOS, NetBSD, OpenBSDなどと同様、数多く存在するOSのひとつに過ぎない。
多くの環境で見られるという観点で見ると、全角文字(JIS X0208)が半角文字(ASCII)の2倍の幅であるモノスペースフォントがMS Pゴシックよりはるかによいでしょう(こういうメトリックのフォントが存在しない環境ってありますか?)。表現力は多少落ちるかも知れないが、表現力のためにクロスプラットフォーム性を犠牲にするのはいい考えとは言えないでしょう。
全角スペースの問題 (スコア:1)
OSではなくブラウザの話ですが、Operaでは全角スペースもスペースとして扱い、行頭の全角スペースは無視するというHTMLとしては正しい解釈をしたために全角スペースを使ってインデントしたテキストが非常に見難いという問題がありました。
さすがにまともに見られないページが多かったために、現在では他のブラウザに合わせて全角スペースを無視しないようになっています。
うじゃうじゃ
Re:全角スペースの問題 (スコア:1)
(違いましたっけ?)
文字コードもそうですが、結局のところ、ある程度、現状に合わせて流れるのはいたしかたのないことではないかと。
原則に沿うように改訂するにしても、現状を引き戻すよりは追加or新しい規格にする方向でやらないと、無用の混乱を招くように思います。
Re:全角スペースの問題 (スコア:1)
全角であっても字体?としては空白なので空白文字として扱わないと混乱する場合もあります。
実際にそれでちょっとだけ困ったことがあります。(ネット上の話ではないですが)
> 現状に合わせて流れるのはいたしかたのないことではないかと。
ええ、現実を無視して理屈を押し通すのがいいことだとは思っていません。
でも、あまり大きなものではないとはいえそこに「問題」があることは認識しておいた方がよいのではないかと思います。
うじゃうじゃ
Re:全角スペースの問題 (スコア:1)
>行頭の全角スペースは無視するというHTMLとしては正しい解釈
HTMLで「空白類文字」とみなされるのは
・ASCIIスペース (0x0020)
・水平タブ (0x0009)
・書式送り (0x000C)
・ゼロ幅スペース (0x200B)
と行区切り類(CR/LF/CRLF)だけ。
これら以外の空白文字についてはHTMLでは定義してないし、振る舞いは実装依存。
従って、Opera旧Verの実装はHTML的に正確でも間違いでもないし、
他のブラウザの実装も同様。
#参照 [asahi-net.or.jp]。
Re:話を混ぜるのはやめよう (スコア:0)
というのは「webで公開した情報はなるべく多くの人間で共有すべし」みたいな一般論ですよね?AAを書いてる人々は「他のOSの存在なんて知らんもんね」っていう考えなんでしょうから、そんなことを言われても無駄なんじゃないかと....
Re:話を混ぜるのはやめよう (スコア:0)
ボックス貼り付け、カットができるエディタ
なんてのも開発されてます。
http://aaesp.tripod.co.jp/ [tripod.co.jp]
最初見たときは驚きました
細かいなぁ (スコア:1)
人間はそれほど多くないと思われ.そのような足枷を無視したからこそ
多様な表現を手に入れられたわけだし.
そもそも新しい表現というやつは既成の慣習を越えたところにある
ものだから,「すべての環境に配慮していない」のはある意味
しょうがないかと.
どちらかというと,モナーフォントみたいに新しい表現をサポートする
努力をするのが正しいでしょうなぁ.
Re:話を混ぜるのはやめよう (スコア:0)
そもそも、rfcに強制力なんてないぞ。
いろんな文字があった方が面白いしね。
Re:話を混ぜるのはやめよう (スコア:1)
「文字の意味的~」
私の周りではレポートやプレゼンテーションでのサイズ的な問題で
使ってる人がほとんどですが、そこに意味が生じてるとは思いません。
「詰め込む」という意図は生じていますが、「文字の意味」ではないと思います。
「実際、~」
パソコン通信のような閉じたローカルな環境において、「共通のお約束」とはいかなるものなのか?
せいぜい、「私の知っている」に限定されると思うのですが。
なんか資料みたいなのありますか?
「半角カナなどの~」
そうかもしれない。
逆にいうと、異体字に割り当てがない現状において、抜け駆けは許さんということか?
Re:話を混ぜるのはやめよう (スコア:2, 参考になる)
逸般的な世界では半角カナで書くことにはそれ相応の意味があったのです。
基本的には、揶揄や自虐といった感情をこめる場合、それから単純に度合いが
強いことを示す場合などに使われていました。「顔文字」に準ずる位置づけを担っていたわけです。
パソコン通信が閉じていたのはその事通りですが、ある程度人が移動
するのと、「辞書」という形での文化流出によって、インターネット前夜の段階で、一定以上の
範囲で、この「半角カナ」を駆使する独特の用語群が共通して使われるようになっていました。
それの一部はそのままインターネットにももちこまれています。ただ、当初は「半角カナ禁止」の
影響で駆逐され気味だったものが、2ch の台頭により、新しい顔文字や用語と併せて復権した
感があります。コメント投稿者の指摘はその点正しいですね。
もっとも、当時に比べてネット人口は圧倒的に増加しているわけで、そのパソコン通信由来で
あった意味をこめて使っている人がはたしてどの程度いるのかは不明ですが…
この種の半角カナの用法のある程度まとまった資料としては「通信用語の基礎知識」の「波動編」
を通読すると……って消えてるし(汗) うーん。現在の版から検索したらかなりの用語が消えてますね。
従来は「(ぉ」の部分に、半角カナを含めた活用があったはず……おねがいGoogleどん!……ハケーン
古い版の該当部はこうでした(波動用語の基礎知識'95)
#(ォ [オ] 〔単漢字〕
おいおい、のように自分にツッコミを入れるときに用いる.
【用例】X68030での不都合を修正したら, 000機種で不都合
した(ぉ
【用例】>>俺んち北海道~
>夏休みにでも襲撃しますので流氷見に連れていっ
>て下さいね~(
夏に流氷なんかねぇ~~~~~~~~(笑)
※全角よりも半角, ひらがなよりもカタカナ, 更に大カタカ
ナよりも小カタカナのほうが, より気持ちのこもった表現
になる. (お→(オ→(ぉ→(ォ→ (オ → (ォ
現在の版で該当項目がどうなっているのかは、ご自分でご確認ください。
どーしてもおいかけていろいろ調査してみたければ、この用語集の古い版などを探して
みてください。少なくとも2000年ごろまではいろいろと載っていたと記憶しています
ま、「半角カナ」を単純に否定することは、こういったある種の「文化」をまるごと否定する
ことにつながる、ということはご理解いただけるのではないでしょうか。技術的に無理なら、
しょうがないけど技術的に可能となると、この概念は下手すると永劫に消えないのではないか
と思います。マジで。
Re:話を混ぜるのはやめよう (スコア:0)
文化云々を言うのなら、JISコードという限られた範囲で文字セットを示すと言う「取り決め」によって消し去られてしまった文
Re:話を混ぜるのはやめよう (スコア:0)
味方が10人殺されたなら敵は3人殺してもいいということかい?
Re:話を混ぜるのはやめよう (スコア:0)
>ことにつながる、ということはご理解いただけるのではないでしょうか。
てことは半角カタカナをUNICODEなりJISなりに入れるのが真っ当なんでしょうね。やっぱり。
Re:話を混ぜるのはやめよう (スコア:0)
>が真っ当なんでしょうね。やっぱり。
両規格に入ってますよん。
JIS X 0201
http://www2d.biglobe.ne.jp/~msyk/charcode/jisx0201kana/
Unicode
http://www.unicode.org/charts/PDF/UFF00.pdf
Re:話を混ぜるのはやめよう (スコア:0)
#ACでよかった…
では改めて…
IME等で、半角入力してるつもりで実はコード的には全角、ってのが真っ当なんでしょうね。やっぱり。
Re:話を混ぜるのはやめよう (スコア:1)
(FORM のコードの指定方法が以前は未定義だった)
b. a. に基づく一部の古いブラウザの実装の不備やバグ
最近のは大丈夫です)
最近のブラウザって accept-encoding にきちんと対応して
いるんでしょうか?
--
(いわゆる) 半角カナが混じった場合,EUC-JP と Shift_JIS
を完全に判別することが出来ないってのは厳しいですねぇ。
HIRATA Yasuyuki
Re:話を混ぜるのはやめよう (スコア:1)
Accept-Encoding は gzip/bzip2 などのコンテンツ圧縮形式とかなどを出す方なので、HTTP/1.1 的には Accept-Charset の方でしょうか。
Re:話を混ぜるのはやめよう (スコア:1)
あ、すみません。 HTML の form における accept-charset [w3.org] のことを言おうとしていました。 (うろ覚えで書いたら間違えてしまった。ごめんなさい。)
HTTP レベルの話をすると、 HTTP 1.1 (RFC 2616) [urn] 14.2 Accept-Charset で The Accept-Charset request-header field can be used to indicate what character sets are acceptable for the response. とされているので、form に対してクライアントが送る文字コードを指定するのには使えなさそうな風味。
嘘書いているかも...
HIRATA Yasuyuki
Re:話を混ぜるのはやめよう (スコア:1)
> 状況に応じて違うんだから、一括してくくって言うのはあかんよ。
利用者によっては、違いを説明する方が面倒なので、
「普段から使わないようにしておかないと、メールにうっかりつかってしまうかもしれませんよ」「メールが一番制限が多い」
などと一括して案内していました(多いのは例によって○付き数字ですが。あと、レスという言葉も最近また増えてきたな)。
メールに限っていうと上記場所で割と普及しているメールソフトウェアが初期設定で、1byteカタカナを2byteカタカナに置き換えて発信するようになっているために、本文作成時点では1byteカタカナを使っている人はたくさんいたりします。
#次に普及しているメールソフトウェアはデフォルトでHTML形式をつけてくるし。
周囲にいる人たちが、Mail、NetNews、WWW それに Word やPDFな文書を作ることなどなど、それらがいちいち違うことであることを意識しているような人達ばかりな人は幸せだなぁと思います。
# 個人的環境においては、IPメッセンジャーとかいうので1byteカタカナがばしばし飛んでくるのがうっとおしい。
Re:話を混ぜるのはやめよう (スコア:1)
とはいえ、禁止されている訳ではないのも知っているので、仕方ないと割りきっていますが。
だから、「半角カナはインターネットではご法度」という迷信が信じられている方が、個人的には都合が良いです(笑)。
それとは別問題だけれど、等幅フォントで、いわゆる半角文字が、全角文字の半分の文字幅でないものがあるのがイヤ~ンな感じ。
PRE要素で整形しているのに、崩れて見えるなんて……。
げげん、化けているぅ (スコア:1)
(Lynxから見た)previewだと、きちんと投稿できたように見えたのにぃ。
お見苦しくてごめんなさい。
書き込んだ内容は、
うちのメインで使っているのは古いLynx(2.8.1pre8)なので、化けるところは派手に化けること。
とはいえ、webページで1byteカナは使えない訳でないのを知っているので、それは諦めていること。
でも「半角カナはインターネットでご法度」という迷信は、個人的にはありがたい(笑)ということ。
ついでに(話はそれるけれど)、等幅フォントで、いわゆる半角文字が、全角文字の半分ではないフォントは、PRE要素などでイヤ~ンなことになること。
などでした。
……これからは、ここにはOperaで投稿しますね。 (>_<)
Re:げげん、化けているぅ (スコア:1)
1998-10-04 (2.8.1pre.8)
2001-07-17 (2.8.4rel.1)
2002-01-06 (2.8.5dev.7)
…バージョンが上げられない不都合とかでもおありだったのでしょうか…。
Re:げげん、化けているぅ (スコア:1)
ごもっともな疑問ですよね。
実は(私の知る限り)X68000で動作する最新版が、2.8.1pre8ベースなのです。
ごく最近まで、X68000しか持っていなかったものでして……。
Re:話を混ぜるのはやめよう (スコア:0)
「化けるようなプログラムはステ。 」
は、技術的な視点の部分のラストにいれて読んでくだせー
Re:話を混ぜるのはやめよう (スコア:0, 参考になる)
Re:話を混ぜるのはやめよう (スコア:2, すばらしい洞察)
Windowsのメモ帳はISO-2022-JPやEUC-JPに対応していないくせに、IEでソースを表示するときにメモ帳を使うのは間抜けですね。ISO-2022-JPやEUC-JPで書かれたHTMLだと必ず文字化けするわけですから(メモ帳に渡す前にShift_JISに変換するというのならまだわかるが)。Netscape Navigatorはかなり昔からISO-2022-JPやEUC-JPのページのソースをちゃんと表示させることができていました。
MSはメモ帳をISO-2022-JPやEUC-JPに対応させる気はないんだろうな...(sigh)
Re:話を混ぜるのはやめよう (スコア:0)
メモ帳トラッパー [lycos.co.jp]とか言ってもいいですか?(^^;
メモ帳自体は、そのあまりの低機能&使いにくさに辟易するんで、
縁を切ったほうが幸せになるなあ、と思います。
もっと使い
Re:話を混ぜるのはやめよう (スコア:0)
できます。
Re:話を混ぜるのはやめよう (スコア:0, 参考になる)
うちは、いまだにWin9x系だけなので…
とりあえず、S-JIS以外のTEXT文書を見るときには「紙窓」使ってます。