アカウント名:
パスワード:
取り扱う文書が全部 UTF-8 になって苦労がないのになぁ。
ファイル名もUTF-8にしてほしいでありんす。LinuxもMacもUTF-8なのにシェア多数のWindowsだけがSJISなせいで圧縮ファイルのやりとり面倒。MacでUTF-8で書いたテキストファイルもWindowsの知り合いのマシンじゃ文字化けと文句言われる。ほんとWindowsさんもうそろそろ勘弁してほしい。
Appleも思いきって(APFSに)ファイルシステム変えるまで強引にしてきたし、Windowsさんも文字コード変えちゃいましょうよ。
OneDriveと圧縮(Zip形式)フォルダーで違うことするのをやめるくらいはできるだろ
文字コード変換にOS自体がSJISの都合を交えるからワヤくちゃになってんよ「・」「·」が一番わかり易い。
実は MSYS2 を使うと Shift_JIS ファイル名の問題の大部分が解決するのではと思っている。
ファイル名は NTFS の UTF-16 ファイル名を UTF-8 に変換して扱っているので Unicode → Shift_JIS 変換の非互換にまつわる問題に悩まされることもない。
zip ファイルは MSYS2 の zip/unzip が UTF-8 ファイル名を扱える…が、逆に Shift_JIS な zip ファイルがちゃんと扱えなかった。
UTF8同士でも化けるのよねhttp://macwiki.osdn.jp/wiki/index.php/UTF-8-MAC [macwiki.osdn.jp]
世界中から殺到するであろうゴカンセイガーという苦情に対してお前がMSに代わって半永久的に無料で24時間サポートするんならやってくれるよ、多分
使ってる圧縮ツールの問題ですよね。Windows上のアーカイバって、メジャーなものはエンコードは選択できるのが普通。WinRar/WinZip あたりは、デフォルトエンコードも UTF-8 、7zip は、オプション指定が必要ですけどね。
まぁ UTF-8 に統一されても MacはUTF-8を名乗ってても UTF-8-MACのことでUTF-8ではないので、問題は解決しませんが。
Windows自体(エクスプローラ)にも圧縮機能があってですね…。しっかりSHIFT_JISになってるようです。(Windows7では)じゃあそれに含まれない文字のファイル名なファイルを圧縮…できない模様。
おまけ機能で、他の古い非Unicode対応環境(=Windows 7)が残ってる間は難しいかも。ちなみにWin8以降なら解凍はデフォルトでちゃんとできます。Windows7でもパッチを適用すればOK [microsoft.com]
棺桶に片足突っ込んでるWiny7何て使ってるからだろwせめて8.1ぐらい使っとけよ
8.1でもUTF-8なZIPの展開はできるが、作成はできないと聞いたけどなあ。10はできるの?誰かオセーテ。
WSHとかシェル(コマンドプロンプト)のリダイレクトとか。
メモ帳でBOMありUTF-8しか作れないの何とかして欲しい。
逆だろunixがBOM付きUTF-8をサポートするのが正解
https://twitter.com/aetos382/status/670084294631649280 [twitter.com]
ASCII で書かれたものがそのまま変換の必要なしに UTF-8 として扱えるのが、数ある Unicode のエンコード方式の 中での UTF-8 のメリットなのに、わざわざ BOM を付けて ASCII でなくせという主張が通るわけがない。
あと、 UNIX が BOM 付き UTF-8 を "サポートしていない" というより、"ZERO WIDTH NO-BREAK SPACE として扱っている" と考えるのが妥当だと思う。
わざわざ BOM を付けて ASCII でなくせという主張が通るわけがない。
そうじゃないでしょ。リーダーはBOMが付いてても付いて無くても解釈できるべき。書く側はどっちでもいい。
でも非対応と明示するならそれもいいと思う。それが仕様なら仕様外のものを食わせる人間が悪い。
バッチファイルが BOM 付き UTF-8 をサポートしたら考えてやっても良い :-p
今どきバッチファイル(笑)「さっさとPowerShellに移行しろ」で終わる話だな
BOMを付ければいいじゃない
Windows における正式なテキストファイルはメモ帳で保存できる下記の形式だけってことなんでしょうね。
・ANSI (CP932)・Unicode (UTF-16 little endian BOM 付)・Unicode big endian (UTF-16 big endian BOM 付)・UTF-8 (BOM 付)
The Unicode Standard, Version 5.0Use of a BOM is neither required nor recommended for UTF-8
BOMがあっても誤りではないが、推奨ではない。
ところが最近は下記のような文章が追加されてたり。 (最新の 10.0 から引用)
, but may be encountered in contexts where UTF-8 data is converted from other encoding forms that use a BOM or where the BOM is used as a UTF-8 signature.
ざっくり訳すと、他の BOM 付のエンコードから変換された場合や、 UTF-8 であることを示すシグネチャとして使われる場合に見られるということで、まさに Windows が BOM を UTF-8 の判別に使っているのを追認するような形。
で、そのすぐ後の表でも UTF-8 の "BOM Allowed?" が yes になってる。
いやいやUTF-8にバイトオーダーは(1つしか)無いんだからBOMを付ける事自体無意味でしょBOMはエンコードを区別するための印じゃないよ?
ストレージのことをROMと呼ぶ [hardware.srad.jp]のと同じようなものだろ名前と実態が乖離してるってだけ
BOMを付けてほしくないならUTF-8と他のエンコーディングを区別できるような方法を提案してくれ
>BOMを付けてほしくないならUTF-8と他のエンコーディングを区別できるような方法を提案してくれ
美乳とか書いとけばいいんじゃね?
# UTF-8 だと † が良いらしい。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ナニゲにアレゲなのは、ナニゲなアレゲ -- アレゲ研究家
日本語 Windows の標準が UTF-8 なら (スコア:0)
取り扱う文書が全部 UTF-8 になって苦労がないのになぁ。
Re: (スコア:0)
もう何年もエロげのREADME以外でSJISのテキストは見たことないよ
Re:日本語 Windows の標準が UTF-8 なら (スコア:1)
ファイル名もUTF-8にしてほしいでありんす。
LinuxもMacもUTF-8なのにシェア多数のWindowsだけがSJISなせいで圧縮ファイルのやりとり面倒。
MacでUTF-8で書いたテキストファイルもWindowsの知り合いのマシンじゃ文字化けと文句言われる。
ほんとWindowsさんもうそろそろ勘弁してほしい。
Appleも思いきって(APFSに)ファイルシステム変えるまで強引にしてきたし、Windowsさんも文字コード変えちゃいましょうよ。
Re:日本語 Windows の標準が UTF-8 なら (スコア:1)
圧縮ファイルっていうところからzipの問題だと思いますが、フォーマット自体の問題もありますが、世の中に出回っている圧縮展開ソフトの実装がクソすぎるのでどうにもならないでしょう。zipは捨てて7zにしよう。
Re: (スコア:0)
OneDriveと圧縮(Zip形式)フォルダーで違うことするのをやめるくらいはできるだろ
Re: (スコア:0)
文字コード変換にOS自体がSJISの都合を交えるからワヤくちゃになってんよ
「・」「·」が一番わかり易い。
Re: (スコア:0)
実は MSYS2 を使うと Shift_JIS ファイル名の問題の大部分が解決するのではと思っている。
ファイル名は NTFS の UTF-16 ファイル名を UTF-8 に変換して扱っているので Unicode → Shift_JIS 変換の非互換にまつわる問題に悩まされることもない。
zip ファイルは MSYS2 の zip/unzip が UTF-8 ファイル名を扱える…が、逆に Shift_JIS な zip ファイルがちゃんと扱えなかった。
Re: (スコア:0)
UTF8同士でも化けるのよね
http://macwiki.osdn.jp/wiki/index.php/UTF-8-MAC [macwiki.osdn.jp]
Re: (スコア:0)
世界中から殺到するであろうゴカンセイガーという苦情に対して
お前がMSに代わって半永久的に無料で24時間サポートするんならやってくれるよ、多分
Re: (スコア:0)
使ってる圧縮ツールの問題ですよね。
Windows上のアーカイバって、メジャーなものはエンコードは選択できるのが普通。
WinRar/WinZip あたりは、デフォルトエンコードも UTF-8 、7zip は、オプション指定が必要ですけどね。
まぁ UTF-8 に統一されても MacはUTF-8を名乗ってても UTF-8-MACのことでUTF-8ではないので、問題は解決しませんが。
Re: (スコア:0)
Windows自体(エクスプローラ)にも圧縮機能があってですね…。
しっかりSHIFT_JISになってるようです。(Windows7では)
じゃあそれに含まれない文字のファイル名なファイルを圧縮…できない模様。
Re:日本語 Windows の標準が UTF-8 なら (スコア:1)
Re: (スコア:0)
おまけ機能で、他の古い非Unicode対応環境(=Windows 7)が残ってる間は難しいかも。
ちなみにWin8以降なら解凍はデフォルトでちゃんとできます。
Windows7でもパッチを適用すればOK [microsoft.com]
Re: (スコア:0)
棺桶に片足突っ込んでるWiny7何て使ってるからだろw
せめて8.1ぐらい使っとけよ
Re: (スコア:0)
8.1でもUTF-8なZIPの展開はできるが、作成はできないと聞いたけどなあ。
10はできるの?誰かオセーテ。
Re: (スコア:0)
WSHとかシェル(コマンドプロンプト)のリダイレクトとか。
Re: (スコア:0)
メモ帳でBOMありUTF-8しか作れないの何とかして欲しい。
Re: (スコア:0)
逆だろ
unixがBOM付きUTF-8をサポートするのが正解
https://twitter.com/aetos382/status/670084294631649280 [twitter.com]
Re:日本語 Windows の標準が UTF-8 なら (スコア:1)
ASCII で書かれたものがそのまま変換の必要なしに UTF-8 として
扱えるのが、数ある Unicode のエンコード方式の 中での UTF-8 の
メリットなのに、わざわざ BOM を付けて ASCII でなくせという
主張が通るわけがない。
あと、 UNIX が BOM 付き UTF-8 を "サポートしていない" というより、
"ZERO WIDTH NO-BREAK SPACE として扱っている" と考えるのが
妥当だと思う。
Re: (スコア:0)
わざわざ BOM を付けて ASCII でなくせという主張が通るわけがない。
そうじゃないでしょ。
リーダーはBOMが付いてても付いて無くても解釈できるべき。書く側はどっちでもいい。
でも非対応と明示するならそれもいいと思う。それが仕様なら仕様外のものを食わせる人間が悪い。
Re:日本語 Windows の標準が UTF-8 なら (スコア:1)
バッチファイルが BOM 付き UTF-8 をサポートしたら考えてやっても良い :-p
Re: (スコア:0)
Re: (スコア:0)
今どきバッチファイル(笑)
「さっさとPowerShellに移行しろ」で終わる話だな
Re: (スコア:0)
設計者は頭おかしいよね
Re: (スコア:0)
BOMを付ければいいじゃない
Re: (スコア:0)
Windows における正式なテキストファイルはメモ帳で保存できる下記の形式だけってことなんでしょうね。
・ANSI (CP932)
・Unicode (UTF-16 little endian BOM 付)
・Unicode big endian (UTF-16 big endian BOM 付)
・UTF-8 (BOM 付)
Re: (スコア:0)
The Unicode Standard, Version 5.0
Use of a BOM is neither required nor recommended for UTF-8
BOMがあっても誤りではないが、推奨ではない。
Re:日本語 Windows の標準が UTF-8 なら (スコア:1)
ところが最近は下記のような文章が追加されてたり。 (最新の 10.0 から引用)
ざっくり訳すと、他の BOM 付のエンコードから変換された場合や、 UTF-8 であることを示すシグネチャとして使われる場合に見られるということで、まさに Windows が BOM を UTF-8 の判別に使っているのを追認するような形。
で、そのすぐ後の表でも UTF-8 の "BOM Allowed?" が yes になってる。
Re: (スコア:0)
いやいやUTF-8にバイトオーダーは(1つしか)無いんだから
BOMを付ける事自体無意味でしょ
BOMはエンコードを区別するための印じゃないよ?
Re: (スコア:0)
ストレージのことをROMと呼ぶ [hardware.srad.jp]のと同じようなものだろ
名前と実態が乖離してるってだけ
BOMを付けてほしくないならUTF-8と他のエンコーディングを区別できるような方法を提案してくれ
Re: (スコア:0)
>BOMを付けてほしくないならUTF-8と他のエンコーディングを区別できるような方法を提案してくれ
美乳とか書いとけばいいんじゃね?
# UTF-8 だと † が良いらしい。