パスワードを忘れた? アカウント作成
312021 journal

maiaの日記: 国民へ発信する重要情報のファイル形式 81

日記 by maia

地方自治情報センターが国民へ発信する重要情報のファイル形式について、全国地方公共団体に注意喚起を行っている。簡潔に引用してみると、

  1. PDFだけではなく、HTML形式(テキスト)のファイルも公開する。
  2. 紙資料のスキャンファイルはPDFではなく、JPEG形式とする。
  3. 表形式データのファイルは、Excel形式ではなく、CSV形式とする。

基本的には大変良い趣旨とは思うが、あまりにも基本的すぎるとは思う(必要な事だが)。CSVの説明はともかく、ワード・エクセル文書をHTML形式で保存する方法として、「ファイル」→「名前を付けて保存」→ファイルの種類にて『Webページ(*.htm,*html)』で保存とあるのが、ちょっと心配である。文章は、h1とpだけで構成してくれてもありがたいかも。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2011年03月29日 22時01分 (#1927501)

    今回身内というか実家が被災した者です。

    そこでここ数週間のやりとりで身にしみたのが、公共・自治体系のサイトで特に災害に関するサイトの携帯用ページが少ないことでした。
    避難している方々はうちの身内含め基本的に携帯電話のみ。スマホがブームとはいえやはりガラケーのシェアは凄いものがあります。充電環境を考えるとノートPCがあったところでどこまで使えるのか微妙な状況です。

    そのような中、非常にありがたいことに都道府県や自治体が公営住宅等をかき集め被災者に無償や手間賃程度で優先的に貸すという話があちらこちらから聞こえてきています。
    が、肝心の応募方法や物件情報がことごとくpdfファイルもしくはPCで見ることを前提としたCMSで構築されたWebサイト上に掲載されています。
    身内から頼まれ様々な住宅提供の情報を伝えていたのですが、詳細が掲載されているページのガラケーでの閲覧は厳しいため結局pdfを印刷し避難先の公民館宛でFAXを送信するというなんだかなーな事態に。

    もっともPC向けサイトが見れるようになるまで携帯が高性能化したのはここ数年ですし、阪神淡路大震災のときはこんな環境が無かったため体勢が整っていないのは仕方ないことなのかもしれません。ただ、今回の件を教訓にして、被災者が閲覧しそうなページは携帯向けの専用ページも作れる準備をして頂ければと思うのです。

    • by old-reggaeman (41728) on 2011年03月30日 13時12分 (#1927803)
      わたしはケータイメーカーの傲慢さや視野狭窄が、今回の事態を招いていると思います。

      そもそもネットが主流だという前提で作らず、裡にこもってイジイジし、
      i-modeみたいに自分らに都合の良い狭い世界を中心にしてサービスを作り上げてきましたし。
      そして見事に世界から後れを取った。

      しかも彼らは、ケータイの本質や役割というものさえ見失ってしまってます。

      だからこう言った未曾有の事態で、ほとんど使い物にならないような移動式端末を生み出したんじゃないかと。
      PDFを読めない端末が多いのもそうです。
      前も書きましたがLTEとかよりも、確実に大勢が繋がる技術や施設建設の方が先だったんじゃないでしょうか。
      それこそがケータイの重要な存在理由ではないのかと。

      それに、通常の使用面でもちっともユーザーのニーズを取り入れずに、ゴテゴテと無駄な機能をてんこ盛り。
      おかげで操作性は複雑で使いづらく、しかも重い。
      まるで大手国内メーカーのPCと同じです。
      NECが国産PCに固執して廃れていったことをまるで学んでいません。

      ケータイに求められている社会的役割も、それにユーザーが求めるものすら見えていない。
      そのくせ売れないときは、「若者の**離れ」「市場の縮小」とかの言い訳ばかり。

      そうやって物事の本質を見ようとせず、表面的なことばかりに執着して誤魔化した結果が、
      今回の使えないガラケー問題に繋がってるんだと思います。

      もっともそういった中身軽視主義は、JPOPや日本製ドラマなどにも多く見られますし、
      他の日本の多くの企業にも言えることかもしれませんけど。
      --
      橋の下からこんにちは
      親コメント
    • by Anonymous Coward on 2011年03月29日 23時44分 (#1927568)

      携帯用サイトが必要なのではなくて、
      シンプルなHTMLで例えばCSSが対応しなくても
      取り敢えず意味が通るように読めるWebページを書けば、
      それで十分な気がします。

      PDFは論外としてもCMSも変なHTMLを吐き出すのが問題なので、
      CMSを使うこと自体は問題ないのではないかと。

      親コメント
  • by maia (16220) on 2011年03月29日 17時51分 (#1927363) 日記

    呼び掛けでは、PDFを否定してはいないが、HTMLでも必ず提供せよ、というのが第一の趣旨。第二は文書のスキャンならPDFではなくJPEGにしろとある。

  • 文字コードは? (スコア:2, すばらしい洞察)

    by Anonymous Coward on 2011年03月29日 0時16分 (#1927088)

    どうせだから文字コードも今から適切に推奨しておいた方が良さそうな気はする。
    混在なんかしない方が良いに決まってる。
    テキストファイルのサポートそのものは大賛成。

    • by tcpp (35642) <i@yvt.jp> on 2011年03月29日 18時36分 (#1927391) ホームページ

      HTMLはShift_JIS, CSVなどのデータはUTF-8でいいと思いますね。
      HTMLを携帯端末で閲覧する場合、一部(もしかしたら大部分の)端末ではShift_JIS外の漢字は表示されません。
      その代わり画像などを使用して外字にすることができます。
      その上、漢字が多い場合Shift_JISのほうが数十%軽くなります。

      一方CSVのようなデータは直接閲覧するというより、この [nexhawks.net]ような検索システムで使用するといった用途で使用するので、可能な限り本来の形を保っていたほうが良いので、UTF-8のようなUnicode系が良いでしょう。
      元のデータが壊れていては大迷惑です。

      ちなみにExcel 2008 for MacはCSVで書き出すとShift_JISになり(変更不可)、Shift_JIS外の漢字はアンダーラインになるようです。
      これは自動更新にexcel2csvを使用し始めたときに気付いたことです。

      親コメント
    • by 127.0.0.1 (33105) on 2011年03月29日 17時47分 (#1927358) 日記
      ExcelでCSV形式で保存すると文字コードがShift_JISなんよね。
      これをUTF-8に変換し直すのが面倒でねぇ。
      最近のバージョン(2010とか)では変わったんかな?
      まあ、わざわざ文字コードを指定するとかしても、
      素人さんには文字コードの変換は無理じゃないですかね。
      親コメント
      • by Anonymous Coward

        UTF-8はコピペできないから勘弁してくれ。
        より多くのクライアントで見られることを考えるなら、Shift_Jisかiso2022-jpでしょう。

        • by Tsann (15931) on 2011年03月30日 9時29分 (#1927677)

          iso-2022-jpのCSVファイルとかおぞましい…

          親コメント
        • by Anonymous Coward

          え?何でコピペできないの?

          より多くのクライアントといっても・・・UTF-8ベースにしてて
          変換ツールを用意しておく方がいいような・・・・

          WindowsXPでもUTF-8って扱えましたよね?

        • by Anonymous Coward

          より多くのクライアントで見ることを考えたらUTF-8か何かじゃないの?
          とりあえずUTF-8が扱えないクライアントを教えてくれ。

          • Re:文字コードは? (スコア:4, おもしろおかしい)

            by Anonymous Coward on 2011年03月29日 21時42分 (#1927487)

            とりあえずUTF-8が扱えないクライアントを教えてくれ。

            うちの上司

            親コメント
  • by Anonymous Coward on 2011年03月29日 17時40分 (#1927352)

    CSV 形式の再利用可能性について触れているのは良いことだと思いますが、
    一緒に情報検証可能性についても触れてほしいところです。
    一次ソースの URL を本文に含めるとか,ハッシュの公開,電子署名など。

  • タイトル違わないか? (スコア:2, すばらしい洞察)

    by Namany (19002) on 2011年03月29日 17時50分 (#1927361) 日記

    HTML・JPEG・CSV推奨で、PDFは非推奨という趣旨ではないか?

    #個人的に白黒文書をJPEGというのは許し難いんだけど。

    • by Anonymous Coward on 2011年03月29日 17時55分 (#1927367)

      これは編集の問題。
      掲載前「国民へ発信する重要情報のファイル形式」
      掲載後「国民へ発信する重要情報はHTMLとPDF形式で」

      親コメント
    • by SAW_Z (15894) on 2011年03月29日 23時44分 (#1927567) 日記
      紙の文書をスキャンしたものなら、PDFではなくJPEG…

      これは、スキャンからPDF化する過程での文字化けを忌避したものでない?
      実際の精度は知らんけど、電子的な原稿からPDF化するなら
      実質文字化けの問題は無いだろうから、そっちはPDFでもいいか。みたいな?

      ピリオドとコンマと読点、あるいは濁音記号とダブルクォーテーション。
      こんなつまんないスキャンミス、校正するのも大変じゃん。

      言い換えれば、いつかどこかで電子文書化することもあるなら
      最初から電子文書としての公開もあってしかるべき…
      そこに、PDFもいいけどHTMLのほうが良いってことになるのかな。

      これHTMLの汎用性というのもあるけど…
      Android端末でもPDFが読めるとは言っても
      480x320で読める文字サイズでA4のPDFを表示したら
      実用的なものにはならないのよね。

      世の中にはPDFと同じようにHTMLをスクロール強要で見る携帯電話もあるらしいけど
      普通にHTMLはHTMLらしく、画面枠に合せて改行してもらえるほうがシアワセ。

      #余談も余談、Jコミ新ビューワーで、セリフ数百文字を入力した
      #二点リーダーにすべきなのかなぁ…とか思いながら(^_^;
      #いやほんと最初から電子原稿のある小説はいいなぁと思った。
      親コメント
  • by Anonymous Coward on 2011年03月29日 18時10分 (#1927376)

    なんかFAXで来たやつをスキャンしたようなPDFが表示されてゲンナリした記憶がある。
    それこそテキストにしろよってレベルだった。

    東電の輪番停電のやつも最初はそんなかんじだったなぁ…

  • 雇ってください (スコア:2, おもしろおかしい)

    by Anonymous Coward on 2011年03月29日 18時41分 (#1927396)

    上からエクセル、PDFで回ってきた重要な情報をテキスト、htmlに整形してアップロードするだけの簡単なお仕事ならやってあげますから雇ってください

  • by Anonymous Coward on 2011年03月29日 18時15分 (#1927378)

    フォントが埋め込まれていないPDFだと、読めないケースが出てくるのが困るのだけど。
    とある端末でPDFファイル開いたら白紙だったので困った事がありました。

  • プレーンテキストで保存できるものは全てそのようにしていただきたい

    文字エンコード?ハッ!洒落臭い
    画像?日本が世界に誇るアスキーアートがあるではございませんか

    --
    光の速さで歩けは無茶だ!せめて走らせろ!
  • by Anonymous Coward on 2011年03月29日 17時44分 (#1927355)

    > 「ファイル」→「名前を付けて保存」→ファイルの種類にて『Webページ(*.htm,*html)』で保存とあるのが、ちょっと心配である。

    何を心配しているのか知らんけど、もし単にExcelやWordでの保存が読みづらいHTMLを生成するというなら、それはMSに言うべきところで、利用者が手間をかけるものじゃ本来ないと思います。

    • Re:保存形式 (スコア:2, 参考になる)

      by Egtra (38265) on 2011年03月29日 19時00分 (#1927406)

      せめて、Office固有の情報をばっさり切り落とす『Webページ(フィルタ後)』のほうであれば少しはましなのですけどね(Wordのみ、2002以降): フィルタ後の HTML の使用について [microsoft.com]。もっとも、(X)HTML以外(XML名前空間を明示)で書き込んでいるOffice/Word固有の情報を落とすだけなので、フィルタ後でもHTMLとしては相変わらずの出来です。

      ただし、Wordに関しては「見出し1」〜「見出し6」をh1〜h6へ対応付けるなどそこそこまともな面もあるので、製作者の力量次第で(おぞましいCSSの山を除けば)そこそこまともなHTMLにすることも不可能ではありません。

      親コメント
    • by Anonymous Coward

      古くて新しい問題というところか(ちっとも解決されて来なかった)。この際、MSはどうでもいい。

      この呼び掛けで、WordやExcelでのHTML保存を案内するのは、不適切だろう。容量が異常に肥大するだけでなく、ブラウザが四苦八苦する可能性もある。

  • by Anonymous Coward on 2011年03月29日 18時04分 (#1927373)
    と言ったら後出しジャンケンですか
  • by Anonymous Coward on 2011年03月29日 18時04分 (#1927374)

    本当になぜPDFなのか?というファイルが多すぎる。
    緊急時にAcrobatReaderかGoogleChromeかそれに類するモノをDownloadして見てる余裕はないし
    オンラインであってもGoogleDocumentViewはrobot避けに該当するのか見れない場合も多い気がする。
    またPDFの内容にあってはただの文章をスキャンした画像といったことも多く、データの再利用もできない事も。
    #どう見ても上記文章はPCで作成したデジタルデータがあるように思えてならなかったりするのだが…

    #新人の頃、お客さんにインストール手順書なんかWordで書いてもいいけど、
    #どこでも見れるようにtxtファイル版を用意しておけって言われたなぁ。

    • by Anonymous Coward

      PDFにテキスト情報が入っているファイルは、Googleとかでとりあえず見られるので以前ほどは困らなくなったと思います。
      「テキストでそのまま載せればいいのに」というのは時折見かけるけど。
      画像をスキャンしてPDF化→そのまま掲載ってのもあるけど、HTMLに変換する手間とかで見送られるよりはいいです。
      (バスの時刻表とか)

      だがFlash、てめーはダメだ。

      # SolarisのサポートサイトがOracleに移管したらFlashページになった
      # 「Q.会社のポリシーでFlashを禁止しています」「A.ポリシーを変えてください」とかどうかと・・・

      • Re:なぜPDF? (スコア:1, おもしろおかしい)

        by Anonymous Coward on 2011年03月29日 23時14分 (#1927554)

        ># SolarisのサポートサイトがOracleに移管したらFlashページになった
        ># 「Q.会社のポリシーでFlashを禁止しています」「A.ポリシーを変えてください」とかどうかと・・・

        Oracleなんて、エラーコード増やしまくって電話帳ぐらいにして出版してその印税だけでくらすようになれ!

        親コメント
  • by Anonymous Coward on 2011年03月29日 21時01分 (#1927466)

    紙の資料をスキャンして渡されるなら、JPEGでばらばらになってるよりPDFの方がマシなイメージがあったんだけど・・・世の中そうでもないの?
    特定の会社のリーダーがないと読めないようなフォーマット使うな!って意味?
    そうは言っても、最近はスマートフォンでも何でもPDFぐらい読めると思うのだけど。
    OCRソフトなりで透明テキスト付きになっていればなお良し!

    # PDFよりJPEGを推進した人は、不祥事のお詫び文がJPEGでアップされていても、検索エンジン逃れだ!と非難しないようにw

typodupeerror

物事のやり方は一つではない -- Perlな人

読み込み中...