パスワードを忘れた? アカウント作成
5131 story

国内の航空管制が一時全停止 138

ストーリー by Oliver
3台で多数決を 部門より

kamuy 曰く、 "本日の朝方(2003/03/01 07:10~07:30?)、埼玉にあるという国内の全ての航空管制を司る制御コンピュータが停止したことにより、一時全ての航空機が離陸出来なくなるというトラブルが発生したとのこと。(幾つもソースはあるでしょうが、取り敢えず読売新聞)。テレビなどのニュースから聞こえてくるのは「二系統あるコンピュータシステムが、二系統共に同時にダウンしたらしい」「本日未明、当該システムの一部に変更を実施したらしい」というハナシで、どうもエンバグしたような感じです。
バグ混入というのも何ともお粗末なハナシではありますが、せっかく二系統あるのにその両方を同時に書き替えてしまったこととか、そもそも、今の日本の過密なスケジュールが、たった一カ所にしかない、たかだか二系統のシステムによって運用されていたという事実に、ビックリしてしまいました。
/.J的に、そもそもどのような構成にするべきか、また、今後はどのように対策していくべきか、意見など戦わせてみてはいかがでしょうか?"

毎日新聞の記事のほうがもうちょっと詳しい。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by bugbird (4706) on 2003年03月01日 21時50分 (#270467) ホームページ 日記

    ACC の中のひとたちの対応はかなり素晴らしいものであった んじゃないでしょうか。電話連絡による飛行計画書データの 伝達とか、飛行間隔の変更による安全性の確保とか、いくつ かの回避策を非常にスムーズに実施して、システムダウンから 20 分後には制約付きとはいえ離陸の再開に至っているわけで。 また障害情報も適宜に公開されていたと思います。

    迷惑をこうむった方々は腹にすえかねるものもあるでしょう が、人命にかかわるレベルの問題でこれだけの危機管理が 手際良くなされたことは、最近珍しいことではないかと。

    <ぼそ>
    それくらい、最近は情けない話が多いと云うことか?
    </ぼそ>

    …だからといって、事故調査が甘くなってはこまりますけど ね。墜落事故相当の厳しい調査がされて欲しいですね。

    --
    --- Toshiboumi bugbird Ohta
  • by teltel (1423) on 2003年03月01日 17時05分 (#270306) 日記
    ぐぐってみたら、国交省の
    こんな [mlit.go.jp] ページがみっかった。

    だれか写真からメーカーが解ったりしないのかな。
    # 知合いはSE やってて管制装置の部門にいるが、これの原因じゃないよなあ。
  • by morio (7583) on 2003年03月01日 17時19分 (#270311)
    97年の東京証券取引所システムダウン [kaigisho.ne.jp]を思い出します。
    あの時も二系統とも同じシステムだったので、不正なデータ混入などソフト的な障害には対応できなかったような。

    ハードウェア障害の対策として同じタイプを複数系統用意するってのはよく聞きますが、
    ソフトウェア障害(って言い方でよいのか?)対策として、別種の系を用意してるとこってどんなところがあるんでしょうか?
  • by kamuy (1690) on 2003年03月01日 19時27分 (#270383) ホームページ 日記
    今NHKのニュースでやってた解説だと、

    ・自衛隊(防衛庁?)との連携のためにシステムの一部を書き替えた。
    ・このシステムの書き換えは、主・副の両方を同時に実施しなくてはならない設計であった。
    ・システム書き替え後、0700から始まる「統計プログラム」なるバッチ処理(?)の開始と共にダウンした。
    ・システムダウン後、旧来のシステムに書き戻したところ正常に復旧した。

    ってコトのようで、思いっきりソフト的な障害のようですね。

    新しいシステムに問題があったのか、「統計プログラム」ってのに潜んでいたバグが顕在化したのかは分かりませんが、主・副を同時に変更するしかないシステム設計なんてーアホっぽいところに問題があるような気がします。
    (あー、私は素人ですので、「そんなこたぁーない」のかもしれませんし、「現場ではそんなこと言ってられない」ってコトがあるかもしれませんが…)
    --
    -+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
    • Re:NHKでやってた解説 (スコア:1, すばらしい洞察)

      by Anonymous Coward on 2003年03月01日 19時54分 (#270392)
      > 主・副を同時に変更するしかないシステム設計なんてーアホっぽいところに
      > 問題があるような気が

      ところが実際やってみると、結構難しいわけで。

      例えば外部 (自衛隊) とのインタフェースはファイルで行っていると
      しましょう。今回、流通する項目を 1つ増やしたとしましょう。
      で、正は項目追加に対応したと。副は正が落ちたときに備えて
      修正しないと。

      さー、正が落ちました。どうしましょう。

      副でファイルを取り込もうとしても、こっちはインタフェースが
      違うので取り込めません。自衛隊に古い形式で送ってもらう?

      それなら当然自衛隊側も新インタフェースと旧インタフェース
      の両方を送れるように準備しておかなくてはいけません。
      これで手間が 2倍。

      また、単純にシステムが A、B、C の機能を持っていて、今回 A'、B'、C' に
      機能強化したとします。A' がこけたら A に戻せるようにした場合、A、B'、C'
      という組合せになります。その組合せで動くかどうかテストをやって
      おかなければならない。

      でも事前にどこがこけるかなんてわからないから、A+B'+C'、A'+B+C'、
      A'+B'+C、A+B+C'、A+B'+C、A'+B+C のテストもやっておかないと。
      当然正常に移行できた場合の A'+B'+C' もやっておく必要があります。

      それができないなら全体を戻す (A+B+C にする) わけですが、
      同時に自衛隊側のシステムも戻さないといけない。多分他にも
      連係しているシステムはたくさんあるでしょうし、自衛隊の方に
      関連しているシステムでも元に戻さないと。そして元に戻すのに
      一体何時間かかることやら。

      そのまま復旧作業を続けた方が早いなんてことになるかも。
      親コメント
    • by int20 (12391) on 2003年03月01日 19時59分 (#270398) 日記
      補足ですが、
      0700から始まる「統計プログラム」なるバッチ処理(?)の開始と共にダウンした。
      これは午前7時のことですね。時刻表ライクな書き方ですね。
      親コメント
    • by knn (11810) on 2003年03月02日 15時36分 (#270928) 日記
      http://www.mainichi.co.jp/news/flash/shakai/20030302k0000m040124000c.html より:

       更新したプログラムは、防衛庁から受け取った自衛隊機の飛行計画を処理する。防衛庁側が先月、このデータ送信のプログラムを変更したため、国交省もFDP用の新たなプログラムを開発。1日午前1時から、2台のFDPともにプログラム変更を行った。相性の悪さを指摘されたのは、前日の午前0時から丸一日分の全国の飛行履歴を自動的に集計する「オンライン統計処理プログラム」。1日も定時の午前7時にこのプログラムが自動的に起動したところ、突然2台のFDPとも全体がダウンした。
       自衛隊機用のプログラムは今年2月1~16日、東京ACCと同条件のFDPが設置されているシステム開発評価・危機管理センターでテストが行われ、問題点は発見されなかったという。しかし同省によると、FDPを24時間稼働させたテストは行われていない。統計処理プログラムとの相性チェックが行われなかった可能性もある。


      この話のとおりだったら、テスト不足と言うより、変更が影響する範囲をそもそも見誤っていた (本来なら統計処理プログラムも変更しなければいけないのに気づいていなかった、ゆえにテストからも除外されていた) って感じでしょうか。
      親コメント
  • by hamukichi (5525) on 2003年03月01日 17時38分 (#270321)
    修正したんだか不明だけど、テストしなかったんだろうか

    まさかテスト機に修正版をいれたつもりが本番機にいれちゃったとかいう落ちじゃないよな?
    • Re:どこのどいつが (スコア:1, すばらしい洞察)

      by Anonymous Coward on 2003年03月01日 18時23分 (#270349)
       テストを「した」かどうかなんて意味がありませんが。
       しててもトラブルが出るときは出る。

       結局は、どうゆうテストをしたか。
       または、どうゆうテストしか出来なかったか。

       いくらテストしたって不充分な方法なら意味が無い。
       システム的な条件で、完璧なテストが出来ない場合だって有る。
      親コメント
  • by plup (14187) on 2003年03月01日 18時08分 (#270337)
    直接は関係ないのですが・・・

    友人が羽田で悪戦苦闘(今日、ANAで千歳行き)
    そこで、国内線運行状況をのぞいてみたら
    エラーばっかし・・・問い合わせが殺到しているの
    かしらん。
    ちなみに、JALは表示されるのですが全便遅れておりますの
    表示だけでした。欠航便が表示されるだけかなりましかと
    思いますが。
    --
    ******* plup "fiction" ********
  • by ktd (12836) on 2003年03月01日 18時33分 (#270353) 日記
    私の友達が、今日卒業旅行に行こうとして、引っかかったらしい。
    今の時期は1万円で乗り放題だしね~
    卒業旅行シーズンだしね~

    このような目に遭遇した人も多いのでは?
    • by tm-hal (5482) on 2003年03月01日 20時38分 (#270428) 日記
      北九州に出張していて、福岡空港で引っかかりました。
      行先と航空会社によっては最大3時間の遅れと言ってましたが、私が乗ったJAL福岡-->羽田は40分+チェックインした乗客の乗り遅れで40分の計80分の遅れですみました。

      空港ロビーでNHKニュースを見て詳細(?)を知りましたが、某所に収めた製品の不具合対策で出張していた身としては、他人事ではないとゾッとしました。

      # 昨日いきなり現地から呼び出されて出張したけどID
      --
      ----tm-hal-----
      我々はM$だ
      お前達の知識と技術を吸収し、お前達の企業を買収する
      抵抗は無意味だ
      親コメント
    • 福岡-東京を日帰りする必要があって
      朝一(7:10発)にのって最終(20:10発:いずれもスカイマーク)に乗りましたが。。。
      離陸直前に、飛行機内にアナウンスが流れ、私は「あー、『お客様のお呼び出し』とかかなー」と思ったら、「7:05に、管制塔のプログラムが全国的にダウン」と言われて、思わず笑っちゃいました。
      その後、30分ほど経っても復旧しなかったので「携帯を使っても構いません」のアナウンス。これで本当に見通しが立たない重大な出来事が起こったんだな、と感じました。

      帰りの羽田は年末年始のような感じでした。ダイヤはむちゃくちゃ、ころころ搭乗口が変わっていましたし、払い戻しなども列が出来てました。

      余談ですが、帰りの羽田に向かう途中、山手線の人身事故に遭遇してしまいました。

      きっと、今日、私が東京に行ったことが原因なんだろう、と思います。みなさん、すいません。
      親コメント
    • by Crisp (10852) on 2003年03月02日 2時11分 (#270674)

      今の時期は1万円で乗り放題だしね~

      3月1日のANA一日乗り放題 [ana.co.jp]ですね。私は飛行機ヲタなので今日は一日乗り放題を使って東京→熊本を往復(行って、同じ飛行機で帰ってくる)したのですが、定刻の4時間遅れで大変でした。
      私は単に同じ飛行機で帰ってくるだけだったのでそれほど問題なかったのですが、一日乗り放題を活用しようと複雑な乗り継ぎプランを立てていた人は大変だったようです。また、そうした複雑な乗り方をする人の応対をする航空会社の係員もかなり大変そうでした。ANAは非常に運が悪いとしかいいようがないですね。明日移行の機体のやりくりもあるし、今頃徹夜でプランを立ててる人たちもいるんでしょうね。

      ところで今日の遅延ですが、朝のトラブルに加えて、乗客の搭乗口への集まりが悪いということも遅延を増大させる要因になっていたように思います。というのも、普段ならば皆出発時刻を確認してそれを目安にゲートに集まるものですが、今日は一体いつ出発するのか見当がつかないという状況で、どこかに行っていてなかなか搭乗口に現れない人が多く、出発がさらに遅れていたという感触です。
      電光掲示板の内容が実際と食い違っているなど、あちこちに混乱が見られたので、ああいう状況でいかに乗客に正確な情報を素早く提示できるか、というのが重要だなと思った次第です。
      親コメント
  • サティアンの製品か?

    # 一時期政府向けシステムも開発してましたよね、あそこは。
    # 納入先は富士通だったかな。
    --
    -- ラテール部参加者募集中
  • 件の問題に関し確認してみます。
    • by tower (3118) <{kimoto} {at} {pop06.odn.ne.jp}> on 2003年03月02日 17時22分 (#270985) 日記
      航空業界に籍を置くモノとしての色々確認してみました
      毎日新聞の記事ですが比較的ここ [mainichi.co.jp] が的を得ていると思います。

      実は今後の調査結果を確認しなければ解りませんが、
      定時処理と新プログラムの相性を確認しなかった可能性
      等を指摘しています。

      通常空港で管制卓に便名を表示させるARTSと言うシステム等は
      バージョンアップ時などは両系に違うバージョンがインストールされ
      新バージョンがこければ、瞬時に稼働実績のある旧バージョンに
      切り戻す事が出来るようになっています。

      今回のFDPシステムの2重化は両系ともに同じシステムを
      走らせ2つの処理結果のマッチングを持って信頼性を
      保つようなシステムになっているそうです。

      その為片系がこけたからと言って瞬時に切り替える事は
      出来なかったかもしれません。
      しかしFDPはバージョンアップの際に旧バージョンを
      保持する事が出来る設計になっているようなので
      障害発生時に一刻も早く切り戻す事が出来れば
      被害を最小限に食い止める事が出来たかもしれません・・

      当然我々はミスのない作業を目指します。
      しかし本当に必要なのはお客様に迷惑をかけない事。
      今回のようにシステムの設計変更などトラブルが
      発生する可能性のある場合、不測の事態が発生した時
      如何に短時間で運用を再開させる事が出来るか、
      そこに基本があるような気がします。

      実際私は某空港で管制卓のキーアサインの全面変更などを
      仕切った経験もその作業が途中でトラブった経験もあります。
      その時は確かに真っ青になりました。

      しかし我々に求められるのはただ震えてるだけの
      無能な指揮官ではありません定められたバックオンリミット
      までにリトライするか現状に復旧させるかの判断なのです。
      動くモノを利用者に提供するそれが私たちの仕事なのですから。
      (こんな事を書くとあの時一緒に戦ってくれた仲間たちに
      何を偉そうに(笑)と頭を叩かれそうですが・・)

      実際私の知り合いの奥さんが実家への帰省の際に
      今回の事件に巻き込まれました。

      私も一日遅ければ同様に東京から帰れず巻き込まれて いました・・・

      業界人として、1ユーザーとして他人事では有りません。
      親コメント
  • by Namo (14104) on 2003年03月01日 17時02分 (#270304) 日記
    おーーい。 /.Jの人々ご苦労様です。(泣き)
typodupeerror

弘法筆を選ばず、アレゲはキーボードを選ぶ -- アレゲ研究家

読み込み中...