パスワードを忘れた? アカウント作成
2216601 story
Oracle

「さくらのクラウド」障害多発で当面無償化 62

ストーリー by hylom
せっかくのデータセンターが 部門より
あるAnonymous Coward 曰く、

年末のトラブルが/.Jでも話題となったIaaS型クラウドサービス「さくらのクラウド」だが、その後も頻発するトラブルが解決できず、当面の間は利用料を無償化することが発表された(プレスリリース)。

これまでの経緯についてはGIGAZINEの記事が詳しくまとめているが、ストレージ周りを原因とするサーバーダウンやパフォーマンス低下が毎月のように発生しており、根本的な解決に至っていないのが読み取れる。プレスリリースによると、ストレージメーカーとともに問題解決に向けて対応中としつつも、いまだ「現状は完全な解決の目処をご案内する事ができません」という状態のようだ。また「根本的に設計を見直した新たな環境の構築を平行して進めており」というコメントからも、問題の根が深いことが伺える。

なお、さくらのクラウドが使用しているストレージ基盤は、サービス開始時のアナウンスによるとOracleの「Sun ZFS Storage Appliance」だという。4/5のOracle OpenWorld Tokyo 2012では「さくらインターネットのクラウドを支えるSun ZFS Storage Appliance:5つの選定理由」というセッションが予定されており、なんとも皮肉な状況となってしまっている。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2012年03月23日 21時47分 (#2122367)

    サービスの継続に暗雲が垂れ込めてきましたね(クラウドだけに)
    解決への光明が見えるといいですね(Sunだけに)

  • by Anonymous Coward on 2012年03月23日 21時10分 (#2122346)
  • by deleted user (13014) on 2012年03月24日 22時41分 (#2122952)

    Google App Engine を使うのが、おそらくは大半の用途で最高の選択肢となるのでしょうね。バックエンドのについてのディープな知見を持たない者は、Google が定義したベストプラクティスに乗っからせてもらうのが、謙虚な姿勢というものかもしれません。

  • by Anonymous Coward on 2012年03月23日 23時10分 (#2122427)

    エンジニアは殆ど全てが東京からリモートで、データセンターは北海道の石狩にあって
    数名しかいないと書かれていたけど、障害起きてリモートで復旧しない問題が起きた場合
    伝言ゲームになって復旧が遅れそう。運用体制にも問題があるの。

    • by Anonymous Coward

      ITとは人の仕事を減らす技術なんだから人間にできる仕事を機械にやらせる奴はクビにするとかの不断の努力を怠っていたら仕事が増えるほうがおかしい。

      • で、データセンターでの(手動での)復旧作業というのは「機械にできない仕事」なので、
        地元に住んでるサーバー管理者は依然として必用でしょうよ。

        親コメント
        • by Daichi_K (3005) on 2012年03月24日 9時33分 (#2122570) 日記

          地元の人間から見ると、道と石狩市はまんまとのせられた気がするなぁ。
          石狩市(と札幌市)は、地元雇用の増大とか地域活性化とか見込んでいたようですが、データセンター程度じゃそんなもん増えるわけ無いだろ。
          スタッフだって基本本社から出向/出張だろうし。

          地元では冷めた目が増えた気がします。所詮は・・・。

          P.S. 親が入院したのでOSの解析やる余裕がなくなりました。

          親コメント
        • 今のサーバって大抵リモートコンソール(HPで言うとiLO、Dellで言うとDRACとか)が
          ついてるから、BIOSやRAIDの設定変更、OSインストールなんかまでリモートでできるよ。

          現地でのサーバの設置、ケーブルの配線、ハードウェアのメンテの立会いとかは
          頻繁にあるなら手順書化してバイトさんもしくは委託会社さん任せ、まれにしかないなら
          出張にて対応とかフローさえできちゃえば、現地にサーバ管理者は必要なかったりする...。

          # DCにこもって、OSをインストールしてる間は寝れたあの時代が懐かしい

          親コメント
          • by Anonymous Coward

            だから対応手順書もなにもまだできてないんでしょ。
            クラウドはたちあげたばっかだから。

            #下手するとある種の独自カスタマイズが入ってる可能性も捨てきれない。

        • by Anonymous Coward

          手動復旧程度なら、不具合確認してから出張すれは良いのでは?
          多重化はしているだろうから、それくらいで間に合う算段になっているのではないかと。

          現地担当者が居たって、どうしようもない不具合が出たら責任者が飛んで行くのが普通でしょ。
          特に今回は、数か月単位で出ている不具合なんだから。

  • by kogd9 (45248) on 2012年03月23日 23時34分 (#2122442) 日記
    クラウドのイメージダウンがずんどこ進んでる・・ (゜∇゜ ;)
    ちゃんと運営してる他社からしてみればたまったもんじゃないだろう・・
    • by Anonymous Coward on 2012年03月24日 0時10分 (#2122464)
      きっと、Oracle OpenWorld Tokyo 2012の中で、観客の目の前で解決してみせるというショーがあるんですよ。

      #とか穿った見方をしてみる。
      親コメント
    • by Anonymous Coward

      AmazonEC2
      Cloud9
      NiftyCloud
      あとどこだっけ。
      けっこーみんな障害だしてるから、俺はおどろかん。

      まだまだバグ出しのフェーズじゃないかしら。

    • by Anonymous Coward

      某クラウドの仕事をもらってるけど、客から何か言われるケースってかなり少ないっぽい。
      拡張での修正時に見つける不具合が一番多いという。

      客層が客層だからかもだけど、解約が多いって話も聞かないし、イメージダウンしてるのかな…って感じ。

  • by Anonymous Coward on 2012年03月24日 2時06分 (#2122508)

    もう少し技術的な詳細を知ってる人はいないのかなあ
    IPだーRDMAだーとIBの帯域に任せて全部乗っけようと
    夢を見たけど、残念そんなに旨い話は無かったです、
    って端からは見える

    ぶっちゃけこれ、ストレージベンダーの中の人、
    この構成で動く確証無しで売り込んでるでしょ?

    まあ買う方も、この規模の案件でZFSの文字みて
    不安に思わなかったとしたらセンス無いと思うけど
    まさか、仕様立案に技術屋しか居なくて
    インフラアーキテクタどころかエンジニアすらとか?

    • by Anonymous Coward

      Oracle Solarisの場合やNexentaStoreの場合、ZFS自体は安定でいろんなMC的なとこでの
      安定してる実績はなくはないけどね。
      # oiやそのたはこわい気分ではあるけど

      IBとか、KVMだとかまぁ複合要素ってたくさん試験してないと
      そんなにバラ色では無いかなーって思うのだなあ。
      と20年くらい仕事しててもそう思う。

      • by Anonymous Coward

        まさにそこがZFSの不安要素ですね。ZFS自体の動作は一定の安心感があるものの、ストレージはファイルシステムだけで稼働するものではなく不定の相手もいるものなので。

        周辺の実績や技術力やサポート体制などの安心感まで考えると、ZFSの名前は逆に不安要素に反転してしまうという。

        • by Anonymous Coward

          さくら障害はKVMのバグも引いてるわけで、そういう意味ではZFSだけでなくKVMも不安要素ですな。

          他のコメでもある通りクラウドはまだまだバグ出し期間なんじゃないか?

    • by Anonymous Coward

      外資メーカーの営業がいいことばかりいって、
      開発もできない自称SEがそれを鵜呑みにして、
      本番でトラブルに。。。

      メーカー営業は売った直後にインセンティブもらってトンズラ。
      絵に描いたような「SIer」のトラブルにですね。

    • by Anonymous Coward

      今回のストレージベンダーって要するにORACLE?
      確かに今回のケースで昨年末からずっと引きずってるとすれば、
      ベンダーに問題解決能力が無い事を証明してるようなもんだし。。
      これがかつてのSun Microsystemsかと思うとねえ。

  • KVMのストレージインターフェイスに利用してるvirtioなのじゃ?

    SANストレージが遅くなる可能性があるのは、どこのストレージをつかっても当然あり得る話で、それをKVMが勝手に切り離したりしてるのではないかと邪推。

    • by nanatsuki (45259) on 2012年03月23日 21時05分 (#2122342)
      SAN値がガリガリ削られて、ついに無料になってしまったんですね。
      親コメント
    • さくらのクラウドはvirtioつかってないよ

      親コメント
    • 特注のマザーにHDDを使い捨てにして魔改造したカーネル動かしている連中とまっこう勝負するのは難しいことなのかなぁ。 そもそもクラウドはデータの局所性を利用して分散処理でありながら同時にはユニークなインスタンスを一つしか存在させない事でインターコネクトを減らしてるのだから、ローカルストレージバスに閉じこめておけばいいIOアクセスをSANで集中管理するという発想が見当違いなのかもしれん。
      親コメント
      • インスタンスをノード間で移動したい場合は否応なくストレージを共有しなきゃいけないのではありませんでしたっけ?

        親コメント
        • by Anonymous Coward on 2012年03月24日 1時56分 (#2122501)

          ええ。

          結局、なんだかんだいって「SAN」をつかうということがまだ不慣れだったりして、そこでおきる問題をカバーし切れてないんだとおもいます。

          スナップショット、クローンをとったり消したりできるエンプラなファイルサーバを、お手製のコントロールプログラムでちょいちょいコントロールするわけでしょ?ZFSに限らず、ちょっと油断したバグがあると、ストレージの破壊も簡単ですよねぇ。

          あとバス共有があるSANのシステムでは、一定以内にリクエストが帰ってくる保障はないので、上位のスタック全てで異常系がきちんと書かれてないと、普段起きえない異常なレイヤーでフォールトは起きうると思います。KVMレイヤーでも仮想化されたのカーネルの中ででも。
          そこらへんノウハウが溜まってるかどうかで大きな差はでるんじゃないかなぁと。

          親コメント
          • by Anonymous Coward

            >>結局、なんだかんだいって「SAN」をつかうということがまだ不慣れだったりして、そこでおきる問題をカバーし切れてないんだとおもいます。
            この辺は部外者は憶測でしかないわけだけど
            SUNのストレージって意外と ハードとソフト両方地味な部分がもろいということが2年近く触ってよくわかった。
            おそらくさくらも同様の問題を抱えているんだと思うと、、、、、泣けてくる。

        • by Anonymous Coward

          kvm ですとqemu-kvm の block migrationで、共有ストレージでなくてもノード間の移動ができます
          共有ストレージを使ってないため、仮想ディスクのデータ転送が必要で時間はかかりますが

  • by Anonymous Coward on 2012年03月24日 17時35分 (#2122809)

    想定外の負荷に耐えかねてサービス大改悪&自滅した某safesyncとは偉い違いですね。
    http://www.ttcbn.net/no_second_life/archives/9767 [ttcbn.net]

    無料化が更なる負荷増の悪循環を招かないことを祈ります。
    --
    さくらのレンタルサーバ愛好者

  • by Anonymous Coward on 2012年03月24日 21時54分 (#2122934)

    バグは解消したから再発はしないっていうサポートの言葉をうのみにして、顧客のサーバーを移転した矢先にこれ。
    今さら、無償化されると、そんなサーバーを顧客に薦めたうちの立場がない。
    サーバーなんてどこでも障害は起きるのだから、だましだましでもいいから金取ってちゃんと運営するか、密かに返金してくれ。
    大胆に無料宣言とか、偽善の誠実さのアピールとかいらんから。

typodupeerror

計算機科学者とは、壊れていないものを修理する人々のことである

読み込み中...