
「さくらのクラウド」障害多発で当面無償化 62
ストーリー by hylom
せっかくのデータセンターが 部門より
せっかくのデータセンターが 部門より
あるAnonymous Coward 曰く、
年末のトラブルが/.Jでも話題となったIaaS型クラウドサービス「さくらのクラウド」だが、その後も頻発するトラブルが解決できず、当面の間は利用料を無償化することが発表された(プレスリリース)。
これまでの経緯についてはGIGAZINEの記事が詳しくまとめているが、ストレージ周りを原因とするサーバーダウンやパフォーマンス低下が毎月のように発生しており、根本的な解決に至っていないのが読み取れる。プレスリリースによると、ストレージメーカーとともに問題解決に向けて対応中としつつも、いまだ「現状は完全な解決の目処をご案内する事ができません」という状態のようだ。また「根本的に設計を見直した新たな環境の構築を平行して進めており」というコメントからも、問題の根が深いことが伺える。
なお、さくらのクラウドが使用しているストレージ基盤は、サービス開始時のアナウンスによるとOracleの「Sun ZFS Storage Appliance」だという。4/5のOracle OpenWorld Tokyo 2012では「さくらインターネットのクラウドを支えるSun ZFS Storage Appliance:5つの選定理由」というセッションが予定されており、なんとも皮肉な状況となってしまっている。
桜の季節ですね。いかがお過ごしですか? (スコア:3, おもしろおかしい)
サービスの継続に暗雲が垂れ込めてきましたね(クラウドだけに)
解決への光明が見えるといいですね(Sunだけに)
Re:桜の季節ですね。いかがお過ごしですか? (スコア:1)
この先どうすればいいのか、神託によって決めるんでしょうね。
Re: (スコア:0)
桜の様に散らないといいですね。
Re: (スコア:0)
さくらたん「絶対、大丈夫だよ!」
Re: (スコア:0)
死亡フラグですか?
Re: (スコア:0)
CCさくらネタが通じない世代が増えました…。
Re: (スコア:0)
お前と俺とは同期の桜
Re:桜の季節ですね。いかがお過ごしですか? (スコア:2, おもしろおかしい)
同期に問題があったんですか?
Re: (スコア:0)
こういうのって日本独特なのかな。それとも世界共通なんだろうか。
Re: (スコア:0)
ぱっと例は挙げられないけど、少なくとも英語のニュースサイトでは見かけます。
「俺うまいこと言ったった(ドヤァ」的な雰囲気も同じです。
タダで殺到らしい(´・ω・`) (スコア:2, 参考になる)
「さくらのクラウド」のご利用のお客様へ [sakura.ad.jp]
Re:タダで殺到らしい(´・ω・`) (スコア:1)
本当はいくら請求されてたかがわかるなら、検証に便利だよなぁ。
# 今なら使い放題キタ ってのもいるだろうけど、障害直ったら払えなくなるだけな気もするし。
# yes, fly. no, fry.
Re: (スコア:0)
サーバーダウンやパフォーマンス低下が大量に発生してるのに乞食勢まで押し掛けたら大変なことになると思うんだがなw
Re:タダで殺到らしい(´・ω・`) (スコア:2, すばらしい洞察)
ストレステストのテスターが欲しいんじゃない?
Re:タダで殺到らしい(´・ω・`) (スコア:1)
このままポシャるのはもったいない。
Re: (スコア:0)
現状は
さくらのクラウドの新規申込受付の一時中止について [sakura.ad.jp]
ということらしい。
Google に乗る (スコア:2)
Google App Engine を使うのが、おそらくは大半の用途で最高の選択肢となるのでしょうね。バックエンドのについてのディープな知見を持たない者は、Google が定義したベストプラクティスに乗っからせてもらうのが、謙虚な姿勢というものかもしれません。
Re:Google に乗る (スコア:1)
GoogleはPaaS、さくらはIaaS。
Googleはさくらの台用にはならない。
さくらがGoogleの代用になることはあるかもしれないけど。
Microsoftも赤字で撤退なんて話もちらほらしてるし、パブリッククラウドはGoogleとAmazonに落ち着くのかな。
石狩の求人は無かった (スコア:1)
エンジニアは殆ど全てが東京からリモートで、データセンターは北海道の石狩にあって
数名しかいないと書かれていたけど、障害起きてリモートで復旧しない問題が起きた場合
伝言ゲームになって復旧が遅れそう。運用体制にも問題があるの。
Re: (スコア:0)
ITとは人の仕事を減らす技術なんだから人間にできる仕事を機械にやらせる奴はクビにするとかの不断の努力を怠っていたら仕事が増えるほうがおかしい。
Re:石狩の求人は無かった (スコア:1)
で、データセンターでの(手動での)復旧作業というのは「機械にできない仕事」なので、
地元に住んでるサーバー管理者は依然として必用でしょうよ。
Re:石狩の求人は無かった (スコア:3, 興味深い)
地元の人間から見ると、道と石狩市はまんまとのせられた気がするなぁ。
石狩市(と札幌市)は、地元雇用の増大とか地域活性化とか見込んでいたようですが、データセンター程度じゃそんなもん増えるわけ無いだろ。
スタッフだって基本本社から出向/出張だろうし。
地元では冷めた目が増えた気がします。所詮は・・・。
P.S. 親が入院したのでOSの解析やる余裕がなくなりました。
Re:石狩の求人は無かった (スコア:1)
求人があったとしても、素人を採用できるわけないのにね。
地元採用って警備員とクリーニングサービスくらいかな。
# 潤ったのは工事業者?
Re: (スコア:0)
電力会社作って、電気を売りつけるべきだったな。
で、その金で何かする。
Re:石狩の求人は無かった (スコア:1)
まぁ、実際道民は首都圏の連中に比べると「金無い」ですから。今のすすきのの寂れ方を見れば一目瞭然かと。
Re:石狩の求人は無かった (スコア:1)
今のサーバって大抵リモートコンソール(HPで言うとiLO、Dellで言うとDRACとか)が
ついてるから、BIOSやRAIDの設定変更、OSインストールなんかまでリモートでできるよ。
現地でのサーバの設置、ケーブルの配線、ハードウェアのメンテの立会いとかは
頻繁にあるなら手順書化してバイトさんもしくは委託会社さん任せ、まれにしかないなら
出張にて対応とかフローさえできちゃえば、現地にサーバ管理者は必要なかったりする...。
# DCにこもって、OSをインストールしてる間は寝れたあの時代が懐かしい
Re: (スコア:0)
だから対応手順書もなにもまだできてないんでしょ。
クラウドはたちあげたばっかだから。
#下手するとある種の独自カスタマイズが入ってる可能性も捨てきれない。
Re: (スコア:0)
手動復旧程度なら、不具合確認してから出張すれは良いのでは?
多重化はしているだろうから、それくらいで間に合う算段になっているのではないかと。
現地担当者が居たって、どうしようもない不具合が出たら責任者が飛んで行くのが普通でしょ。
特に今回は、数か月単位で出ている不具合なんだから。
うむむ (スコア:1)
ちゃんと運営してる他社からしてみればたまったもんじゃないだろう・・
Re:うむむ (スコア:1)
#とか穿った見方をしてみる。
Re: (スコア:0)
AmazonEC2
Cloud9
NiftyCloud
あとどこだっけ。
けっこーみんな障害だしてるから、俺はおどろかん。
まだまだバグ出しのフェーズじゃないかしら。
Re:うむむ (スコア:1)
Windows Azure も。
閏年問題だから、トラブルのレベルは違うけど。
Re:うむむ (スコア:2)
MobileMeもだっけ。
-- yuno
Re: (スコア:0)
某クラウドの仕事をもらってるけど、客から何か言われるケースってかなり少ないっぽい。
拡張での修正時に見つける不具合が一番多いという。
客層が客層だからかもだけど、解約が多いって話も聞かないし、イメージダウンしてるのかな…って感じ。
花より団子 (スコア:1)
もう少し技術的な詳細を知ってる人はいないのかなあ
IPだーRDMAだーとIBの帯域に任せて全部乗っけようと
夢を見たけど、残念そんなに旨い話は無かったです、
って端からは見える
ぶっちゃけこれ、ストレージベンダーの中の人、
この構成で動く確証無しで売り込んでるでしょ?
まあ買う方も、この規模の案件でZFSの文字みて
不安に思わなかったとしたらセンス無いと思うけど
まさか、仕様立案に技術屋しか居なくて
インフラアーキテクタどころかエンジニアすらとか?
Re: (スコア:0)
Oracle Solarisの場合やNexentaStoreの場合、ZFS自体は安定でいろんなMC的なとこでの
安定してる実績はなくはないけどね。
# oiやそのたはこわい気分ではあるけど
IBとか、KVMだとかまぁ複合要素ってたくさん試験してないと
そんなにバラ色では無いかなーって思うのだなあ。
と20年くらい仕事しててもそう思う。
Re: (スコア:0)
まさにそこがZFSの不安要素ですね。ZFS自体の動作は一定の安心感があるものの、ストレージはファイルシステムだけで稼働するものではなく不定の相手もいるものなので。
周辺の実績や技術力やサポート体制などの安心感まで考えると、ZFSの名前は逆に不安要素に反転してしまうという。
Re: (スコア:0)
さくら障害はKVMのバグも引いてるわけで、そういう意味ではZFSだけでなくKVMも不安要素ですな。
他のコメでもある通りクラウドはまだまだバグ出し期間なんじゃないか?
Re: (スコア:0)
外資メーカーの営業がいいことばかりいって、
開発もできない自称SEがそれを鵜呑みにして、
本番でトラブルに。。。
メーカー営業は売った直後にインセンティブもらってトンズラ。
絵に描いたような「SIer」のトラブルにですね。
Re: (スコア:0)
今回のストレージベンダーって要するにORACLE?
確かに今回のケースで昨年末からずっと引きずってるとすれば、
ベンダーに問題解決能力が無い事を証明してるようなもんだし。。
これがかつてのSun Microsystemsかと思うとねえ。
実はSun Storage Appliance はあんまり関係なくて・・・・・・ (スコア:0)
KVMのストレージインターフェイスに利用してるvirtioなのじゃ?
SANストレージが遅くなる可能性があるのは、どこのストレージをつかっても当然あり得る話で、それをKVMが勝手に切り離したりしてるのではないかと邪推。
つまり・・・・・・ (スコア:2)
Re:実はSun Storage Appliance はあんまり関係なくて・・・・・・ (スコア:1)
さくらのクラウドはvirtioつかってないよ
Re:実はSun Storage Appliance はあんまり関係なくて・・・・・・ (スコア:1)
Re:実はSun Storage Appliance はあんまり関係なくて・・・・・・ (スコア:1)
インスタンスをノード間で移動したい場合は否応なくストレージを共有しなきゃいけないのではありませんでしたっけ?
Re:実はSun Storage Appliance はあんまり関係なくて・・・・・・ (スコア:1, 興味深い)
ええ。
結局、なんだかんだいって「SAN」をつかうということがまだ不慣れだったりして、そこでおきる問題をカバーし切れてないんだとおもいます。
スナップショット、クローンをとったり消したりできるエンプラなファイルサーバを、お手製のコントロールプログラムでちょいちょいコントロールするわけでしょ?ZFSに限らず、ちょっと油断したバグがあると、ストレージの破壊も簡単ですよねぇ。
あとバス共有があるSANのシステムでは、一定以内にリクエストが帰ってくる保障はないので、上位のスタック全てで異常系がきちんと書かれてないと、普段起きえない異常なレイヤーでフォールトは起きうると思います。KVMレイヤーでも仮想化されたのカーネルの中ででも。
そこらへんノウハウが溜まってるかどうかで大きな差はでるんじゃないかなぁと。
Re: (スコア:0)
>>結局、なんだかんだいって「SAN」をつかうということがまだ不慣れだったりして、そこでおきる問題をカバーし切れてないんだとおもいます。
この辺は部外者は憶測でしかないわけだけど
SUNのストレージって意外と ハードとソフト両方地味な部分がもろいということが2年近く触ってよくわかった。
おそらくさくらも同様の問題を抱えているんだと思うと、、、、、泣けてくる。
Re: (スコア:0)
kvm ですとqemu-kvm の block migrationで、共有ストレージでなくてもノード間の移動ができます
共有ストレージを使ってないため、仮想ディスクのデータ転送が必要で時間はかかりますが
その企業精神やよし (スコア:0)
想定外の負荷に耐えかねてサービス大改悪&自滅した某safesyncとは偉い違いですね。
http://www.ttcbn.net/no_second_life/archives/9767 [ttcbn.net]
無料化が更なる負荷増の悪循環を招かないことを祈ります。
--
さくらのレンタルサーバ愛好者
正直だと困ることも (スコア:0)
バグは解消したから再発はしないっていうサポートの言葉をうのみにして、顧客のサーバーを移転した矢先にこれ。
今さら、無償化されると、そんなサーバーを顧客に薦めたうちの立場がない。
サーバーなんてどこでも障害は起きるのだから、だましだましでもいいから金取ってちゃんと運営するか、密かに返金してくれ。
大胆に無料宣言とか、偽善の誠実さのアピールとかいらんから。