Maxの日記: のべ4ヶ月20%の帯域を無駄に 2
お仕事先の話。
某社提供の光ファイバにつないでいる。拠点から大阪の施設までは
帯域を保証するメニューだが、どうもその通りに動いていないと
言う話だった。
某社施設でのトラフィック状況を顧客に公開しているが、その拠点
の状況を確認すると、6Mの契約のところ4.5M程度までしか出てい
ない。一度は某社側の施設そのものに問題あったのか、内部的な
工事をやって若干性能あがったのだが、それでも平均的に1Mほど
予想帯域には届かない感じ。
予想されるボトルネックは、ファイアウォールとルータ。
まずはFWに問題あるのかと、DIYでSonicwallのメモリを増強。
無保証だが、つぶれたときは潔く現行のPro200あたりを導入する
という前提で実施。メモリ増強はうまくいったが、しばらく様子
見るも効果なし。
で、次は・・・ということでルータに使っているCiscoのC3600が
怪しいとなる。・・・コンソールをつないで仰天。
%AMDP2_FE-5-LATECOLL
が延々と出ていた。むー。Late Collisionですか。
昨年の秋頃にもこいつにつないで設定を確認した覚えがあるのだが
そのときにはこういうの出てなかったぞ。犯人はその間に、この
ラックの機器調整をしに来た香具師だと言うことになる。
サーバラックの裏側に潜り込んでリアパネルを見る。
Ethernet ModuleのFullDuplexのランプが消えている。
そこから出ているケーブルをたどってスイッチのリアパネルを
見ると、オートネゴシエーションが切られていて、おまけに
FullDuplexに設定されているじゃないの・・・
C3600の設定を変更するためのパスワードは業者が知って
いて施設を保有する団体は知らされていない(これはこれで問題
だけど)ので、さわるのをやめておく。
このスイッチのオートネゴは経験的に馬鹿なのは解っているので
マニュアルのままディップスイッチをHDX側に倒す。
C3600からの警告メッセージがぴたりと止む。こいつには2枚
Ethernetモジュールがつながっていて、もう片方のインタフェース
からも同じメッセージが出ていたがこちら側のセグメントはちゃんと
設定されているので、その下にぶら下がるLAN側のどこかに問題
があるのだろう。こっちの調査はまた後にする。
それから2時間ほど様子を見る。4-4.5Mあたりがピークだった
状態から、5-5.5Mにピークが推移する。サーバルームの担当者
から「おー!」と声が上がる。
一息つきながら過去1年間のトラフィックレポートを見る。
増速を2回しているが、1回目の増速時は期待した帯域が出ていた。
2回目の増速時には需要の方が遙かに下回っていたが、今年になって
からWinMXユーザと思われるトラフィックが増加。「まだ余裕
あるもんね」という状態から「げげ。こんなはずでは」ということに
気がついたのはつい最近のこと。ダミーでトラフィックを与えるとか
そういう検証はしていないので、実際どこまで帯域が出るか、
検証できたのはつい最近ということだ。
顧客からの「遅い」というクレームが頻発したのは最近なのだが
実際レイトコリジョンが発生した場合、上位層がその後始末を
する事になるのでアプリケーションの動作はさらに遅くなる。
顧客からの接続数が増え、トラフィックが増大すると割り当て
られる帯域で正常に稼働している状態よりさらにクライアント
側の内部で動作は遅くなる。
帯域にまだ余裕のあった時点でも、実はかなり遅かったのでは
ないかと思われるし、レイトコリジョンの後始末のためにルータと
ファイアウォールも余分な負荷を強いられていたと。
それにしても、機器設定のミスで結局1-1.5Mほど帯域を損していた
わけだ・・・・げんなり。
参考:
http://www.cisco.com/warp/public/63/eth_collisions.html
http://www.cam.hi-ho.ne.jp/puffin/compendium/J_EN-Colli.html#late_coll
****
タイトル変だったので直し。
あひゃっ (スコア:1)
そりはあんまりですねぇ(^^;。
あと、オートネゴが馬鹿なスイッチって結構多いですよね。
オート同士でつないで10HALFになった日には思わず脱力...
uchachaの日記 [hatena.ne.jp]
Re:あひゃっ (スコア:1)
あんまりにもあんまりすぎて、絶句でした。
ていうか、「遅い」と言われたときにあれこれ調べたりする中に
こういう基本的な事項の確認がすっぽり抜けてました。
「まさかそんな訳は・・・」という事柄が根本原因だったなんて
まだまだ経験が足らないです(^^;
-- (ま)