Webサーバー監視tips 吉澤和香奈

16
Webサーバー監視Tips 株式会社CAMON.TOKYO 吉澤和香奈

Transcript of Webサーバー監視tips 吉澤和香奈

Page 1: Webサーバー監視tips 吉澤和香奈

Webサーバー監視Tips株式会社CAMON.TOKYO 吉澤和香奈

Page 2: Webサーバー監視tips 吉澤和香奈

自己紹介

✦吉澤和香奈です

✦ dots.女子部LT4回目です

✦ dots.女子部の全LT出ています

✦ベトナムが好きです

✦ベトナム人向けサービス作っています

Page 3: Webサーバー監視tips 吉澤和香奈

ウェブ経由でどこからでも

日本語講師とマッチングし会話、

オンライン教材で学習できる

日系企業に就職、または日本で暮らしたい

ベトナム人女性向けの、

オンライン日本語学習サービスです。

Page 4: Webサーバー監視tips 吉澤和香奈

監視ツール使っていますか?

Page 5: Webサーバー監視tips 吉澤和香奈

監視ツールのメリット

• サーバーでトラブルが起こる前に気づけます

• トラブルが起きても問題発見が早くなります

• いざというとき慌てずにすみます

Page 6: Webサーバー監視tips 吉澤和香奈

OpenSource

WebApp

Page 7: Webサーバー監視tips 吉澤和香奈

とりあえず抑えるべき項目

1. LoadAverage

2. CPU使用率

3. メモリ使用量

4. TCPコネクション数

5. ディスク使用量

Page 8: Webサーバー監視tips 吉澤和香奈

LoadAverage

プロセスの監視項目です。何かしらの負荷で上がるため、LAが上がったら、何か問題がないか他の項目を調べるようにして下さい。

閾値(例)

warningCPUコア数

×50%

criticalCPUコア数

×25%

Page 9: Webサーバー監視tips 吉澤和香奈

CPU使用率

演算や情報転送量の監視項目です。CPU使用率の負荷は、だいたいプログラムなどのソース内で無限ループが発生している場合が多いので、エラーログやループ処理を見直すと良いと思います。

90% critical

80% warning

閾値(例)

Page 10: Webサーバー監視tips 吉澤和香奈

メモリ使用量

メモリの監視項目です。メモリ使用量の負荷は、たとえばMySQLの場合、何万件も一括処理している場合が多いので、MySQLSlowQueryを設定しておくと発見が早いかと思います。普段から、取得件数が多い場合はLIMITとOFFSETを使って1000件づつ処理をする、配列を破棄するなど心がけると良いと思います。

90% critical

80% warning

閾値(例)

Page 11: Webサーバー監視tips 吉澤和香奈

TCPコネクション数

サーバーに接続しているコネクションの数の監視項目です。エラーによるCPU使用率の上昇でもメモリ不足でもない場合は、スケールアウト(サーバー台数を増やす)、ロードバランサーなどお金で乗り切るしかありません。普段から広告打ち出しのタイミングや、ピークタイムを知っておくことが大事だと思います。

Page 12: Webサーバー監視tips 吉澤和香奈

ディスク使用量

データベースや画像アップロード先をアプリケーションと同じサーバーに設定している場合、また大量のエラーログの発生などであっという間に満タンになります。スケールアップする前に、サーバー構成を見直すようにするといいと思います。

90% warning

閾値(例)

Page 13: Webサーバー監視tips 吉澤和香奈

だいたいこれらで 何とかなります

Page 14: Webサーバー監視tips 吉澤和香奈

最後に

Page 15: Webサーバー監視tips 吉澤和香奈

Slackに連携してAlertを出そう

AlertMailより見やすく、気付きやすくなります。

Page 16: Webサーバー監視tips 吉澤和香奈

ありがとうございました!