ユニファ開発者ブログ

ユニファ株式会社システム開発部メンバーによるブログです。

ログ収集サービス「LogDNA」を試してみた

おはようございます、こんにちは、なますて、こんばんは

ボルダリングに週1で通い始めて2ヶ月ほど立ちましたが5Qで止まってるユニファのインフラ見てます残念なすずきです。 先週朝起きたら右足がつり、気にせずボルダリング行ったら左足がつってしまい体のヤバさを実感しています。

さて本題

からだもやばいですが、弊社のログサーバもやばい。 FluentdとFluetdクラスタで集めたログを、ログサーバに溜め込んでるのですがログを順番に一箇所にまとめるためログサーバは一台構成にしています、つまりSPOF(単一障害点)になってます!やばい!
そのためFluentdのバッファに頼ってるやばい構成なのでやばい
やばいしか言ってないですけどやばい

そんなやばい状況で存在を知った LogDNAであります。

LogDNAの話の前に弊社のログサーバの目的はずっと残しておくではなくて直近のログを1箇所で参照できるために残しています。 バックアップ自体はS3にとばしてますから…

じゃぁLogDNAはそんな使い方ができるのかというと、プランにもよりますが、 1週間から1ヶ月といった範囲でデータが残しておけます。
しかも投げ込んだデータはタグ付けや自動でErrorとか判別してくれて、Web画面上で参照できます。
また、バックエンドにS3等のストレージが選択できるのでとりあえずLogDNAに投げ込んどけばS3に格納されるって使い方ができそうです。(S3の挙動は未確認)
だとすると現状のログサーバと役割一緒じゃん。

補足で弊社のログサーバに送られるログはその前段のFluentdクラスタでフィルタリングされており、ヒットしたものはSlackへアラートを飛ばしています。 LogDNAは検索結果のクエリが保存でき、その結果がn分間にx件ヒットしたらSlackへ通知ができます。
だとすると現状のログサーバと役割一緒じゃん。

しかし利用するとしたら料金も重要です。 ログサーバはt2.smallに100G程度のEBSがぶっ刺してあるわけですが、月額約30$になります。

LogDNAの料金はこちら https://logdna.com/pricing
とりあえず2週間残るプランで見てみると1G $2で最低$20使ってくれっていうので10Gのディスクを確保しているような状態と思っていいかなと。

見づらいけど表にしてみた、見づらいけど

名前 月額 容量 残日数 参照方法 導入 備考
EC2+EBS $30 100G(1ヶ月ではないのと圧縮もされてるので比較にはならない) ディスク容量に依存 ssh+grep Fluentdをサーバにインストール アラート等は別のFluentdクラスタ等が可動
LogDNA(MAPLEプランの場合) $20 20G 14日 web または cli+grep エージェントをサーバにインストール アラートも含む

実際のログ量を見てみないとあれですが、一部のサービスのログの量を計算してみると1ヶ月で2Gや4Gとかではあったので、 他のサービスもそれくらいだとすると20Gの中にはおさまりそうです。
20Gこえても1G $2なのでサーバの運用したり、サーバの障害対応したりする運用コスト等考えたらペイできそうな気もしてきました。

所感はこの程度であとは実際のスクリーンショット等を

ログを検索する様子
f:id:mominosin:20180713031727p:plain

  • 画面上部で転送時に設定したタグや、転送してきたホスト名、ログ名、error等をタブでフィルタリングできる
  • 画面下部でログの検索やTailみたいな機能(左下のLive)を有効無効にしたり

ログの検索をアラートに
f:id:mominosin:20180713031845p:plain

  • 左上で保存ウインドウ出す

f:id:mominosin:20180713032140p:plain

  • Alertsに別画面で設定するAlert(Slackなど)を選択すると該当するアイテムがヒットするとAlertが発火する

今回のサンプルとは別ですがSlackへ通知された様子はこちら
f:id:mominosin:20180713032355p:plain

LogDNAの紹介は以上になります、引き続きS3へアップロードされる様子とうも検証していこうと思っています。
今の所LogDNAは

  • Webで確認できる手軽さ(SSH不要)
  • 検索設定がログ監視設定にできる(インフラの特別な作業不要)
  • サーバ監視系のツールにしては安い(データ量測定してないですが今の処の肌感)
  • 専用サーバ管理しなくてい(サーバ持ちたくないもんね)

といったメリット等々あるので、検証の結果導入しますって方向に持っていきたいなと思っているところです。

おわり