多くの企業では、ロギングが複数のクラウドプロバイダ、データセンター、デバイス、アプリケーションに分散されており、この状況はクラウドの管理タスクを複雑化させる可能性があります。
また、ログソースの形式やアクセス方法もさまざまです。このような多様なログ取得の常習は、問題の診断、キャパシティ・プランニング、セキュリティおよびコンプライアンス・ポリシーの監視にログを効果的に活用することを阻みます。ハイブリッドおよびマルチクラウド環境では、アプリケーションのコンポーネントと依存関係の可視化を維持するために、ログの一元化が不可欠です。
まずは、以下の集中型ログのベストプラクティスを考察してみます。
1. ロギングの目標を理解する
最初にクラウドのロギングとアプリケーション・パフォーマンス管理(APM)の要件の範囲を検討します。管理者がクラウドAPMとロギングの一元化をどのように実現するかは、使用するクラウド・コンピューティング・モデルに依存します。
●単一のパブリック・クラウド:クラウド・プロバイダーが提供するクラウド・ネイティブ・ロギング・ツールを選択します。
●ハイブリッド・クラウド:現在のオンプレミスのロギング手法をクラウドに拡張します。
●マルチ-クラウド:何らかの形でログを集計し、収集したデータを分析する。
さらに、ログ収集したデータの用途と、ログ収集したイベントをリアルタイムで確認する必要があるかどうかを検討します。リアルタイムのデータ収集は、集中型ログのコストと複雑さを高めることになります。しかし、管理者が問題が発生したときに中央のログを使用して診断することを期待する場合は、それが不可欠です。
2. アプリケーションロギングとリソースロギングの分離
アプリケーションのロギングとリソースのロギングは、それぞれ別のレイヤーであるべきです。アプリケーションは、多くの場合、それ自身の状態を記録します。プラットフォーム・リソースのログ(ホスティングやミドルウェアのログ)は、常に利用可能です。一元化の目的はすべてを取りまとめることですが、この2つのログ・ソースを混在させないようにすべきです。効果的なAPMの実践は、問題をアプリケーションとリソースをそれぞれに分離することにかかっています。
管理者は、アプリケーションとその基盤となるリソースとの関係を判断するために、情報を記録する必要があります。クラウドやその他の仮想ホスティング技術では、アプリケーションが仮想リソースを可視化するため、アプリケーションとホスティング・リソースの間の接続はソフトなものになります。このため、アプリケーションと物理リソースの対応付けを行い、2つのログレイヤの意味を理解することが重要です。物理リソースを共有するアプリケーションは仮想リソースを共有しないため、このマッピングは問題の関連付けにも重要です。
3. 何をどれだけの期間記録するかを知る
どんなに優れた集中型ログ記録戦略であっても、データ量に埋没してしまうことがあります。管理者があまりにも多くのログデータを保存すると、パフォーマンスに悪影響を及ぼし、コストが上昇し、有用な情報を見分けるのが困難となります。ログを取るためだけにログを取るのではなく、何かをログに取るという具体的な理由が必要です。
管理者は、一元的にログを記録するように選択したものについて慎重であるとしても、少なくとも年に2回はログ記録プロセスを見直し、収集したデータのうち使用されなかったものを確認する必要があります。また、個人を特定できるような情報は記録しないようにしましょう。これは、セキュリティやコンプライアンスに関するポリシーに違反する可能性が高いからです。
4. ログデータの可視化
テキストによる分析に加え、ログデータの有益なビジュアル化を達成する。多くの企業が、中央のログをあまり活用していないことを認めています。管理者が余計なデータの記録を避けていても、迷路のようなテキスト情報の中から何かを見つけ出すのは困難な場合があるからです。ログ管理ツールを評価する際には、ログの可視化機能を優先する必要があります。
5. 適切なログ管理ツールの選択
集中管理型ログ取得ツールには様々な選択肢があります。適切なものを選択するために、組織はクラウド・プロバイダーが提供するものとサードパーティーやオープンソースのツールとを比較する必要があります。
●プロバイダー・ネイティブ・ツール:AWS、Microsoft Azure、Google Cloudは、Amazon CloudWatch Logs、Azure Monitor Logs、Google Cloud Loggingなど、さまざまなログ管理ツールを提供している。これらのプロバイダーは、クラウドログデータ収集と、ハイブリッドおよびマルチクラウドログを取り込むことができるツールの両方を提供しています。一般的に、企業は支配的なプロバイダーのクラウドログのフレームワークを採用し、他のログを取り込むことが最も簡単です。
●サードパーティの選択肢 :サードパーティ製品(一部はオープンソース技術をベースにしている)には、Dynatrace、Datadog、New Relic、Splunkなどがあります。これらの製品の多くは、可視化と集中収集の機能を備えたAPMスイートです。
●オープンソースの選択肢: オープンソースの選択肢としては、Elastic Stack、Graylog、Fluentd、Rsyslog、LOGalyze、SolarWinds、NXLogなどがあります。これらの製品は、セルフサポート版とエンタープライズ版の両方が用意されているが、機能は大きく異なるので、各製品を注意深く確認ください。ただし、パブリック・クラウド・プロバイダーを持たない企業や、主にオンプレミスのロギングに注力している企業、カスタムな取得を必要とするログがある場合は、これらのオープンソース・オプションのいずれかが最適となる可能性があります。
集中型ロギングおよびモニタリング製品を慎重に選択することです。APMの実践を妨げず、可視性や情報の明瞭性を変化させるリスクなしに製品を変更することは困難です。いつも適切な計画を立てることが重要です。
関連トピックス:
- クライム・クラウド・カンパニー 感謝祭2016での AWS re:Invent 2016 報告!
- ESXiのシステムログ作成場所の変更手順【仮想化プラットホーム VMware vSphere】
- VMworld2018 in ラスベガス レポート② Veeamセッション
- VMware ESXi syslog設定を中央管理ログへコンフィグレーション
- クラウド移行中の一般的なIPアドレス問題について
- 仮想化データの事業継続(BC)とディザスタリ・リカバリー(DR)プランのためのヒント
- VMware vCenter Operations(仮想環境のシステムの健全性の監視ソフト)の導入手法
- ハイブリッドクラウド・バックアップとは:そしてどのように機能し、どのようなメリットがあるのか!