オブザーバビリティクラウドサービス/ PITWALL®|システム運用の効率化と オブザーバビリティ強化を実現

2024.05.07

Cittecブログ編集部 Cittecブログ編集部

伊藤忠テクノソリューションズ株式会社(以下、CTC)は、システム運用における情報収集・連携の効率化と、オブザーバビリティの強化を実現するクラウドサービス「PITWALL(ピットウォール)」を開発、2023 年11 月、海外市場に先行して、日本国内への提供を開始した。インシデント時の情報収集をシングルクリックで可能にするこの画期的なツールについて紹介する。
(株式会社ビジコミ発行 ビジネスコミュニケーション2024年4月号掲載記事を一部編集)

Ph_tanaka-1

技術戦略本部
本部長代行  田中 久智

システムの複雑化に伴うオブザーバビリティの重要性

デジタルネイティブ化とともにIT に対する期待が高まる近年、システムの高度化・複雑化は、かつてないスピードで進展している。システム開発に対して、継続的な機能追加と改善を重視した対応が求められる一方、エンジニア不足も相まってシステム運用現場への負担は増し、インシデントへの不十分な企業対応が公になれば、ブランドイメージの失墜、それに伴う収益の低下は免れない。

利用者にとって、業務改善の切り札にもアキレス腱にもなりうるシステム運用現場の効率化、オブザーバビリティ(可観測性)の強化を実現する画期的ツールとして、2023 年11 月、クラウドサービス「PITWALL」は登場した。

オブザーバビリティという概念自体は近年定着したものだが、システム運用情報の可視化は、古くから課題となってきたテーマだ。より複雑化する環境のなかで「的確にシステム状態を把握する」ことが強く求められ、新しいマーケティングワードとして定着したのである。求められるのは、インシデント発生時など開発運用チームの迅速な対応が必要とされる時に、誰もが正確に稼働中システム情報を収集・把握し、復旧・原因特定・対応を可能にすることだ。

PITWALL は、開発・運用現場で利活用されるさまざまなツールをつなぎ、効率的な情報収集と集約、オペレーションを可能にする抽象化技術であり、必要な情報を瞬時に入手、解析・改善検討にフォーカスするためのいわば「黒子」のような役割を担う。システムの状況をリアルタイムに可視化して安定稼働につなげるオブザーバビリティにおいて、特にインシデント発生時、PITWALL は強みを発揮するのである。

シングルクリックで情報を収集しインシデント時の初動対応を支援

システム開発・運用現場では、利用するシステムの細分化や多様化に伴い、監視やログ収集などの多岐にわたるシステム運用ツールを利用していることが多い。なんらかのインシデントが起こった場合、システム内で利活用されている複数のツールに跨る確認ポイントを、手元のブラウザやツールを切り替え手作業で情報収集することが一般的だ。分野ごとに運用部署が異なる場合、相互の連携が求められるため、インシデント発生時の初動状態把握に、数十分から時間単位で掛かってしまう現場も少なくない。また、有識者の「スキルと経験に依存」した、属人性が高い対応を余儀なくされていることも多い(図1)。

fig.1
図1 インシデント対応現場の課題

これに対してPITWALL は、インシデント発生時の情報収集や原因特定に要する時間を飛躍的に短縮することに成功した。

システム監視やログ収集、トランザクションのトレースなどを行っている各種管理ツールと連携し、インシデント発生時の情報収集を自動化、これまでは手作業で行われていた複数ツールの情報収集を「シングルクリックで実現」し、初動対応における適切かつ迅速な情報収集を支
援する。さらに対応フローやパターンを可視化・標準化することで、スキルと経験に依存しない対応が可能となる(図2)。

Fig.2-1
図2 PITWALL を利用したインシデント対応

エンジニア不足に拍車をかけるトラブルシューティング

PITWALL プロジェクトは、開発責任者である田中氏が在籍していたCTC アメリカで、「開発・運用現場が有する組織の課題解決にアプローチすることはできないか」という問題提起をもとにスタートした。企業におけるクラウドネイティブ化が先行し、積極的にスタートアップ技術
を採用するアメリカで、課題解決を求める企業との対話を通じてコンセプトが生まれ、帰国後、開発されたデジタルツールなのである。

プロジェクトの背景には、企業経営者たちとの対話から得た問題意識もあった。「グローバルなトップ企業の経営者たちは、デジタル技術やAI を活用してやりたいことをやろうとしても人材が足りない、やりたいことがやれず機会損失がどんどん大きくなる、と言っています。マッキンゼー社がまとめたレポートでは、ヒアリングした企業全体で年間約8.5 兆ドルもの機会損失があると試算しています。エンジニアがトラブル対応などに追われ、デジタルサービスやAI 開発に本来費やされるはずの時間が削がれて生産性が下がっているためです」(田中氏)。

この状況はOps Chaos(オペレーション・カオス)だと田中氏は言う。デジタルサービスやAI 開発に必要なスキルセットを持った人材が、トラブル対応に追われ、効率的な動きを阻害されている状況は、まさにカオスといえるだろう。

IT エンジニアの人材不足以前に、現在活動しているエンジニアの負担を軽減を図るという課題が横たわっているのだ。

「PITWALL によって、IT 業界全体の無理と無駄、ムラを解決したいと思っています」(田中氏)。

対応現場では組織として無理な対応をせざるをえず、手作業による情報収集は時間を浪費する。そして、経験とスキルに頼るため、属人的ムラのある状況。PITWALL はこれらの解決手段となりうる。

運用現場の負担となるツールの乗り換えは不要

システム構築における各技術領域の細分化と分化が著しい現在、企業は1 つのツールではなく、複数のツールを組み合わせて利用しており、部署やシステムの世代ごとにその組み合わせが異なるケースは珍しくない(図3)。

Fig.3-2
図3 ユーザは適材適所でツール選定

「CTC は、今ある適材適所のツール群を使って部署間が連携して対応に当たる前提に立って考えました。現在運用されている各種開発・運用ツールに加え、オープンソースソフトウェアや内製ツールへのアクセスを、そのまま利用し、高度化する各種ツールの価値を享受しながらも、より効率的で経験やスキルに依存せずに対応する方法はないか?これが、複数のツール情報をシングルクリックで収集できるPITWALL のコンセプトを作った際の最初のチャレンジでした」(田中氏)。

ユーザーは従来どおり、既存のツールを使い続けることができる。これは特筆すべきPITWALL 導入のメリットといえる。

PITWALL の利用用途は、インシデント(アラート)発生時の支援以外にも多岐にわたる。

インシデント発生時

システム障害や、セキュリティインシデント、データ欠損などが発生した際の事象確認、影響範囲の調査など初動対応における情報収集を効率化。解析・復旧の迅速化。

オンデマンドでの状態確認

ユーザ申告やサイレント障害にも対応可能。計画作業前後や作業中の随時確認や正常性確認にも有効。

定期レポート、作業記録

日次の状態確認や、月次セキュリティレポートに利用可能。作業実施時や再現試験時の記録・共有にも効果を発揮する。

迅速な情報共有を可能にするスレッド機能

障害やインシデントのパターンに応じたフローをPITWALL 上で作成することで、利用すべきツールが可視化できる点がPITWALL 最大の特色といえる。

追加搭載された「スレッド機能」は、このメリットをさらに拡大することに寄与している。

インシデント発生時、「スレッド」と表示されたリンクを運用管理者がクリックすると、受信したアラートに関連した情報をまとめるスレッドが作成される(即時情報収集)。収集された情報のなかからインシデントと関連性の低いものは除外し、関連のありそうなものにしぼる作業が次段階(仮説)。たとえば、CPU 使用率にしぼって情報を詳細に得ようとすると、CPU 使用率関連のスレッドが立ち上げ、アラート受信時からのタイムラインが作成され、運用者が仮説に基づいて収集した情報を連ねていく。

このような仮説・検証を迅速に、的確に重ねることによって、事象の原因分析・対策を行うとともに、対応時の経験をナレッジとして蓄積することもできる(図4)。メールやチャットツールと連携して、進捗情報や利用ツールのスクリーンショットも共有できるため、チームレベルでのナレッジ共有や運用業務の継続的な改善も可能となるのだ。

Fig.4-1
図4 スレッド機能によるインシデント発生時の情報集約

「コマンドラインで確認した情報を動画にして共有することもできます。また、このクラウドサービス上には有識者のナレッジを投入できますから、参照することで属人化の解消にもつながるはずです。さらに蓄積された過去の事象との差分などを瞬時に見られる機能の開発も進めています」(田中氏)。

Fig.5-1
図5 PITWALL のダッシュボードβ
オンデマンドの状態確認(①ユーザ申告・サイレント障害 ②計画作業前後や作業中の随時確認 ③正常性確認など)

海外市場への展開も視野に

数多くのIT ベンダー製品を取り扱い、顧客向けにソリューションを提供してきたCTC ならではの視点から開発されたツールであり、シングルクリックでインシデント発生時の情報収集を可能にするアプローチは、PITWALLのほかにはない。また、導入済みの複数ツールに適応する点も特筆に値する。現時点において、そうした意味でPITWALL は唯一無二のテクノロジーといえるだろう。

CTC は、クラウドとオンプレミスを組み合わせたハイブリッドクラウド環境を利用している企業を中心にサービスを展開し、2024 年からの3 年間で50 社への提供を目指している。アメリカで着想を得たデジタルツールであり、当然、日本国内のみならず、海外市場への展開も視野に入っている。

今後CTC は、ディープラーニングや生成AI を活用した障害情報の分析や可視化なども視野に、PITWALL の機能拡充を図っていくことになる。

 

この記事をシェア

Cittecブログ編集部 Cittecブログ編集部

Cittec(シッテク)ブログは、技術情報を広く共有しています。API、IT運用、アジャイル開発、セキュリティ、ネットワーク自動化など、幅広い分野を専門知識豊富な執筆陣がカバー。またローカル5Gの可能性についても魅力的な記事を提供しています。テクノロジーの進展とビジネスへの影響をわかりやすく解説することで、読者の皆様に新たな価値を提供します。