インシデント管理のPagerDutyのVPにインタビュー。AIエージェントの新機能とは?

インシデントマネージメントのソリューションを展開するPagerDutyが2025年4月10日に都内でミニカンファレンスを開催。それに併せて来日した同社の最高製品開発責任者のJeff Hausman氏とProduct Management Senior DirectorのNora Jones氏に対して、カンファレンスの前日にインタビューを行った。翌日のカンファレンスで解説することを短時間で要約しながら、オブザーバビリティと生成AIを活用した新機能を紹介し、質疑応答に応えてくれた。
簡単に自己紹介をお願いします。
Hausman:私はPagerDutyの製品に関する責任者です。製品の開発及び戦略など全般について担当しています。前職ではHPやSymantec、McAfee、ServiceNowなどで製品に関する仕事をしていました。PagerDutyに入ったのはNoraの後で2024年の2月です。
Jones:私は製品戦略と製品を発展させるための施策についての責任者です。PagerDutyの前はJeliという会社の創業者でCEOをやっていましたが、JeliがPagerDutyに買収されたことでPagerDutyの一員となりました。Jeliが2023年11月に買収されてから1年くらいはJeliのソフトウェアをPagerDutyの製品と統合するための仕事をしていましたが、今は製品戦略の仕事を担当しています。
どちらも製品にフォーカスしていて営業じゃない、つまりセールスピッチを行う人ではない、ということですね。
Hausman:そうです。我々はプロダクトの担当でセールスは別の人がやっています(笑)。
私の認識ではPagerDutyはインシデント管理のソフトウェアでオンプレミスにエージェントをインストールする製品だったと思うんですが、現在はクラウドサービスに移行しているということですか?
Hausman:PagerDutyのプロダクトは最初のバージョンからクラウドと接続する機能を備えていましたよ。またエージェントではなくてAPIを使ってオブザーバビリティのツールやSlackなどのコミュケーションツールと連携してそれらを束ねる役割のプロダクトになっています。それに加えてAIを使ったエージェントがより効果的にシステムの運用を助ける役割を担います。
Jones:SREのエージェントでは例えば、システムのオブザーバビリティデータからあるクラスターをスケールアップしたほうが良いといったケースにおいて、自動的にノードを追加してスケールアップすることを可能にします。AIを使ってSREを担当するエンジニアを助ける機能ですね。
自動でクラスターをスケールアップしてくれるのはありがたいですが、クラウドサービスという点ではそれによってコストが上がる、つまり追加したノードの分だけ課金されてしまうわけで、それはビジネスの文脈ではROIを見てから判断したいという場合もあるのでは? そういうことは可能なんですか?
Hausman:つまりクラスターをスケールアップする前に「これをやるとこれだけコストが発生しますよ」という情報を出して欲しいということですか?
むしろAWSならこれくらい、でもGCPやAzureならこれくらいのコストになります、というのを出してくれたらモアベターな気がします。
Hausman:その機能はまだ実装されていないですね。良いフィードバックだったと思いますのでメモしておきます。
実際にはFinOpsの発想ではパブリッククラウドのインフラコスト低減というレベルから、企業が使うSaaSに費やすコストも含めて支払っているクラウドのコストを可視化したいというニーズは高まっていると思うので、SaaSとしてサービスを展開するPagerDutyもその流れに乗って欲しいというお願いです。コストに関して言うとPagerDutyの価格というのはどうやって算定されるんですか?
Jones:それに関しては最近、価格を見直しています。ユーザー数やデータ量、アクセス数に従ってティアーを設定して、ティアーごとに価格が設定されています。ティアーの中であれば数が変わっても同じ価格ということですが、機能に関してはどのレベルでも使える機能を同じになるように変更しました。
つまりオープンソースのオープンコアモデルのように基本機能は同じ、でもエンタープライズ向けには機能強化がされていて機能が違うという発想ではなく、同じ機能でユーザー数が多いか少ないかで価格が変わるというものですね? それは素晴らしい発想だと思います。
Jones:そうです。企業の規模が変われば、使う機能も違うという発想ではなく、中小企業であってもエンタープライズが使う機能を必要であれば使うことができるように変更しました。
先ほどインシデント管理の説明の中で対応するスタッフが不在の場合にAIエージェントが自動で代理のスタッフに担当をスイッチする機能を解説してもらいましたが、日本では担当者を変えるというのは実際の業務の中では大きな変更で業務内容や企業によっても変わるかもしれませんが、あまり軽く考えないほうが良いように思います。つまり誰がこの担当変更を指示したのか? は責任問題になる可能性もありますから。人事のシステムと連携してその権限や経験を加味するという機能があれば良いとは思いますが。
Hausman:その機能ではそこまでの連携はしていないですね。でもAIエージェントはその担当者の属性を見て適切に変更を行うという機能ですが、言われたように権限などにも関係する内容だということは理解しました。
Jones:企業においては、いかにAIを使って業務を効率化できるのか? というのが今後問われてくると思います。PagerDutyはその業務がどのくらい企業にとって新しいものなのか? すでに繰り返し実施されているものなのか? といったレベルを設定して自動化を進めるようにしています。新しい業務、例えば新製品のキャンペーンを行う場合であれば、すべてを自動化せずに途中のプロセスで人が判断を行う、でも例年行われているような業務ではAIエージェントを使って自動化を進めるといった具合です。
デモではユーザーとAIとのやり取りはすべて英語になっています。IT関係のスタッフであれば英語でエラーメッセージをみるのもAIと対話するのも苦ではないかもしれませんが、ビジネスサイドのスタッフであればやはり日本語が必要だと思います。それについては?
Jones:日本語化に関しては今も継続して進めているところですが、今回、スマートフォンに対して日本語音声でメッセージを出力するという機能は追加しました。これで緊急のメッセージを日本語で聞くということは可能になっています。
最後にDatadogが「Datadog On-call」という機能を発表しました。これはオブザーバビリティの側からインシデント管理に拡張する試みだと思いますが、これについては? 彼らに「これはPagerDuty Killerなんですか?」と訊いたら否定はしませんでしたが。
Hausman:かれらのインシデント管理がオブザーバビリティの後付けなのは理解できますが、我々はもう15年以上インシデント管理をやっていますので、それに関してはそれほど心配していません。
短い時間ではあったが、架空の会社を使ったデモ動画を使って説明を行ってくれたHausman氏とJones氏だった。こちらの質問に対しその都度、細かくメモを取るJones氏は最後に「たくさんのフィードバックをくれてありがとう」と感謝を示してくれた。これまで多くのIT企業のVPにインタビューを行ってきたが、こちらの質問を細かくメモを取る人は非常に少ない。その真摯な態度にPagerDutyのまじめさが表れていると感じられた。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- オブザーバビリティのNew Relicが発表した新機能についてCTOに詳細を訊く
- PagerDutyをもっと使い込む コンテナ活用とAPIの利用例
- Observability Conference 2022、オブザーバビリティから組織、ルールを見直した事例を紹介
- Observability Conference 2022、TVerによるNew Relic One導入事例を紹介
- 企業のクラウドネイティブ化を実現するジールが考える「SRE支援サービス」の必要性
- システム運用エンジニアを幸せにするソリューションPagerDutyとは
- モニタリングシステム連携とインシデントの抑制
- Obervability Conference 2022、OpenTelemetryの概要をGoogleのアドボケイトが解説
- PagerDuty Tips(Terraform/オンコール通知/インシデント分析)
- PagerDutyのエスカレーションポリシーとサービス