2000社が利用するSaaSを安定運用させる「仕事を減らす仕事」。

Interviewee

高橋 佳朗

大久保 智之

新井 健

安里 昌樹

2021.7.26

「運用保守」と聞くと、どのようなイメージが浮かびますか?プロダクト本部SRE部で部長を務める高橋は「とにかく泥臭い」と即答しました。そんな泥臭い仕事の数々を、どうすればクオリティ高く続けられるのか。悩む企業は多いかと思います。カオナビは、単なる運用保守に留まらず、プロダクトの成長をインフラからより力強く支援するため、Googleが提唱している「Site Reliability Engineering(SRE)」という考え方を取り入れ、チームを作ってきました。

SREは「インフラ運用にソフトウェア開発の思想を持ち込むこと」と言いかえることもできます。“裏側の泥臭い仕事”を“前向きに発展させる仕事”に変えてきた軌跡を紐解くべく、中心となって活動しているメンバーが集結。カオナビのインフラ開発の軌跡と思想について、多方面から深掘りします。どんなメンバーが、どんなチームとして働いているのでしょうか?じっくり皆さんからお話を伺いました。

「自動化・効率化」の徹底が、SaaSをネクストレベルに押し上げる

「SRE」を冠した組織は、日本ではまだそれほど多くないのではないでしょうか。まずはどんな経緯でSRE部ができたのか教えてください。

高橋

最初に組織として保守や運用を担うようになった時は「第二開発チーム」という名前で、外から見たら何をしているのかわからないようなチームでした。当時からシステムやサイトの運用をメインでやっていたのですが、徐々に「プロダクトのインフラ」としてちゃんと見たほうがいいということになり、3年前くらいからSREグループ(現SRE部)という名前に変えることにしました。

背景としては、運用や保守っていう仕事に対するイメージを変えたいという考えがありました。正直、「泥臭く、地味で大変な仕事が多いからやりたくない、あまりスマートじゃない、売上に直接つながらない」といった印象を持たれることも多いんです。でも、どうせやるならもっと前を向いて、先に進めるようなチームにしたいなと思っていて。当時すでにメルカリ社やスマートニュース社などでも使われ始めていた「SRE」という考え方に共鳴をして名付けました。

SREとは、Google社が提唱し始めた考え方で、サービスの信頼性や安定性を保つためにどうするのかを考えて実践することです。特に重要な考え方は「効率化・自動化すること」。つまり、人の手をなるべく介さないようにすることを通じて、サービスの信頼性と安定性を保ち、プロダクトの価値をお客様に提供し続けられるようにしようとしているんです。

プロダクト本部SRE部
部長
高橋佳朗
モバイルコンテンツやスマホアプリ(ゲーム)業界でサーバーサイドエンジニアとして開発に従事。2015年7月、10人目の社員としてカオナビに転職すると、エンジニアとしてフロントにバックエンドに広く担当。開発組織の立ち上げやマネジメントまで推進。SREグループの立ち上げも主導。

キーワードは「自動化」なんですね。SREという考え方について、メンバーのみなさんはどのように感じていますか?

新井

保守とか運用って、言葉を選ばずに言えば、面倒くさい作業ばかりを担当するところですよね。なので、サービスの規模によってはほとんどやっていなかったり、担当者を置いていなかったりする会社もあります。

なぜ私たちがこうして人数をかけてやってるのかといえば、サービスが止まってしまうことで利用しているお客様の企業の仕事に大きな影響を及ぼす、という意識を強く持っているからです。何かが起きた時に即座に対応できるように、普段の定型的な業務を自動化させることが非常に重要だと考えてやっています。

また、プロダクトが大きくなってアクセスが増えてきたときに、クラウドサービスとしてどのように耐えるか、サービスの信頼性・安定性の担保をどのような手段で実現するかを考える挑戦は、とても面白いですね。実際、カオナビは2,000社以上のお客様にご利用いただけるほど成長してきています。

日々のマネジメントや社内コミュニケーションで利用いただくSaaSプロダクトなので、アクセスできないなどお客様がカオナビを使えない状態になると私たちの提供価値がゼロになります。だからこそ、安定性を担保することは、絶対にないがしろにできない、大事な役割だなと感じています。

逆に言えば、安定させることでその価値は確固たるものになり、次のレベルのプロダクトに進化していくとも言えるのではないでしょうか。

カオナビの開発組織について。カオナビのプロダクト作りに関わるエンジニアは「プロダクト本部」に在籍し、さまざまなかたちで開発を担っている

とても重要な役割ですね。インフラグループでは具体的にどんなお仕事をしているのでしょうか?

新井

基幹プロダクトであるタレントマネジメントシステム『カオナビ』自体の、既存システムの保守やアップデートを常に行っています。また他にも、自社のオウンドメディアを新しく立ち上げようとしていて、そのサーバーを準備するといったインフラ構築をしています。

プロダクト本部SRE部
インフラグループ
新井健
ソーシャルゲーム運営会社など複数社で、アプリケーション開発やインフラ運用など幅広い経験を積んだ後、2020年1月にカオナビに入社。インフラエンジニアとして専任で担当するのはキャリアの中で初。

安里

私は最近は、一言でいうと、オペレーショングループ(*1)が楽になるための仕事をしています。メンバーが毎日何件もこなしているシステムのアップデートをする上で、当たり前に行っている手作業の時間を減らそうとしているんです。どう自動化して工数を圧縮するか、また、それでも発生してしまうミスをいかにして漏れなく発見するか、などを徹底して追及しています。

最近で言えば、リリースの手作業を地道に少しずつ自動化させることができてきましたし、確認すべき事項に不備があったら自動で通知されるような機能も追加しました。時間だけでなく心理的な負担を減らせるように、自動化・仕組み化を積極的に行っています。

*1:SRE部内に設置される別のグループ。新機能のリリースや不具合の修正といったアップデートを、本番環境に書き込んでリリースするといった役割を担う

プロダクト本部SRE部
インフラグループ
安里昌樹
新卒入社した企業ではコールセンターのオペレーター職を務めるも、ITバブルを目の当たりにしてキャリアチェンジを模索。プログラミングを学び、インフラエンジニアとして転職。その後、大小さまざまな規模の企業で開発経験を積み、2020年3月にカオナビへ入社。

高橋

オペレーショングループでは、一日数回、アップデートや不具合修正をリリースしています。そこに人為的な作業が関与すると、担当者の経験やスキルによってはミスが起きる可能性があるんですよ。そういったリスクを低減するために、人の手が入らないように作業を自動化・簡易化させていき、世の中にリリースする作業を安定化させることを安里さんや新井さんが担っています。

こういった、サービスの安定に直接つながる施策を打っていくことが、SREの主な活動のひとつですね。

大久保

自動化によってやらなくていいところを削ぎ落とし、やるべきことに時間を投じることができるようになります。「仕事を減らすための仕事」という感じですね、自分たちが要らなくなるのがベストみたいな(笑)。そうした動きを通じて、SREとしてプロダクト開発全体の生産性向上につなげていくことが大きなテーマだと捉えています。

プロダクト本部SRE部
インフラグループ
マネージャー
大久保智之
新卒入社先のSES(システム・エンジニアリング・サービス)事業を提供する企業や、MSP(マネジメント・サービス・プロバイダ)事業の企業で幅広くインフラ開発・運用を経験。2018年9月にカオナビに入社し、インフラ基盤の運用や保守、整備を一貫して担い、マネージャーに就任。

なるほど、お聞きしていると、みなさんインフラ開発の経験が豊富なのかなと感じたのですが、どのようなバックグラウンドをお持ちなのでしょうか?

安里

社会人としては、コールセンターのオペレーターとしてキャリアを始めました。ただ、当時はITバブルだったこともあり、後のキャリアをもっと広げたいと一念発起してインフラエンジニアにジョブチェンジ。ゼロから学びつつ、4社を渡り歩いて、前職では社員数10名ほどのスタートアップで“何でも屋”として働いていました。7社目として2020年にカオナビに入社し、現在に至ります。

新井

私も、安里さんと似ていて何社も渡り歩いてきたのですが、実はインフラエンジニアとしての勤務はカオナビが初めてなんです。前職ではソーシャルゲームの開発をするアプリケーションエンジニアとして働いていました。ただ、その中で少しインフラの構築に携わっていたこともあり、それが縁で2020年にカオナビへ入社しました。

大久保

カオナビが4社目です。最初はSES(システム・エンジニアリング・サービス)を主な事業とする企業に所属し、ほとんどの時間、顧客企業に常駐してデータセンターのシステムを運用したり管理したりする業務に従事していました。その後、MSP(マネジメント・サービス・プロバイダ)事業の企業に移り、ここでもITシステム基盤の運用を主に担っていました。2018年にカオナビにジョインして、インフラ周りをずっと担当しています。

高橋

私は在籍で言えば、カオナビが3社目です。1社目はガラケーの「着メロ」とか「きせかえ」といったコンテンツ作成をしている会社で、サーバーサイドエンジニアとして働いていました。その後、「時代はスマホアプリだ」となり、iPhoneやAndroidのアプリ開発をしていたんですが、事業買収があって開発チームごと別の会社にジョインすることになったんです。

そのままアプリ開発をしていましたが、新しい挑戦がしたくて、まだ創業期と言える2015年7月に、カオナビに入社しました。社員番号10番で最初からとにかく手を動かす開発エンジニアとして働き、数年経ってカオナビのメジャーバージョンアップがあった頃に、インフラも含めて開発組織全体を見直そうという流れになり、冒頭で説明したようにインフラチームを立ち上げて、今に至ります。

みなさん、ご経験は意外にもバラバラなんですね、共通点はあまりないのでしょうか?

高橋

新しくメンバーを迎える時は、それまでのメンバーとは違う新たな特徴を持つ人が欲しいと考えてきました。「何でもできる人」ももちろんウェルカムですし、一方で特定の武器を持つ人も大歓迎ですね。

自由度と裁量。インフラ領域も、個々の強みを存分に!

そんな多様なメンバーが集まるチームを、マネージャーとしてどのようにマネジメントしているのか、教えてもらえますか?

大久保

安心してチャレンジできる環境作りを意識しています。例えば新たな取り組みをするときって、安定稼働とトレードオフになることがあるんです。正直、外部環境が変わらなければ、システム上は何も変えないことが安定につながるのですが、リスクを多少取ってでも、チームとしての自由度を上げてやれることを増やしたい。そうじゃなければ、プロダクトの長期的な進化は望めないからです。

だからこそ、「事故につながりかねないような、本当にやっちゃいけないこと」はできない仕組みにしながら、新たなチャレンジを安心してできるようにしていきたいんです。そして、安定稼働とのバランスをどのようにとっていくかは、メンバーと一緒に考えて仕組みを進化させたいと思っています。

また、先ほどの自己紹介からも分かる通り、インフラグループには様々なバックグラウンドを持っている人たちが集まっているので、一人ひとりの強みを活かすことを念頭に置き、それぞれがうまく動ける環境づくりを意識していますね。

カオナビのミッションである「個の力にフォーカスしマネジメントを革新する」を体現している感じですね!例えば新井さんや安里さんの強みは、チームの中でどのように発揮されていますか?

大久保

新井さんはアプリケーションとインフラ両方の領域の開発を、ハイブリッドでできる方です。インフラエンジニアの多くは、アプリケーションレイヤーでなにか問題が起きても、詳細や根本の原因などをすぐには把握できません。けれど、新井さんの場合は前職までの経験を基に、そうした問題をいち早く拾い、問題を突き止めて報告してくれるので、そのレポートからスピーディーな改善につながることがよくあります。

安里さんにはインフラを中心に経験の幅があって、特に前職の小さなベンチャーでの勤務経験から、全体がよく見えているんですよ。これまでの我々では持っていなかったスキルを持っていて、とても助かっています。チームであまり試してこなかった施策や技術を使うという大胆不敵さも、魅力の1つですね。

ちなみに、先程から自動化や仕組み化などの話が出ていましたが、カオナビのバリューにも「仕組み化」が掲げられています。これは意識的に接続しているのでしょうか?

高橋

バリューとして掲げる以前の創業当時から「シンプル」や「仕組み化」といったことは社長が繰り返し話していたので、少なくとも私は無意識にそれを実践しているように思いますね。チームづくりの際にも、にじみ出ていたかもしれません。

大久保

私は事業会社とベンダーを行き来しながら運用に近い仕事をしてきたのですが、現場で良く感じていたのが、毎回同じことをやっている面倒くささ・まどろっこしさです。そういう時こそ「運用」のエンジニアリング、つまりはシンプルにしていくこと、仕組み化していくことが大きな効果を発揮します。

SREという考え方自体が、「ソフトウェアエンジニアが、システム運用をしたらどうなる?」というようなコンセプトで始まっているとも言えますから、繰り返しの業務をロジックに落とし込んで仕組み化することは、エンジニアリングという観点からは当たり前のことです。自分の仕事の仕方としても、普段から意識していることでもありますね。

インフラグループの意思決定はどのようにしているのでしょうか?

高橋

細かいことは現場レベルで考えてもらっています。もちろん、部長の私やマネージャーの大久保さんのところで、優先順位付けは行いますが、大きなテーマに対してどのように進めるかの裁量は、現場のメンバーに渡してしまっていて。「何が良くなるか」がわかれば基本的に良しとしています。

テーマは、例えば「機能リリースの仕組みを良くしてください」とか「カオナビのOSセキュリティーアップデートの仕組みをシンプルにしてください」とか。そこそこ粗い粒度でお願いしていると思いますね。実現方法は現場で考えてもらうことが多いです。

裁量権がある、ということですね。安里さん、新井さん、現場目線だと環境やマネジメントの仕方に対してどのように感じていますか?

安里

この規模感の会社にしては自由度が高いと感じていますね。「機能リリースの仕組みを良くしてください」と言われても、先ほど説明した「リリース時の手動更新を自動化する」という手段だけでなく、「今までより多い数のリリースを同時にできるようにする」とか「リリース実行に向けた社内調整フローをよりシンプルにする」といった手段もあるわけです。

いろいろと考えを巡らせたうえで、自分がやるべきだと考えたことを実行できて、ありがたいです。

新井

「課題をどう解決するか」に関する細かい制約はなく、スケジュール感も含めて裁量があるなと思います。なので自分が持つ強みが活かせている感覚もあり、弱みは他のメンバーにサポートしてもらいながら徐々にチャレンジしていっている感じです。

「武器」があれば、研ぎ澄ますことも、増やすこともできるのがカオナビの開発チーム

現場とマネージャーいずれのみなさんも、共通の課題意識に基づいて主体的に動いてきたことがよくわかりました。最後に、今後どんな人と一緒に働きたいかについてお聞きしたいです。

高橋

繰り返しになりますが、前提として得意領域で力を存分に発揮してほしいなと思っていて、その環境作りには力を入れています。その上で、サービスの成長に合わせてメンバーは増やしていこうと思っています。

今、インフラグループのマネージャーは大久保さん一人だけですが、今後はユニットに分けて大久保さんが見ている範囲を他の人に委譲したいと考えています。直近で採用したいと思っているのは、インフラエンジニアの素養を持ったプロジェクト進行の経験がある方。外部要件や今のインフラグループの実情を鑑みながら最適解を探し、進行できる方が、すぐに活躍できそうです。

大久保

例えば、弊社と同じようにSaaSのSREで働いている人はもちろん、SIerのエンジニアでプロジェクト管理などを経験してきたような方が合うイメージですね。

プロジェクト進行の経験から、視野を広く持っている方ということですね。さらに中長期目線で見たときに、一緒に働きたい人はどのようなイメージですか?

高橋

SREなので、サービスの信頼性や安定性を保つことをミッションとして持っています。そのために主体的にアクションを取れる人。信頼性や安定性の重要性をよく理解した上で、それまでのやり方を変えたり、自身の得意領域を存分に活かしたりできる人などはフィットすると思います。

もちろん具体的なミッションはその人次第でもありますが、インフラ周りに関する武器を持って、乗り込んできてほしいですね。武器があれば、縦にも横にもキャリアが広がると思っています。例えば安里さんだったら縦方向、つまり武器を研ぎ澄ます方向で、新井さんだったら横方向、つまり武器の数を増やしていく方向で活躍してもらっています。

カオナビでは、持っている武器をベースにキャリアを築いていけそうなイメージが湧きました。最後に、2~3年後のチームの目指す姿を教えてください。

大久保

みんながキャッキャしているようなチームですね。キャッキャというのはふざけたいとかじゃれ合いたいとかいうわけではなく(笑)、お互いを認め合いながら必要なコミュニケーションを取り続け、それぞれの強みを活かしながらチームとして課題解決をしていくイメージです。

とはいえ、たまには楽しいおふさげがあるくらいの方が、チームの雰囲気は良くなると思います。そういった意味でも、キャッキャしたチームにしていきたいですね。

カオナビの採用情報を知りたい方は

編集後記

「仕組み化」そして「シンプル」──カオナビのバリューが組織のミッションと直結していて、メンバー一人ひとりが当たり前に体現しているチームだと強く感じる取材でした。

クラウドサービスであるプロダクトの価値を担保し続けるという重要過ぎるミッションに向き合う日々を、笑顔で語ってくれた4人。「泥臭い」どころか「面倒くさい、まどろっこしい」というイメージすらある運用と保守の仕事において、安全性と挑戦のバランスをとりながら課題を解決していく。そんな特殊なチームです。

まだまだ日本では洗練されていないSREという思想。それを探求する場として面白い環境を整備し始めているのが、カオナビのこのチームだと言えるのではないでしょうか。

Share

Tags