近年、テクノロジーの進化に伴い、私たちの生活やビジネスの基盤を支えるサービスの安定性がますます求められています。特に、クラウド勤怠管理システム「KING OF TIME」を提供するヒューマンテクノロジーズにおいては、その重要性が一層高まっています。日々、多くのユーザーが利用する中で、サービスが止まらずに稼働し続けることは、単なる運任せではなく、裏側での確かな努力と計画的な運営によって支えられています。
「KING OF TIME」のインフラを支えるサービス運用・セキュリティ運用プロジェクトは、勤怠サービスだけでなく、人事労務や給与サービスの運用にも対応するようになり、かつては社内IT業務も兼務していたチームから、専門性を高めた新しい体制へと進化を遂げました。多様なバックグラウンドを持つメンバーたちが集結し、互いの知見を活かしながら、サービスの安定性を確保するために日々奮闘しています。
実際、私たちが目指すのは99.9%以上のSLA達成という高い基準です。この数字を実現するために、メンバーは創意工夫を凝らし、各々の役割を全うしています。「KING OF TIME」が安定して稼働しているのは、そうした努力の結実であり、私たちのプロフェッショナルな姿勢そのものです。サービスが止まらないことは当たり前ではなく、それを実現するための努力があることを、改めて実感させられます。
このインタビューでは、どのようにして「止まらないサービス」を実現しているのか、その舞台裏に迫ります。今後も、ユーザーの期待に応えるために、インフラチームを深掘りしていきます。

#プロジェクトマネージャー
M.HAYASHI

#プロジェクトリーダー
S.MOTOKI

#メンバー
T.KATO

#メンバー
Y.TSUJI
プロジェクトの夜明け~インフラ専門組織立ち上げの経緯
――まず、インフラチームの体制について教えてください。
M.HAYASHI: インフラチームは古くからある組織ですが、現在の体制になるまでにはいくつかの変遷がありました。当社のプロジェクト制が発足する前は、「KING OF TIME 勤怠管理」のインフラを見つつ、社内IT業務も兼務するチームでした。最初のメンバーは私を含めて3名でした。今では考えられないですね。
プロジェクト制が発足した2022年頃からは社内IT業務も離れ、KING OF TIMEシリーズ製品のインフラ周りを担当するプロジェクトとして独立しました。2023年から「KING OF TIME 勤怠管理」だけではなく、すべてのシリーズ製品のインフラを管理しています。プロジェクトメンバー全体としても12名ほどになりました。現在はプロダクト単位でメンバーが割り振られております。
T.KATO:私は「KING OF TIME 勤怠管理」のインフラをメインで見つつ、勤怠サービスに関するISMAP登録に向けての活動に従事しています。S.MOTOKIは「KING OF TIME 人事労務」を選任で見ており、Y.TSUJIは「KING OF TIME 給与」のインフラを見ていますね。
他にも当社では「KING OF TIME データ分析」や開発中の新サービスなどもありますので、それぞれのサービスに2~3人のメンバーがついております。
――それぞれのキャリアについて教えてください。
S.MOTOKI:私は一貫してインフラエンジニアとしてキャリアを歩んできました。前職は中小企業のSIerにてお客様のネットワーク・サーバ構築やシステムをAWS上に構築する業務を行っていました。SIerという性質上、構築して終わるケースや運用も簡易な一次対応のみだったんです。システムを運用していく上で、障害対応やアーキテクチャーの変更を検討できる立場になりたい気持ちが芽生え、転職活動を始めました。
AWSを扱う事業会社を探す中で、「KING OF TIME」を前職で使っていたこともあり、利用者として経験があるサービスかつ、AWSも扱え、フルリモートが可能という自身の希望がすべて叶う選択肢であったため入社を決めました。

Y.TSUJI:私も一貫してエンジニアのキャリアですが、1社目ではシステム開発を担当しておりました。前職では、小売系のシステム子会社にてインフラエンジニアとして従事。おそらくこれを読んでいる皆さんも使ったことがあるようなシステムの基盤を担う仕事は、やりがい的にも技術的にも私の志向性にあっていたようで、5年ほどキャリアを積む中で、さまざまなシステムの構築・運用手順をこなし、インフラエンジニアとして新たなステージに挑戦することにしました。それがヒューマンテクノロジーズでした。
前職のようなSIerとは違い、自社開発のため、よりいっそうの裁量が持てること、これまで携わってきたアーキテクチャと親和性があったこと(逆に言うと、SaaSでは類を見ない、大規模流通システムとひけをとらない構成ということ)、そして何より社内のやわらかい空気感がポイントで、ここでなら最前線に身を置けると考えたのです。
――実際に入社してギャップはありましたか?
S.MOTOKI:ギャップなどはなく、当時、やりたいと思っていたことは実現できていると感じています。面接時から強い希望としていたAWSに携わることができましたし、以前は触れることのなかったAWSのサービスや障害対応の切り分け方法の会得することができました。また、当社の資格取得支援制度も利用してAWS関連の資格を複数取得することもできましたね。
Y.TSUJI:当社に入社をして、特に一つのシステムに深く関わっていくことで、得られる知識や経験は本当に大きいと感じています。
それに、当社ではトレンド技術を取り入れていることも、入社して良かったと思うポイントの一つです。実際に取り入れているトレンド技術の例を一つあげると、インフラのコード化ですね。誰が同じ作業をやっても同じものが出来上がるという、平準化を行っているんですけれども、そういった取り組みは前職では行われていなかったので、新鮮な気持ちでいますね。
M.HAYASHI: 私が入社した頃はまだ「KING OF TIME 勤怠」の環境もオンプレミスだったので、コード化をすることができなかったんです。その後、AWSへ移行して、コード化ができるようになりました。S.MOTOKIやY.TSUJIがジョインしてから、私ではやりきれなかった部分をコード化してもらって、現在は整ってきましたね。

――T.KATOさんは当社でインフラエンジニアとしてジョブチェンジをされたんですよね?
T.KATO:そうですね。私自身は、2018年7月に入社し、カスタマーサポートとして、お問い合わせの対応を経験後、現場を回すSVを務めていました。ですから、エンジニア自体は未経験だったんです。
ジョブチェンジの1番のきっかけは2020年から並行して、SLA/BCP策定プロジェクトのプロジェクトリーダーも兼任したことでした。ここでは、ヒューマンテクノロジーズとしてのサービスレベルを定義すべく、インフラエンジニアにも参画してもらってテクニカルな視点も取り入れて議論を重ねていきました。
そういったプロジェクトの活動をしていく内に、端からは日の目を見ることが少ないけれども、「問題なく使える」状態を維持し続けるというインフラ技術に強く興味を惹かれたのです。こうして、2021年4月より、サポート出身のインフラエンジニアとして「KING OF TIME」の基盤に携わるようになり現在に至ります。
――最初はどんな勉強から始めたんですか?
T.KATO:最初は、仕組みとコマンドを覚える必要があったので、Linuxの勉強から始めました。テキストと問題集を片っ端からやって、過去問をほぼほぼ覚えるくらいまで勉強しましたね。
実際にチームに参加してからも、みなさんとの会話の中で自分がまだ知らない領域の話題がたくさん出てくるんです。そのため、今でも公開されてるAWSの技術仕様書をひたすら読み込んだり、AWSのドキュメント内でわからないことがあれば、わからない単語を全部引っ張り出して、深掘りして、理解して……という繰り返しですね。もう1000本ノックです(笑)

プロジェクトの特徴~フルリモート下でのコミュニケーション
――エンジニアはフルリモートで勤務をされていますがどのようにコミュニケーションを取っているんでしょうか?
S.MOTOKI:毎日の朝礼と、週に1回の定例でオンライン上ですがプロジェクトメンバー全員で顔を合わせています。朝礼ではそれぞれが担当している業務内容を報告し合っていますね。定例でも相談事項や情報共有などを行っております。
あとは朝礼の他に、任意の雑談タイムを木曜日に入れてるので気が向いた人が集まる感じですね。雑談タイムに参加していなくても、作業のついでに雑談をすることもあるので、コミュニケーションは取れているかなと思います。
M.HAYASHI:プロジェクト全体として年齢や社歴に関係なく意見を言い合える環境だと思います。メンバーは仕事を進めることに真摯に向き合ってくれているので、コミュニケーションロスを感じることはないですね。
「こうしたほうがいいんじゃないか?」という意見もお互いに言いますし、若手メンバーがベテランメンバーから頼られるような場面も各メンバーにありますね。
Y.TSUJI:リモートワークの環境下ですが、コミュニケーションのストレスはないですね。入社して3年経った今でも、勤怠サービス固有のあれやこれやはわからないことも多いのでそれをM.HAYASHIやベテランの皆さんに聞くことはありますね。勤怠の仕組みがなぜこのようになっているのか、というお話をしていただくことは多いかなと思います。
またM.HAYASHIをはじめとするベテランの皆さんは障害などが起きた際に、いち早く何があったかを見て、対応してくださるんですよね。こういう風に対応をしていくんだっていうのを背中で見せてくれるのはやっぱり尊敬できるところですね。
プロジェクトで結実した成果~障害頻度の少なさ
――KING OF TIMEの安定稼働の秘訣はなんでしょうか。
M.HAYASHI:優秀なことに当社のサービスは大きな障害が発生する頻度が非常に少ないと思います。前職と比較しても少ないと言ってくれているメンバーも多いです。
大前提として、障害が少ないと感じるのは、利用者から見たときに障害が起きていることが見えないように準備をしているからです。そして、実際に障害が起きたときには、障害が起きそうなポイントを監視しています。何か異常が起きるとSlackに通知が届くので、その後、何が起きているのかを調査し、どう対応するかを考えます。調査をした結果、適切な対応を施して、状態を回復するというのがおおよその流れです。
あとは障害が起こりそうなものと、状態を引き起こす原因についてはある程度事前にわかっていますね。例えば、ハードディスクの容量が減ってきている場合は、不要なファイルを削除するかどうかを検討するであったり、「ここが応答していません」というアラートが出た場合は、応答しているプロセスやサービスを確認し、正常に動作していなければ再起動するとか。
ただ大事なのは「なぜそのような問題が発生したのか?」を特定し、安定した稼働を保つことなんですよね。止まらないサービスを提供し続けるためには、同じ問題が再発しないように対策を講じる必要があるので、問題が発生した原因や再発防止策までを含めて調査を行っています。
――では、現状の課題はなんでしょうか。
M.HAYASHI:私たちの課題は、創業期から参加しているベテランメンバーの感覚に頼っている部分を数値化し、基準化することです。手順に落とせる内容についてはある程度進んでおり、業務を分散させる取り組みも進展していますが、データベース周りの基準化にはまだ課題が残っています。
例えば、リリース作業において開発チームから上がってくるインフラデータベースの内容と、私たちが考えていた変更をリリース日に適用する必要があります。現在は、開発チームからのデータベース変更の監修をベテランメンバーが行っていますが、メンバー全体として開発に関する理解が不足している部分があります。データベースのリクエストやSQLの経験がないため、それに対処できないことが課題です。
そのため、各メンバーがデータベースの専門性を高め、チーム全体の効率性向上を目指しています。また、開発の知見を持つ方の採用も継続しています。

プロジェクトのこれから~止まらないサービスを提供し続けるために
――これからの展望について教えてください。
S.MOTOKI:現状に満足せず、サービスをより良いものにしていきたいと考えています。運用しているサービスの課題や改善できる点はいくらでもあります。それらの改善案については基本的に取り入れでもらえる風通しの良い風土があると感じています。
また入社3年目からはサブプロジェクトリーダーを任されるようになり、担当するシステムが「KING OF TIME 勤怠管理」以外も増え、他プロジェクトとの連携が増えました。以前は自分のチームメンバーと接することが多かったのですが、現在は複数のサービスを担当することで様々な職種の方とお話する機会が増えました。エンジニア間では通じる用語や現状を営業の方やサポートの方がわかりやすく、その先のお客様に届けるかを意識するようになったと思います。今後もこういった新しい気づき、スキルを身に着けていきたいです。
Y.TSUJI:新しい知識・技術を吸収し、成長につながる仕事に積極的に取り組んでいきたいです。最新のトレンド技術を追いかけて、それらを活用して、社内のシステムに還元できるような取り組みをやっていきたいと考えています。現在のトレンドでは、コンテナ化やインフラのコード化などが注目されていますが、できるだけ自動化し、人の手をかけずに自動化することが求められてくると感じています。
また当社では勤怠管理以外にも人事労務や給与、データ分析など、いろいろな製品があり、かつ、新サービスも今後増えていくので、新規にインフラの立ち上げから関わっていけるのは大きな魅力です。責任はそれに伴い大きくなりますが、0から1にできるスキルを身につけて、挑戦していきます。
T.KATO:正直に言うと、まだインフラエンジニアとしては3年目なので、新しいことに追われている日々です。今後の目標は、何かしらの問題が起きた時、即座に解決できるだけの知見と経験を積み、今先輩たちで回しているトラブルシューターの一員になりたいと考えています。
そのうえで明らかに自分に足りていないのは、問題発生時の原因の探り当て方です。数値の監視についても、常に見ているからこそ、いつどこでどんな変化が起きたかに敏感になれるわけです。実務経験に裏付けられた勘所というものがたしかにあると、先輩たちを見ていると痛感します。一朝一夕では身につかないものですが、少しでも早くキャッチアップすべくアンテナを伸ばしていきます。
M.HAYASHI:今後の展望については、まだ具体的にまとまっていない部分もありますが、プロダクト特化型の体制から、ネットワークやデータベース、アプリケーションサーバーなど、専門的な役割を持つチームへと進化させていくことが理想的かもしれません。このようなカテゴリー特化の体制に移行することで、より効率的かつ柔軟な運用が可能になるのではないかと考えています。もちろん、それには多くの挑戦が伴いますが、私たちの目指す「止まらないサービス」を実現するためには必要なステップです。今後も試行錯誤をしながらインフラチームのメンバーと共に、さらなるサービスの向上を目指していきたいと考えています。
このチームで一緒に働いてみませんか?
サービス運用・セキュリティ運用(Service and Securilty)で募集中の求人は下記になります。