Stanby Tech Blog

求人検索エンジン「スタンバイ」を運営するスタンバイの開発組織やエンジニアリングについて発信するブログです。

スタンバイの求人情報取込の仕組みを作り直した話 〜序章〜

f:id:stanbyblog:20220302101054p:plain

スタンバイの求人情報取込の仕組みを作り直した話 〜序章〜

求人情報を取り扱うスタンバイでは、2020年から半年がかりで求人情報取込の仕組みを更改しました。本記事では概要をお話をして、詳細についてはテーマ別に別記事にて掲載させていただきます。

スタンバイにおける求人情報取込とは?

当社サービスは全国の仕事情報から求職者のニーズにあった求人を提供するものであり、求人情報は全国の企業、求人メディア、サイトから収集をしております。「求人情報取込」は社外に存在する求職情報の収集、保管・整形、検索エンジンへのindexingの工程全体を指します。

f:id:stanbyblog:20220302100712p:plain

我々にとっては、求人情報は「商品」、求人情報の取込は「仕入れ」に当たるものであり、「求人情報取込」とはプロダクトの生命線に当たる重要な仕組みであります。
また広告(有料求人枠)により売上を立てており、広告への求人反映が利益の生命線になっております。

概要

2020年、今後のビジネス展開を踏まえたプロダクトマイルストーンを作成をするにあたり、現状システムプロダクトに存在するいくつかの負債が、ビジネス展開の律速になっていることが明確になりました。

すでに具体的な兆候が発生しておりました

  • 求人取込から広告掲載まで最大6-7時間かかる
  • 求人のフィールドを変更するのに1ヶ月かかった
  • 求人情報の論理的な破損が発生後、復旧までに1ヶ月かかった

これらの事例、システム構成、データ構造から導き出された最大の負債は、「求人・広告データが1箇所で保管されていることで、データの柔軟性、拡張性に問題が発生している」という点でした。言い換えると、求人、広告データが密結合しており、変更作業に対する影響範囲が計りしれず、変更にコスト・時間が非常にかかる状態になっておりました。

f:id:stanbyblog:20220302100736p:plain

シンプルなんだけど、拡張性がほぼなかったのが難点

私達が下した決断は、「求人取込直後の求人情報を構造化データとしてもつことで、目的別(広告、検索、分析、生データなど)用途に合わせたデータソースを持てるようにする」ということであります。

f:id:stanbyblog:20220302100753p:plain

最初は全部盛りで書いたけど、ここからいくつかの機能は断舎離されていきます

これを実現するため、本題でもある「求人データストア化PJT」が開始されました。

PJTメンバーとして寄せ集められた6名のチームビルド、方向性のすり合わせから始まり、約4ヶ月で求人データの構造化を行い(job-store PJT)、後に3ヶ月かけて広告配信の仕組みを全面更改しました(ad-store PJT)。

PJT完了後も、重複排除や審査機能の追加など、数々の機能を追加しており、成長可能なプロダクトとして生まれ変わることが出来ました。

本編では、以下の章立てを考えており、可能な限り詳細に求人情報取込のお話をさせていただきたいと思っております。

  • Part.1 課題感の確認から計画策定
  • Part.2 開発からリリースへ
  • Part.3 リリース後の話

積極採用中です

スタンバイのプロダクトや組織について詳しく知りたい方は、気軽にご相談ください。 www.wantedly.com