株式会社LIFULL の技術ブログ

全652件

2020/11/02

Ltech#11 不動産領域のAI活用最前線〜初完全リモート開催〜　開催レポート

お久しぶりです、Ltech運営チームの秀野です！今回は、2020年10月29日(木)に開催した『 Ltech#11 不動産領域のAI活用最前線〜初完全リモート開催〜』についてレポートします！ Ltechとは Ltech(エルテック)とは、LIFULLがお送りする、技術欲をFULLにするイベントです。特定の技術に偏らず、様々な技術の話を展開していく予定です。今回はなんと、Ltech初のリモート開催です！インターネット万歳！！不動産領域のAI活用最前線記念すべき初リモート開催となる今回のテーマは、『不動産領域のAI活用最前線』です。LIFULLの社長直轄のAI部門であるAI戦略室のみなさんから、ディープな話をしてもらいました。 AI戦略室については、こちらの記事でも触れていますので是非ご覧ください。 www.lifull.blog それでは各発表のレポートです。ディープラーニングで間取り図を3Dにする【Ltech#11】ディープラーニングで間取り図を3Dにする from LIFULL Co., Ltd. 最初の発表は、「空飛ぶホームズくん」の裏側で間取り図を3Dにするアルゴリズムについてのお話です。「空飛ぶホームズくん」は、3Dの街を移動しながら気になる部屋の中を見ることができる VR x AI のプロトタイプアプリです。 japan.cnet.com 間取り図をディープラーニングを使ってセマンティック画像に変換し、そこからポリゴンデータを生成することで3D化していきます。セマンティックセグメンテーションのタスクで工夫した点として、壁/ドアなどの線と部屋をわけて処理する点があります。また、部屋をグラフ構造で持っていたり、非常に面白い内容でした。人の作った間取り図ですから、機械学習といえども人による地道な作業が必要なんですね。ドアのない部屋、不動産会社のロゴ入り画像、などなど色々あります… 余談ですが、長時間のアノテーション作業で身体を壊しそうだったけど、筋トレをしていたことで救われた話には感動しました！住まい探しにおける対話AIの自然言語解析技術【Ltech#11】住まい探しにおける対話AIの自然言語解析技術 from LIFULL Co., Ltd. 続いて、自然言語による物件検索・地域検索を目指して開発している自然言語解析器についてのお話です。対話形式で物件を探すため、会話を検索条件に落とし込んでいきます。形態素解析は行わず、シンプルに先頭から辞書を引いて解析しています。私もLIFULL HOME'Sのフリーワード検索で辞書を整備したことがありますが、画像解析の話と同じようにこちらも地道な作業が必要です。結果を見てみると、ルールベースでもそれなりの結果が出ているようですね。 Q&Aでは、不動産関係のコーパスがないという話も出ていました。 LIFULL HOME'Sの住まいの窓口というサービスでの対話を使えないかと思いましたが、センシティブな内容が多いので使うのは難しそうだな…と思い直しました。ガウス過程回帰を用いた広宣費予測と可視化【Ltech#11】ガウス過程回帰を用いた広宣費予測と可視化 from LIFULL Co., Ltd. 休憩を挟んで次の発表です。マクロな視点で広宣費を月あたりどれくらいかければ、目標を達成できるのかを可視化するツールを作成したお話です。今回の発表の中で、私が最も理解できなかった発表となります！難しいぶん詳細に発表して頂けました。ざっくり言うと予算とリターンを軸にした関数を知りたい、ということです。時系列予測のタスクを解くため、ガウス過程を使った回帰モデルを使っています。ドメイン知識を入れ込みやすい予測が分布で得られるので不確実性がわかる過学習しないと、いった特徴があるようです。私はチンプンカンプンだったのですが、発表後のQ&Aでは参加者の方からたくさんの質問があがっており、アンケートの結果などからも満足頂けたようで良かったです。 Kubernetesを利用した機械学習モデルの本番適用例【Ltech#11】Kubernetesを利用した機械学習モデルの本番適用例 from LIFULL Co., Ltd. 大トリは、少し趣向を変えてインフラも交えたお話です。 LIFULLではKubernetesチームが開発・運用支援ツール「KEEL」を作ってくれています。そちらを活用しながら、物件の「おすすめ順」生成に機械学習を活用しました。 www.lifull.blog 機械学習のモデルを運用する上で、最初の選択肢としてAWSのSageMakerを利用する方法もありますが、柔軟なAPIを提供するために前述の「KEEL」を利用しました。物件の検索結果を「おすすめ順」でソートするために、事前推論でスコアを検索エンジンに取り込んでおきます。検索エンジンへのデータ投入処理がこちらのAPIに依存している以上、大量のデータが投入された時の安定性が課題でしょうか。現在は、APIのスケールしきい値は小さめに、CPIリミットは大きめにすることで、負荷のバラつきにうまく対応しています。アフタートーク最後に、登壇者全員でざっくばらんにアフタートークをしました！コロナ禍が予測に与えた影響のような時事的な話題や、AI戦略室を有効活用してもらうために事業部側とどのように付き合っていくのか、など組織的な課題も聞けました。専門的な領域であるほど、その活用は難しくなっていきます。「AIコンサルタント」という職種を用意することで、ビジネスとの橋渡し役を置くアイデアは、今後AIの民主化を進め事業を加速してくれるだろう、と感じました。最後に Ltech では、LIFULLエンジニアが中心となって皆様の技術欲を満たすよう実例を交えた勉強会を開催しています。今後もLtechを積極的に開催していきますので、ぜひ気になった方は、connpassでLIFULLのメンバー登録をよろしくお願いします！ lifull.connpass.com

2020/10/19

自動テストの効果測定に使われるEMTEとは？

こんにちは！ LIFULLのSETエンジニアの Ruey です！今年の3月にISTQBの自動化エンジニア資格 CTAL-TAE (Advanced Level Test Automation Engineer)を取得しました。TAEの勉強で自動テストの効果を測るメトリクスが幾つかあることが分かりました。その中で工数を測るメトリクスをEMTE(Equivalent Manual Test Effort)単位で表現することが推奨されています。しかし、その時は説明を見てもこれに換算すれば何か嬉しいか分かりませんでした。ちょうどある開発グループで自動テストを導入する案件がありましたので、実際のプロジェクトでメトリクスを計測し検証してみました。様々な知見が得られたので、今回はこの単位の紹介と使用例を紹介したいと思います。目次はじめに自動テストのメトリクス EMTEとは EMTEを使って表すことができるメトリクス支援案件概要自動テストの導入目的テスト作業の効率化と工数の削減テスト作業におけるヒューマンエラーの排除品質の維持支援方法と内容結果検証と分析 EMTEに換算する実行時間を換算するメトリクスを換算する EMTE使う際の注意点工数と節約の費用対効果最後にはじめに SETチームはLIFULLにある他の開発チームの自動テスト導入支援を行っています。支援メニューは以下のとおりです：テストフレームワークの使い方紹介テストケース作成のサポート自動テスト環境構築のサポート自動テスト実装のサポート CI/CD構築のサポート自動テスト運用支援自動化関するその他の疑問の相談今回は依頼案件で構築した自動テストを使って、メトリクスを実際に測定して検証してみたいと思います。自動テストのメトリクス ISTQB CTAL-TAEのシラバスでは、自動テストのモニタリング、効率、効果を測るためのメトリクスとして以下が紹介されています。(細かい説明はシラバスを参照してください) External TAS metrics Automation benefits Effort to build automated tests 　⬅︎ 今回使うメトリクス Effort to analyze automated test incidents 　⬅︎ 今回使うメトリクス Effort to maintain automated tests 　⬅︎ 今回使うメトリクス Ratio of failures to defects Time to execute automated tests Number of automated test cases Number of pass and fail results Number of false-fail and false-pass results Code coverage Internal TAS metrics Tool scripting metrics Automation code defect density Speed and efficiency of TAS components 補足 : TAS(Test Automation Solution)は本文で「自動テスト」を表現しています。数は多いので、今回は特定のメトリクスのみ取ってみます。 EMTEとは EMTEはEquivalent Manual Test Effortの略で、いわゆる自動テスト全ケースを全て手動で行う場合の工数です。工数を測るメトリクスの単位として推奨されています。 EMTEは時間の単位として扱います。例：自動テスト実行時間→30分全ケースを手動で行った場合→180分であったとすると、 180分が1EMTE になります。自動テスト実行時間をEMTEで表すと 0.16 EMTE になります。 EMTEを使って表すことができるメトリクス EMTEは工数関連のメトリクスに使われており、下記の三つになります自動テストの構築工数（Effort to build automated tests）：自動テスト実行する環境構築、テストケース設計、テストケース実装などの初期コスト。自動テストの結果分析工数 (Effort to analyze automated test incidents)：自動テスト実行後の結果確認。Flakyのテストの再実行やデグレーションが発生しているとかの確認と分析などの運用コスト。自動テストのメンテナンス工数 (Effort to maintain automated tests)：自動テストのテストケースの修正やテストデータの整備などの運用コスト。これから支援案件で構築した自動テストについてこの三つのメトリクスを計測して、検証と分析したいと思います。支援案件概要まだ自動テストがないTチームに自動システムテストフレームワークBuckyを使ったE2Eテストシステムの構築を提案し、テストケースの選定戦略やテストケースの作成などの支援、またはメンバーにE2Eテストの知識やメンテナンスの方法を教えていきます。最終目標はSETチームの支援なしで自動システムテストが運用・保守される状態を目指します。自動テストの導入目的テスト作業の効率化と工数の削減テストを自動実行できれば手動で行っていたテスト工数を大幅削減できる。複雑なシナリオや準備に時間がかかってしまうテストも何度でも繰り返して実行することができます。テスト作業におけるヒューマンエラーの排除テスト作業の漏れや見落としを防ぎます。品質の維持障害になるとビジネスに多大な影響を及ぼす機能について継続的に自動回帰テストを実行することでソフトウェア（サイト）の品質を維持させます。リリース前にデグレを発見することで、素早く、絶えずソフトウェア（サイト）を改善を行えます。支援方法と内容週定例を開催：・定期的に相談できる窓口を作る・構築状況の共有・自動テスト知識の教育・ペアプロでテストケース作成と実装システム構築：・自動システムテストフレームワークBuckyの実行環境構築・構成や実行方法などを教える・CIとの連携設定結果検証と分析支援内容が無事に完了し、テストケースが自動で実行されています。リリースフローにも自動システムテスト結果の確認する工程を組み込むことで必ずチェックされる仕組みになりました。実行時間について：自動テスト実行時間は 531s 全ケースを手動で行う時間は 5650s ( 1 EMTE = 5650s ) EMTEを使って表すことができるメトリクスを使って分析します：メトリクス時間自動テストの構築工数 349200s 自動テストの結果分析工数 1800s 自動テストのメンテナンス工数 1800s 工数は時間を出しましたが、時間のみだと実際の効果が分かり辛い状態でした。 EMTEに換算する 1 EMTE = 5650s 実行時間を換算する自動テスト実行時間は 0.094 EMTE 計算式【 531 ÷ 5650 ≒ 0.094 】全ケースを手動で行う時間はもちろん 1 EMTE EMTEに変換したら、手動で実行する時の工数と相対的に比較できます。すぐに分かったことは二つあります。自動テスト実行時間は0.094 EMTE、手動テストの0.094倍の時間となりかなり効果がある一回の自動テスト実行は手動より0.906 EMTEの時間が節約ができる。計算式【 1- 0.094 = 0.906 】節約された時間を他の開発やテストに充てられるので、自動テスト還元効果になります。メトリクスを換算するメトリクス計算式 EMTE 自動テストの構築工数 349200s (構築工数) ÷ 5650s (1EMTE) 61.81 自動テストの結果分析工数 1800s (結果分析工数) ÷ 5650s (1EMTE) 0.32 自動テストのメンテナンス工数 1800s (メンテナンス工数) ÷ 5650s (1EMTE) 0.32 メトリクスから分かったことは、初期コストの自動テストの構築工数は一見自動テストを全て手動で行う場合の61倍大きい数字ですが、これは節約された時間で割ると 68回の自動テストが運用されれば、構築工数が還元されることが分かります。毎日実行で考えたら、二ヶ月くらいの運用でプラス効果になると思います。計算式：【自動テストの構築工数 ÷ 一度の自動テスト実行で節約できる工数 = 何回の自動テストで還元できるか】【 61.81 ÷ 0.906 ≒ 68.22 】さらに運用コストも考慮した場合、自動テストの結果分析工数と自動テストのメンテナンス工数が毎回発生するとは限りませんが、仮に毎回両方発生しても節約時間を超えていないので、自動テストはマイナス効果が出ないと思います。判定式：【一度の自動テスト実行で節約できる工数は結果分析工数とメンテナンス工数の和より大きいのか】【 0.906 > (0.32 + 0.32) → True 】 EMTE使う際の注意点自動テストは実行すればするほど節約された時間として還元されますが、通常の運用以外の実行では還元されません。例えば開発フローにおいて1リリースに対して1回自動テストを実行する運用（通常の運用）なら、この1回の実行が節約された時間として還元ができます。それ以外の再実行などは最初のテスト結果と同じなので、テスト自体の効果はなく節約された時間として還元できません。参考記事： Automation benefit measured by EMTE - good or bad? 工数と節約の費用対効果先の節約時間と還元を図にすると、費用対効果がより分かりやすく表示できます。 (仮で毎回発生)運用コスト + 初期コストと削減工数初期コストと運用コストを計算すると自動テストが233回運用されれば、工数が還元されます初期コストと削減工数初期コストのみ計算すると自動テストが68回運用されれば、工数が還元されます最後に EMTEを実際に使ってみたら、自動テストの効果が分かりやすく伝えられることがわかりました。自動テストはよく初期導入コスト、学習コスト、運用コスト、メンテナスコストが高いから導入しないことが多いですが、どのくらい高いのかはあまり具体に表現できないケースが多いです。それは普段の工数は時間で表現していますので、長いか短いのかが分からないためです。EMTEで換算すれば手動で実行する場合と相対的に比較できるので、実際に自動テストは消費した工数より、プラス効果になるのかがすぐ分かります。もしくは何回分の実行で初期コストの還元の目標を立てて、自動テストの実行時間を逆算し、導入したい自動テストが目標時間に満たせるかの判断材料としても使えるかなと思います。みなさんも是非EMTEをご活用していただければと思います。

2020/10/16

物件更新情報LINE受け取りの個人情報扱いについて

こんにちは！ LIFULLのエンジニアの孫です。メールやLINEを利用した開発作業をメインにしています。今回は自分が担当していた物件更新情報LINE受け取り機能の仕組みについて紹介したいと思います。物件更新情報LINE受け取り機能とは LIFULL HOME'Sに掲載されている新築マンションでユーザが希望した物件の情報が更新された際にLINEに通知がくる機能です。 ▼物件更新情報LINE受け取り機能紹介ページ https://www.homes.co.jp/smp/mansion/shinchiku/line/update-message/about/ ユーザが求めている情報をより早くより近くに届けるための施策となります。この施策を進める中で一番気を付けていたLINEから受け取る個人情報の扱いがキーになっていたのでその個人情報の扱いを中心にどういう仕組みで開発していたのか記載していきます。処理概要機能紹介ページに記載されているステップの裏側で動いている処理を簡単に記載しますと以下の流れになります。全体の構成図 ※LINE User IDとは各LINEチャネルでユーザを識別するための識別子。構成的にLINEユーザ情報を各システム間で連携する必要だったため機密チームと綿密に相談しながら考えた上、上記のような構成になりました。詳細は以降述べます。 LINEログイン認証機能の仕組み ▼LINE側の処理については以下を参照ください。 https://developers.line.biz/ja/docs/line-login/integrate-line-login/ AWS KMS、ElasticCached利用について現状LINE User 情報を連携する方法としてAWS KMS、ElasticCacheを利用しています。呼び元にPOST APIを用意し直接更新処理を叩くのも可能でしたが、今後の拡張性を考慮すると当機能を呼び元に属しないものにする必要がありました。なので許容されたIPのみで利用できるGET API用意し、呼び元からはキーにて暗号化されたLINE User 情報を取得・複合化することで独立的で安全に個人情報を連携できる仕組みになったと思います。 Marketing Cloud 配信処理について Marketing Cloudとは Marketing Cloudはセールスフォースが提供するMAツールです。メールやLINEへの送信自動化や分析する処理を比較的に簡単に作れます。 www.salesforce.com 処理内容 Marketing Cloudではデータを外部からファイルで連携のためにSFTPサイト、SafehouseとGPG暗号化方式などを提供しています。 ※Safehouse とは認証されたユーザのみがアクセスできるファイル保存場所です。アクセスユーザはMarketing Cloudとは個別で管理されています。 help.salesforce.com なのでAutomation（Marketing Cloudで言う一連の自動化処理）を作成する際、連携されたGPGファイルをSafehouseへ転送、GPG複合・解凍行うことで個人情報へのアクセスをできるユーザを最大限制限しています。まとめ現状この仕組みは「物件更新情報LINE受け取り機能」で使っていますが、他にもLINEを介してユーザへ届けるべき情報があれば活用できるものにしていると思いますので今後、利用される施策が増えていくように頑張りたいです。また、LIFULLではエンジニアメンバーを募集しております！ご紹介のミッションを担当する求人です。ご興味ある方は是非ご応募ください！ https://hrmos.co/pages/lifull/jobs/010-0030 hrmos.co

2020/10/15

社内でAI成果展示会を開催しました

みなさま、はじめまして。AI戦略室の嶋村です。我々AI戦略室では、機械学習・深層学習・数理最適化・時系列解析・画像処理・自然言語処理などの技術を活用した様々な研究開発プロジェクトを推進しています。私はそれらのプロジェクトを統括する研究開発マネージャの立場にいます。今回、LIFULL全社に対して研究開発成果を大々的に公開する『AI成果展示会』を開催しました。その目的や内容、どのような反響を得たのか、皆さまにご紹介します。 AI戦略室とは？はじめに、AI戦略室について簡単に紹介をさせて下さい。 AI戦略室は、2018年に設置された社長直轄のAI部門です。『創造と革進で喜びを届ける』というビジョンを持ち、LIFULLが持つ様々なビッグデータにAI技術を活用し、新体験につながるサービスを創出することを目指しています。将来的な競合他社との差別化を見据えた『AI技術シーズの創出』と、短中期的な事業貢献につながる『AI技術シーズの活用』の、2つのミッションを持ち、AI技術をビジネス実装するべく日々研究開発に取り組んでいます。組織の設置から早2年が経とうとしており、最初は少人数で始まった組織も、会社とともに成長を続けています。最近では、日本語がネイティブ並みにペラペラな多国籍のメンバも在籍しています。メンバそれぞれの個性や強みを最大限に活かせるように、以下の3つの役割を設定しています。これらの役割同士で円滑に連携することで、研究開発を加速させています。 AIコンサルタントビジネス課題を抽出して、チーム内で連携することにより、ビジネス課題の解決まで推進する役割データサイエンスエンジニアビジネス課題から技術課題を抽出して、課題解決のための技術を開発し、効果検証して導入を促進する役割 AIエンジニアビジネス課題に適した技術を選定し、実サービス上で、実運用に耐えうるシステムを開発する役割さらに、社外との連携も深めており、同分野で著名な方々とも協業させていただいています。日立製作所社　フェロー　矢野和男氏（ AI戦略室エグゼクティブフェロー）シンギュレイト社　Chief Scientific Officer　鹿内学氏（ AI戦略室データサイエンスパートナー）人工知能学会　編集委員長　清田陽司氏（AI戦略室主席研究員）以上の体制で研究開発に取り組んでいます。最近の研究開発成果を少し紹介すると、例えば『 VRで「したい暮らし」探しを実現するAndroidアプリ「空飛ぶホームズくん」プロトタイプを不動産テックEXPO（大阪）で公開』への貢献があります。こちらは深層学習を活用し、間取り図画像から3D表示用ベクトルデータの自動生成システム部分を我々AI戦略室が実装しました。 AI成果展示会さて、本題である、AI成果展示会に話を移します。まず、AI成果展示会の目的に触れます。一般論になりますが、研究開発組織はコストセンターになりがちで、事業部と距離が遠いことも珍しくはありません。もしそのように認識され続けると、いずれ組織が解体される恐れもあり、それは会社全体の弱体化につながります。そのため、研究開発組織が近視眼的に売上や利益ばかりを見る必要はないものの、会社全体に対してどのような貢献をする組織なのか、自身でしっかりと認知し、その成果が会社の貢献につながると認知してもらう必要があると考えています。そこで、AI戦略室の活動や成果を認知してもらい、組織のプレゼンスを向上させ、社内で円滑に連携できる関係性を作り新たなサービスの共創につなげるために、AI成果展示会という形で社内に発信する場を設けました。AI成果展示会の開催後に成功したイメージを明確にするため、以下のスローガンを設定しました。活動の意義を認めてもらう（全社員に）投資したいと思ってもらう（経営層に）活用したいと思ってもらう（実サービスで）この展示会の運営チームは、新卒を含む若手中心で形成しました。それは、新卒のメンバはまだ配属されて数ヶ月ですが、「運営チームの活動を通じて組織全体の活動が俯瞰して見えること」「先輩社員とのコミュニケーションが活発になり組織強化につながること」「重要な役割を持ってもらうことで貴重な経験を積み今後の推進も期待できること」などの面で成長してもらいたいと考えました。こちらの運営チームの奮闘により、部署内のメンバが一丸となって進められたと思います。今回は「目玉企画となる招待講演」と「各メンバのプロジェクトのセッション」を行い、合計19件の発表を行いました。目玉企画となる招待講演は、データサイエンスパートナである鹿内さんに『AIって何？研究開発って何？』というテーマで話していただきました。AI技術の最近の動向や、AIが何をしているのか、AIの基本的な用語について説明があり、社内での理解が深まったのではないかと思います。さらに、研究開発の難しさや特徴、研究開発組織との連携方法や信頼関係構築の重要性など、ピープルアナリティクスの専門家としての意見も大変参考になりました。『AIって何？研究開発って何？』データサイエンスパートナ鹿内学招待講演に続いて、パネルディスカッションを開き、『研究開発と技術開発の共通点は？違いは？〜シナジーを生み出すために』のテーマついて座談会がありました。研究開発と技術開発の共通点や相違点について意見が交わされ、研究開発組織であるAI戦略室が他部署からどう見えるのか等、我々にとっても興味深い座談になりました。『研究開発と技術開発の共通点は？違いは？〜シナジーを生み出すために』データサイエンスパートナ鹿内学　×　 CTO長沢翼　×　ジンジニア木村修平「各メンバのプロジェクトのセッション」の一例として、LIFULL HOME'Sでの物件レコメンドに関する発表を紹介します。この発表は、不動産情報サイトであるLIFULL HOME'Sにおいて、よりユーザに魅力的な物件を提案するためのレコメンドアルゴリズムを開発した取り組みです。発表者はデータサイエンスエンジニアとして仮説検証しながら、率先してシステム開発もした良いプロジェクトですので紹介しました。下図に示すように、機械学習モデルをプロダクトで活用する際の流れが示され、モデル開発・システム開発・実証実験（A/Bテスト）のそれぞれの段階での工夫について発表がされました。図の通り、現在はA/Bテストを繰り返してより良いレコメンドアルゴリズムを開発しており、本運用で稼働できるように日々仮説検証を進めています。これらの発表の一部は弊社エンジニア向けイベントである Ltech でも10月後半に発表予定ですので、ぜひご参加いただければ嬉しいです。以下の発表が行われます。深層学習を用いた間取り図画像の解析広告宣伝費最適化機械学習を活用したレコメンド自然言語処理による対話文章解析これまで写真でご紹介した通り、Zoomを活用してオンラインで開催しました。前回は半蔵門本社でポスターセッションを行い、リアルなフィードバックを得ることができたのですが、今は新型コロナウイルスの影響下のため開催方法には悩みました。弊社では9月30日は期末の多忙な時期なのですが、しっかりと我々の成果がお伝えできたのではないかと思います。また、もっと他部署の社員が気軽に参加でき、有意義な意見交換ができるようにする必要性も感じたため、次回はより良いやり方を模索していきたいと思います。おわりに以上がAI戦略室によるAI成果展示会の開催レポートです。いくつか課題は見つかったものの、AI戦略室が一丸となり、期の締めくくりとして盛大にAI成果展示会を開催できて嬉しいです。10月からの新たな期もどんどん研究成果を出していきたいと思います。今後は社内だけでなく、社外での発信も増やしていきたいと考えています。その際は是非みなさまにもAI戦略室からの発信を届けられればと思います！また、LIFULLではメンバーを募集しております。AI戦略室でAIエンジニアも募集予定です！カジュアル面談もありますのでご興味ある方は是非ご参加ください！ hrmos.co

2020/10/14

LIFULL社員の自宅をスマートホーム化するハッカソン「おうちハック」を実施しました

こんにちは！クリエイターの日運営委員の松岡です。みなさんは「スマートホーム」という言葉をご存知でしょうか？例えば「家に近づくとエアコンが自動的に起動する」「音声でテレビを操作できる」など、スマートホームとは、様々なデバイスをインターネットに繋ぐことで便利な生活ができる家のことを指します。 LIFULLではコロナの影響もあり在宅ワークが基本の状態になっており、自宅の生活を豊かにする需要が高まっています！そこで「クリエイターの日」のイベントの一環として「おうちハック！」と銘打って最新のテクノロジーを用いたオンラインハッカソンを開催しました！ ※クリエイターの日とは？希望者が、3ヶ月ごとに最大7営業日を使って、好きなものを開発することができるLIFULLの制度です。 LIFULLでは、マーケティング能力や技術開発能力を高めてイノベーションを創造するため、通常業務の枠を離れて、新たな技術や手法に取り組む機会となっています。開催概要まずハッカソンのテーマは「スマートホーム関連機器を使って自宅での生活をより便利にする仕組みを作る」としました！また期間としては1週間の中の空いている時間で作業・開発をしてもらい、それぞれの自宅でスマートホーム関連機器を用いた仕掛けを作っていただきました。最終日では実際に仕掛けを動画に撮った上で発表をしていただき、その結果順位を決定し、優勝者には豪華賞品を贈呈する形としました。発表内容それでは発表内容を見ていきましょう！１．シェアハウスのリビングをキリンに深夜監視させてみた最初の発表は、こちらのMESH、IFTTT、Nature Remoを使ったアイデアです。シェアハウスに暮らしていると、誰かが消してくれるだろうと思ってつい電気を消し忘れてしまう。そんなシェアハウスの課題解決のため、このアイデアが生まれたとのことです。まず、 MESHで人がリビングにいなくなったこと、及び部屋の明かりが付いていることを検知します。次に IFTTT経由で、Nature Remoが照明を消し、LINEがグループに通知を送るという仕組みです。電気代を節約できたという実績もあり、シェアハウスでなくても活用が可能そうな素晴らしいアイデアだと思います。ちなみに今回は実験的にMESHを使いましたが、Nature Remoにも人感センサーがあるため、MESHを使わなくても実装は可能です。２．よく行方不明になるプテラノドンをすぐに見つけられるようにした続いての発表は、tileとGoogle Homeを使ったアイデアです。娘さんが大事にしている人形「プテラちゃん」をなくなった時に、手軽に見つけられるようにするアイデアです。アプリで操作すると音を鳴らせるタグ、 tileをGoogle Homeに連携させ、「プテラちゃんを鳴らして」と言うとプテラちゃんに付いたtileが鳴るという仕組みです。 tileだけでも便利ではありますが、幼児だけで扱える音声デバイスとあえて連携させたアイデアです。仕事や家事で忙しい時、手軽に使えるのが魅力的です。３．私が求めていたのは話し相手でした 3つ目の発表は、在宅だとどうしても座りっぱなしになってしまうため、運動不足を解消したい！というアイデアです。デモではIoTデバイスの Nature Remoを利用し、自身の動きを計測することで座りっぱなしを検知しておりました。「立派なお腹ですね。ダラダラ働いていないで外でも走ってきてはいかがですか。」と Google Homeに話しかけられることで運動を促す仕組みのようです。製作者は「運動不足解消を目指していたけど、Google Homeに話しかけられて嬉しかった」とのことで、在宅によって本当に不足していたのは話し相手だったというのはとても共感できる部分です。 AWS LambdaでNature Remoからデータを取得し、アラームでSlackやGoogle Homeに通知するなど、裏側の部分もしっかり作り込まれた作品でした。４．1分でできる！簡単IoTで防犯対策最後の発表者は、meshを使うことで誰もが気軽に防犯対策ができるアイデアを考えてきてくれました。実は空き巣の被害は鍵を閉めていなかったことが原因である割合が最も高いとのことです。 MESHのMoveで動き傾きなどが検知することができるため、ドアのサムターン（鍵の部分）に貼り付けて鍵の開閉を検知します。設置が終わったらMESHのアプリをダウンロードして、デバイスの傾きとメール通知をアプリ上で簡単に紐づけることができるようです。アプリ連携からメール通知まで１分で完了したとのことで、とても手軽に利用できることがわかります。問題提起から誰でもできることで予防策を提示するところまでしっかり考えられたアイデアでした。結果発表優勝は「私が求めていたのは話し相手でした」となりました。在宅での運動不足という課題を解決するだけでなく、Nature Remoから取得したデータをAWSのCloudWatchやLambdaと連携したりするなど技術的にもいろいろ実装されていたのが高く評価されました。まとめ今回はハッカソンという形でしたが、エンジニアだけでなく企画の社員にも参加していただけました。また、成果物の発表会にはたくさんの方が参加してくださいました。最近は、MESHなどをはじめコードを書かなくても簡単なプロダクトが作れてしまったりするので、これを機に興味を持った方が次のイベントに参加して少しずつ社内のこのようなイベントも盛り上げていければいいなと思いました。開催日：2020年9月18日弊社では、一緒に働くメンバーも募集しています。 recruit.lifull.com

2020/10/13

クリーンアーキテクチャの各概念を定食屋で表現する

プロダクトエンジニアリング部のカマトです。普段はマーケティング・エンジニアとして、LIFULL HOME'SでLINEやメールを活用したサービスの開発に従事しています。今回は業務でシステムの刷新を行う中で、アーキテクトにクリーンアーキテクチャを採用し初めて経験しましたのでこちらについてお話しをさせていただきます。新しいアーキテクトに触れるときは、このレイヤーは何を担当しどのような概念でどのような機能を持たせればいいのか？と理解するをするまでいつも苦戦するのですが、クリーンアーキテクチャは特に登場人物が多く今まで以上に大変でした。このクリーンアーキテクチャの処理の流れを日常のものに置き換えれば、別な視点で理解が深まるのではと考え、各レイヤーの概念を定食屋のフローに落とし込んで表現をし振り返りをしてみようと思います。参考にしたイメージ図に沿ってのレイヤーと概念ですので、これにそってなければクリーンアーキテクチャではないということはないです。クリーンアーキテクチャはこうすればいい！や、このような思想でやってください！というものではないので暖かい目で見ていただけれたら嬉しいです。さてクリーンアーキテクチャというと、この図がよく出てくると思います。出典：The Clean Code Blog https://blog.cleancoder.com/uncle-bob/2012/08/13/the-clean-architecture.html これともう一つ。出典：図解クリーンアーキテクチャ https://qiita.com/kz_12/items/bc79102247b86626fc72 こちらもよく見ますね。この図の構成を定食屋さんのフローに置き換えて表現したものがこちらになります。かなり強引なものですが各概念をレイヤー毎に説明をさせていただきます。 Enterprise Business Rules Entities まず、どの定食屋さんでもお客さんに提供するために必要なものは料理のメニューですね。唐揚げ定食であれば唐揚げが5個サラダご飯味噌汁といった内容です。 Application Business Rules 調理開始 Use Case Interactor コックさんが厨房に立ちフロアスタッフが伝票置き場(Input Boundary)へ置いてくれた伝票に書かれた注文情報を見て、メニュー内容(Entities)を思い出し料理をします。料理に必要な食材の指示を出し(Data Access Interface)、材料が集まり料理(Output Data)が完成したら受け取り口に料理を並べ、横に伝票(Output Boundary)を置いておきます。注文情報 Input Data お客さんの注文仕方は様々です。厨房のコックさんが作業しやすいように注文内容を整理した言葉に変換してます。からてい一つ → 唐揚げ定食 1人前伝票置き場 Input Boundary フロアスタッフの人は厨房に入りませんので、整理した言葉(Input Data)で作った伝票をコックさんがメニューを出してくれるところに置いておきます。必要材料の指示 Data Access Interface コックさんが倉庫・冷蔵庫(Data Access)から用意して欲しい食材を指示します。受け取り口 Output Data コックさんの元に材料を届けると材料が揃ったので料理を開始します。ここで完成した料理を受け取り口に料理を並べます。伝票置き場 Output Boundary ここでフロアスタッフがどの注文に対しての料理なのかをわかるように、料理の横に伝票を置いておきます。 Interface Adapters テーブル(注文をうける) Controller 次にどこのお店でもお客さんがする行動である注文です。フロアスタッフがお客さんから注文を受け取ります。ここでうけた注文は伝票を使い(Input Data)、作ってもらいたいメニューを調理場へ伝えます。(Input Boundary) 提供準備 Presenter 厨房から出された料理を受け取り口で受け取り(Output Data)、提供するテーブルを伝票で確認したら(Output Boundary)お客さんが気持ちよく食べられるよう、お盆に食器、箸やスプーン、フォーク味噌汁なども揃えてテーブルへ運びます。テーブルViewModel お客さん(View)がいるテーブルへ料理を提供します。倉庫係 Data Access コックさんからの依頼通り(Data Access Interface)に、様々な業者に発注していた食材がある(倉庫・冷蔵庫)から調理に必要な食材を取り出して送ります。倉庫・冷蔵庫 Data Base 倉庫や冷蔵庫には様々な業者に発注した食材や調味料が並んでいます。倉庫係さん(Data Access)が必要なものを発注をしたり、取り出したりします。お客さん View 注文された料理が来たらお客さんは食事を開始します。依存関係についてクリーンアーキテクチャで重要になると思われる依存関係(上位のモジュールは下位のモジュールに依存してはならない。)ですが、以下のように表現しています。メニュー内容(Entities)が唐揚げ5個から3個になったらコックさんの振る舞いも変わり、倉庫係の方が倉庫や冷蔵庫から用意する材料も変わります。コックさんが別な人に変わったら、レシピも変わるので、倉庫や冷蔵庫から出す材料は変わるかもしれません。ですが毎日出しているメニュー内容に変わりはありません。そして倉庫や冷蔵庫が変わったとしても必要になる材料は変わらないので、コックさんの指示に影響は出ないはずです。依存関係逆転の原則もう一つクリーンアーキテクチャで大事な依存関係逆転の原則ですが、こちらは振る舞いを下位モジュールへの作業の依頼(伝票や用意してもらう食材の指示)という形で表現してみました。これによりフロアスタッフの方や、倉庫係の人に依存せずコックさんは作業を続ける事ができます。 (一応ここでの表現の中での話ですが、上位モジュールが立場が上というわけではありません。) まとめどうでしょうか？かなり強引でしたので、間違っている表現もあると思いますが、思ったよりいい感じなのではと・・・。ちなみに自分は学生の頃にファミレスでアルバイトをした経験があるくらいしか料理の経験はありません。難しい言葉で半分くらい理解して進めるといざという時にどうだったかな？と手が止まってしまいますが、こういった自分が普段使っている言葉に変えて整理してみるとすんなり入ってきませんか？クリーンアーキテクチャに限らず普段の業務などで、ここはこういう表現の方がいい、こうした方がわかりやすいというものを考える機会にしていただけたら嬉しいです。

2020/10/12

LIFULLでのLINE活用事例「住み替えサポート（賃貸版）」のご紹介

こんにちは、LIFULLでLINEやメール周りを担当しているエンジニア三宅です。 LIFULL HOME'Sでは、これまでエンドユーザとのコミュニケーションは次のとおりでした。オフライン：店舗（LIFULL HOME'S 住まいの窓口）、電話オンライン：Web、メール、チャットしかし、エンドユーザの利用率や利便性を考え、2019年からLINEを使ったコミュニケーションサービスの配信を開始しました。現在ではLINEで物件相談が出来たり、一人一人の住み替えステップに応じたメッセージ配信をおこない、ユーザのアクションによって適切な情報を配信するサービスを提供するなど、よりオンラインでのコミュニケーションが強化されています。今回はLIFULLで提供しているLINE活用の取り組みの中から「住み替えサポート」を紹介したいと思います。住み替えサポートとは？住み替えステップに合わせた便利機能で、住まい探しから引越しの準備までをLINEでサポートする機能です。住み替えに役立つ情報やお得なキャンペーン情報もお届けします。以下詳細です。物件レコメンドメッセージ LIFULL HOME'Sで問合せをした物件と似た物件をメッセージでお届けします。住み替えステップに応じたメッセージ住み替えステップ（物件見学予定、物件見学済み、物件契約済み、転居完了）に応じたメッセージをお届けします。以下は見学予定の方メッセージです。賃貸で反響を行うと、自動で画面下部のリッチメニューが「住み替えサポート」専用のものに変更されます。以下は見学完了の方のメッセージです。以下は契約完了の方のメッセージです。リマインド機能物件見学日を登録しておくと、前日にリマインドメッセージをお届けします。お役立ち情報配信物件見学必要な持ち物チェックリストや引っ越し後の手続きなど住み替え完了までに必要な情報をお届けします。以下は「引っ越し一括手続きサービス」のお知らせです。注）上記の画像は2020年10月現在のサービス画像の為、変更の可能性がありますどんな風に動いてる？「住み替えサポート」がどのようにして動いているか少し説明させてください。住み替えサポートの処理概要は以下となっています。 ①サンクスメッセージ LIFULL HOME'Sで物件問合せをしてくださった方にLINEでメッセージを配信します。 ②ユーザのアクション（友達になった、メッセージのボタンをクリックしたなど）があるとLINE社を通じてwebhook APIへ通知される「LIFULL HOME'S公式アカウントに友達になった」、「弊社から配信されたメッセージ内のボタンをクリックした」などのアクションがあった場合、LINE社を通じて、webhook APIに通知されます。 ③webhook APIからアクションに応じた処理を行う。ユーザのアクションによって処理を分けるのですが、大まかには以下の３つになります。アクションをデータベースに格納する即時メッセージ配信用のAPIにリクエストリッチメニュー(*1)の切り替え ④条件に合致したユーザに対してLINEメッセージを配信するメッセージ配信は大きく分けて２つあります。弊社では即時メッセージ配信は独自APIを使っており、定期メッセージ配信はMarketing Cloud(*2)というツールを使っています。即時メッセージ配信（ボタンタップ時に即時メッセージ配信）定期メッセージ配信（ユーザの状況に応じた定期メッセージ配信） LINE株式会社が提供しているMessaging APIを用いて開発を行っています。次のドキュメントを参考にすれば、さほど開発は難しくありません。 developers.line.biz 「住み替えサポート」は、最適なタイミングで、ユーザが必要とするコンテンツが配信される事に価値がある機能です。そのため、ユーザのアクション単位で処理を行うことで、セグメントごとに配信するメッセージを切り分けています。 *1 リッチメニューとは LINE公式アカウントのトークを訪れた際、画面下部に大きく開くメニューです。「 リッチメニュー｜LINE for Business 」より引用 *2 Marketing Cloudとは www.salesforce.com 開発時の小話上記の処理概要部分でも記載しましたが、メッセージの配信は、LINEの「Messaging API」を利用しています。「Messaging API」は、JSONでUI・UXを表現しますが、その仕様上、HTML+CSSのように細かいデザインの調整を行うことができません。できない例空白行の縦幅の微調整画像サイズの微調整文字サイズの微調整そのため、デザイナーと相談しながら、できる範囲で最適な物をチョイスしながら進めました。非常に見やすくなっていると思うので、是非見てみて下さい！ LINE活用のその他事例紹介今回は細かくは記載しませんが、その他にも様々な施策があります。軽く紹介させてください。サンクスメッセージ処理概要のところで少し触れましたが、LIFULL HOME'Sで物件問合せをしてくださった方に送るメッセージです。 LINE株式会社が提供する「通知メッセージ」というサービスを使っており、LINEに登録されているユーザの電話番号と、LIFULL HOME'Sで物件問合せをする際に入力されたユーザの電話番号とを照合させることで、友だち登録していないユーザーに対してもメッセージを送ることができます。 LINEで問合せた物件が確認できるのでLINEをよく使う方には便利な機能となっています。 AIおウチ診断検索条件を決めることなく理想の物件をAIが学習・提案してくれる機能です。質問に答えていくだけで理想の住まいが楽しく検索できる機能となっています。こちらの診断を元により理想の住まいへのイメージを膨らませていただければ幸いです。物件更新情報LINE受け取り機能現状は新築分譲マンション領域において、情報の更新があったらLINEで通知してくれる機能です。新築分譲マンションは完成までに時間がかかるので、未完成の状態でLIFULL HOME'Sのような物件検索サイトに掲載されます。随時情報が更新されるのですが、物件の情報に更新が入るとLINEで通知してくれるので非常に便利な機能です。どれも便利・面白い機能ですので、是非使ってみてください！最後に今では公式アカウントの友達数は180万人を超えています。もっと一人一人に沿ったタイミングで、最適なコンテンツを届けられるように「ユーザに寄り添ってサポートできる」「もっと痒いところに手が届く」サービスにしていきたいと思います。今後、新たなLINE活用も進めていく予定ですので、是非「LIFULL HOME'SのLINE公式アカウント」をご活用ください。 LINE公式アカウントはこちらから

2020/10/09

Node.js で Twig のプリプロセッサーを作って言語の機能拡張をしてみた話

技術開発部の相馬です。好きな JS モジュールバンドラーは Rollup です。表題のとおりですが、今回は Node.js を使って PHP のテンプレートエンジンである Twig のプリプロセッサーを作り、言語機能の拡張をしてみた話についてご紹介したいと思います。はじめに弊社のメイン事業である LIFULL HOME'S の開発の歴史は長く、技術的負債と呼ばれるモノも多く存在しています。これらの問題に対し、現在弊社ではエンジニアが組織として負債の解消に取り組むような体制が整っています。フロントエンドの開発環境の改善については、以前ご紹介したので次の記事をご覧ください。 www.lifull.blog 今回は、テンプレートエンジンにまつわる改善についてご紹介したいと思います。 LIFULL HOME'S のサーバーサイドは PHP（Symfony）で構築されており、テンプレートエンジンには Twig を採用しています。 Twig には構文拡張の機構が備わっており、対応するトークンパーサーやノードなどを PHP のコードとして記述し、エクステンションとして登録することで独自のタグを解釈させることなどが可能です。 twig.symfony.com しかし、当然のことながらこれらは Twig コードが PHP を生成するタイミングでのコンパイル時にしか干渉できず、ツールとしての再利用性はほとんど存在しません。そこで、時代は AST（Abstract syntax tree）ということで「Node.js で Twig の parser/traverser/codegen を作ってしまおう！」という決断をしました。 Twig の三種の神器（parser/traverser/codegen）作成に関する詳細は、次の記事をご覧ください。 www.lifull.blog 作成言語に Node.js を採用した理由については、以前 Node.js 環境を整えたのでそのまま利用できたこと開発陣が JavaScript の取り扱いに長けていたのが主な要因でした。神器が整えば、あとは lint なり format なり好きにし放題ということで、手始めに言語のプリプロセッサーを作ってみることにしました。なぜプリプロセッサーを作るのか？ Twig のバージョンを上げずに、擬似的に上位バージョンの API やメインストリームには存在しない API などを実装することができるからです。一般的に、言語のメジャーバージョンアップなどビッグチェンジを含むようなインフラ寄りの改修にはテストを含め多くの工数がかかると思います。これは弊社の Twig にも当てはまることで、歴史的な理由でアップデートが非常に困難（年単位での改修コストがかかる）な状態にあります。そのため、開発者は数年前の機能（開発効率）のまま、現在も開発せざるを得ないという状況です。開発効率の他にも、言語特性による脆弱性など LTS ではないバージョンを使い続けることのデメリットは多く考えられます。このような状況でも、なんとかして開発効率をよくしたい、実装/レビューコスト削減など DX を高めたいという想いの元で生まれたのがプリプロセッサーを作るという考えでした。プリプロセッサーを挟むことで実際のランタイムのバージョンでは扱えない構文が存在していても、実際のランタイムで扱えるよう機械的に変換することで、ランタイムへと干渉せずとも擬似的に機能拡張を行うことが可能です。 JS における Babel のように、特定のランタイム環境においても実行可能な状態として最新の構文をダウングレードコンパイルするように、Twig のプリプロセッサーにおいても特定の Twig のランタイムバージョンに合わせて出力を変更できるよう設計しました。作ったプリプロセッサーについてここからは、作成したプリプロセッサーがどのようなものかについて触れてゆきたいと思います。初期構想 PJ 初期段階で実装/導入したい内容としては次のようなことを考えていました。 Single File Component 構文拡張 xembed lint plugin ベースの拡張 Single File Component Vue.js や Svelte のようなモノを想像していただければ問題ないと思います。テンプレートと同一のファイル内に style と script を記述し、影響範囲を狭めてそれぞれのファイル間の物理的距離を縮めるのが狙いです。 CSS に関しては Scoped CSS などで知られているように、テンプレート側と CSS の AST Node をマッチさせることで煩わしい class 命名からの開放なども可能だと考えていました。構文拡張: xembed Twig には embed という構文が存在していて、これがそれなりに便利で開発サイドからも需要の高い構文でした。 twig.symfony.com しかし、LIFULL HOME'S で導入されている Twig バージョンは embed に未対応のバージョンで利用することはできませんでした。 embed を利用できないため、似たようなテンプレートを作成したい時にテンプレートの複製を強いられてしまい、開発効率にも大きく寄与する構文であったため、これとほぼ同等の機能をプリプロセッサー側で実装することにしました。  {% xembed 'Bundle::tmp/overlay.base.html.twig' only %} {% block modal %} {% include 'Bundle::tmp/modal.html.twig' only %} {% endblock%} {% endxembed %}  {% include "Bundle::xembed/88e0f115ebf99c3d31d738856b176767d0c229e7.html.twig" only %}  {% extends "Bundle::tmp/overlay.base.html.twig" %} {% block modal %} {% include "Bundle::tmp/modal.html.twig" only %} {% endblock modal %} やっていることは単純で、手動で行うテンプレートの複製をプログラムで透過的に自動で行えるようにしました。また、仮に Twig のバージョンアップがあった際、本家の embed をそのまま置換可能なように embed の構文と同じインターフェイスをとるようにしました。 lint Twig 開発上で起こしてしまいがちなミスを事前に防ぐことができるよう lint ツールを統合しています。 onSave でファイルのコンパイルと同時に lint を走らせることで、早いタイミングで開発者にフィードバックを与えるのが目的です。用意した lint の種類としては次の 2 つです。 use only keyword in includeBlock avoid Dynamic include in includeBlock use only keyword in includeBlock Twig には include というキーワードで他のテンプレートを利用することができるのですが、この際に only というキーワードを使って変数スコープを指定することができます。  {% include 'children.html' %}  {% include 'children.html' with {'foo': 'bar'} only %} only をつけていないことで、変数スコープの特定が非常に難しく、修正やリファクタの際に調査コストが大きく膨む要因となってしまいます。これを、 only をつけていない実装があれば、自動で標準出力へと表示するようにしています。 warning: not exist only keyword in IncludeBlock at: tmp/parent.twig - {% include 'children.html' with {'foo': 'bar'} %} avoid Dynamic include in includeBlock こちらも include に関する内容で、動的なテンプレート名の構築を避けて欲しいという内容のものです。  {% include params.template.view {"foo": "bar"} only %} パラメータ名に読み込むテンプレート名を入れることで、場合によってはサーバサイドのかなーり深いところまで遡る必要があるため、こちらも調査コストが高くつきやすいです。また、ファイル検索する際に grep で引っかからず影響調査から漏れてしまう可能性も高いです。これらの理由から、動的な名前解決は非推奨として次のような出力をするようにしています。 warning: dynamic include was detected in IncludeBlock at: tmp/parent.twig - {% include params.template.view {"foo": "bar"} only %} plugin ベースの拡張プラグインによって機能拡張がしやすい設計としました。 plugin 設計は Rollup を参考にしました。型ファイルをお見せするとこんな感じです。 export interface IPlugin extends PluginCtx { name: string ; postbuild?: ( metaOrRootAST: SourceMapMeta | any , path: string ) => Promise < void >; postGenerateAll?: () => Promise < void >; } export type LifeCycleValue = 'postbuild' | 'postGenerateAll' ; import type { SourceMapMeta } from '@/core' ; import type { PluginCtx } from '@/plugins/pluginCxt' ; ファイルの build（parse）が終わったタイミングで hook する function を記述し、ソースコードを生成する前に AST へ干渉できるようにしているのでアウトプットされるコードを変更することが可能です。先ほどの lint の plugin はこんな感じで実装されています。 import { extractWithoutOnlyIncludeNode , generate } from '@/ast/twig' ; import { log } from '@/util/console' ; export default ( { silent } : { silent: boolean } ) : IPlugin => { return { name: 'warnWithoutOnly' , postbuild: async ( ast: any , path: string ) => { if ( silent || ast === null ) { return; } const res = extractWithoutOnlyIncludeNode ( ast ); if ( !res?. length ) { return; } log ( `warning:` , `not exist only keyword in IncludeBlock \n at: ${path}` , 'yellowBright' ); res.forEach (( node ) => { log ( ` -` , `${generate(node)}` , 'yellowBright' ); } ); } , } ; } ; // types import type { IPlugin } from '@/plugins' ; （AST 側が TS で実装されていないので、Node の型情報がないので現状は any で濁しています）ボツ案初期構想から実際にリリースするまでに削られた機能たちとその背景について触れてゆきたいと思います。 Single File Component Style や Script を DOM 側と連携/制御させることが難しかったので諦めることにしました。 JSX などは HTML タグを JS オブジェクトとして扱うことができる一方、Twig では Twig の構文上 HTML タグをそれぞれ AST Node として扱うことは難しいです（unnkown な filter などが HTML タグの中に混在する可能性があり、構文解釈が難しい）よって、Twig の Parser では HTML 部分はほとんど Raw string として扱うことしかできず、HTML Node に対してプログラムによる高度な制御ができませんでした。 Twig にはファイルの継承機能も備わっており、継承が発生した際の script の変数/実装スコープ制御もかなり大変そうな（導入しても扱うことがかなり大変そう）ことがわかったので諦めることにしました。想定していたリスク「技術的負債を解消するために言語やフレームワークを拡張することで新たな技術的負債を生んでしまわないか」ということは常に考慮していました。オレオレ実装や秘伝のタレとして負の遺産的に継承されることは避けられるように、後方互換性や前方互換性についても留意して設計/開発を行いました。戻しやすく捨てやすい、これをモットーに開発できたことが、途中オーバーエンジニアリングで道を踏み外しそうになった時の支えとなりました。独自言語（？）を作ってみてわかった感想テンプレートエンジン +α ライクなモノを作ろうとしてみてはじめて分かった知見もいくつか紹介してみたいと思います。拡張子とハイライト問題初期構想時はファイルの拡張子も変えてみようかという話もありました。その際、Github にプッシュしてコードを見たときにまったくコードハイライトがされていないということが発生しました。 Github 側の実装に当てはまらない拡張子はプレーンテキスト（？）のように扱われてしまうようで、とてもコードレビューできる状態ではありませんでした。ソフトウェア開発において、Github は大きな役割を担うインフラ的存在になってしまっているため、これを無視することはできませんでした。（後日知ったのですが、Github にはハイライトを管理するリポジトリが存在しているらしく、ここに PR を送れば独自拡張子などにもハイライトを当てることができるようです github/linguist ）まとめ実のところ、ほとんどの実装は Twig の Parser 側が占めているので、プリプロセッサー側の処理はほとんどなくかなり薄い実装です。紆余曲折あり当初の設計からはだいぶ機能を削っての導入になりましたが、今回の PJ を通して普段のアプリケーション開発では味わうことができないよい経験ができたと思います。レガシーなテンプレートエンジンにもリッチな開発体験を、というキャッチフレーズで今後も邁進して参りたいと思います。

2020/10/08

AWS構成の刷新とCI/CD導入までの流れ

こんにちは！プロダクトエンジニアリング部の吉永です。 LIFULLには2020年8月に入社しました。今回は入社後、早々に任せていただいた仕事について記事を書きたいと思います。内容としては、静的サイトをホスティングしている、とあるサービスのAWS構成を刷新し、CI/CDを導入したプロジェクトについて、どんな理由でどんなことに考慮して刷新していったのかについてご紹介していきます。アジェンダ刷新対象サイトの旧AWS構成図 AWS構成刷新の背景新AWS構成について Lambda@Edgeについてインフラのコード化について CI/CDについてまとめ刷新対象サイトの旧AWS構成図まずは今回刷新の対象となったサイトの旧AWS構成図を見てください。静的サイトをホスティングしているだけなのですが、EC2インスタンスがいたり、S3のバケットも複数あったりで実現している機能に対して、構成がやや複雑に見えます。この構成のポイントを要約すると下記になります。 S3のバケットが二つあり、それぞれPC用ページ、SP用ページのリソース類（html/css/jsなど）が格納されていた。サイトにアクセスしてきたデバイスに応じて、どちらのS3からコンテンツを返却するかをEC2インスタンス内で稼働しているnginxで振り分けていた。デバイス判定にはHTTPリクエストヘッダーのユーザーエージェントを使用。また、上記サイトのローカル開発環境は下記のようになっていました。サイトのローカル開発環境はRuby on Rails。サイトの更新を行うエンジニアはローカルで更新後、Railsアプリケーションを起動し、シェルスクリプトを実行して静的コンテンツをローカルに保存、保存した静的コンテンツをS3にデプロイ、その後リポジトリを更新して、リモートへプッシュしていた。 AWS構成刷新の背景今回、AWS構成を刷新した理由は下記2点です。 Amazon Linux AMI のサポート期間終了に伴う対応が必要だったから。 https://aws.amazon.com/jp/blogs/news/update-on-amazon-linux-ami-end-of-life/ 上記ページにもあるように、EC2インスタンスを更新するなり、何かしらの対応を2020年中に行う必要があった。また、旧AWS構成を手動で構築したこともあり、テスト環境と本番環境の設定が微妙に異なっているなどが発生していた。生産性の観点から、ビルドやテストだけでなくリリースプロセス全体を自動化したかったから。必須ではなかったが、先述したようにローカルで更新したリソースをほぼ手動でデプロイしており、作業担当者がリポジトリのコミット、プッシュを忘れると、リポジトリの内容とデプロイされている静的コンテンツの内容が一致しない可能性があった。また、ローカル開発環境が作業者PCに直接環境を構築する前提だったこともあり、環境構築手順書のメンテナンスや、引継ぎ時の環境再現コストなどがかかっており、このあたりも改善したかった。新AWS構成についてこれらを踏まえ、現在使用できるAWSマネージドサービスから最適かつシンプルな組み合わせを模索して、新構成を設計しました。 AWS構成の大きな変更点は下記になります。 EC2インスタンス内で稼働していたnginxの役割をCloudFront前段で動作するLambda@Edgeに変更。 EC2インスタンスが不要になったので、前段にいたALBも一緒に削除。 S3バケットも一つにまとめ、バケット内に/pc、/spフォルダを設け、それぞれのページリソースを格納。 CloudFrontはS3の内容をそのままキャッシュするように変更。 EC2が構成からなくなったことにより、ランニングコストが事前の試算では従来の1/3くらいにまで削減できそうだということもこの構成にした大きな理由です。 Lambda@Edgeについて Lambda@EdgeはCloudFrontのビューワーリクエストをトリガーにして動作するように設定し、HTTPリクエストに含まれるリクエストパスをユーザーエージェントに応じて書き換えるようになっています。イメージが湧きやすいように設定したLamda@Edgeソースの一部を下記に記します。 // User-AgentからPC・SP判定を行ないリクエストURIを変換する exports.handler = ( event , context, callback) => { const request = event .Records [ 0 ] .cf.request; const headers = request.headers; if (headers [ 'user-agent' ] ) { var uri = request.uri; // UA判定 if (isSpBrowser(headers [ 'user-agent' ] )) { // スマホ uri = '/sp' + uri; } else { // PC uri = '/pc' + uri; } request.uri = uri; callback( null , request); return ; } callback( null , request); } ; インフラのコード化について旧AWS構成が手作業で構築した環境だったので、テスト環境と本番環境で微妙に差異がありましたが、今回1からインフラ構成を作ったのでCloudFormationを用いてインフラのコード化を行いました。コード化したことにより、テスト環境で構築した構成を本番環境で再現するのが容易でしたし、今後何かしらの変更を加える際にもコードベースで管理しておけば、テストと本番で設定が異なるなどの状態には陥りにくいと思います。 ※実際には少しの変更ならAWS管理画面から直接行いたくなりますが・・・それをやってしまうとせっかくコード化した意味がないので、手動設定はなるべく排除しましょう。 CloudFormationについては別途Qiitaにて、この案件を通じて学んだ内容を備忘録代わりに投稿した記事があるので、もし興味があれば参照してみてください。 AWS CloudFormation入門 CI/CDについて今回改善したかったもう一つの個所がローカルでサイトを更新してから、デプロイするまでの流れでした。改善点をまとめると下記になります。ローカル開発環境をDockerで構築し、環境再現コストを削減。 masterブランチにマージされたら、GitHub Actionsでデプロイ実行。デプロイ作業を自動化したことでヒューマンエラーが混入しなくなり、作業者も安心してリリースできるようになりました。また、副産物として、GitHub Actionsにてバージョン管理TAGの自動付加も行えるようにしたので、その件についてもQiitaに投稿しました。もし興味があれば参照してみてください。 GitHub ActionsでX.Y.Z形式のバージョニング自動タグ付けを行うまとめ AWSについては前職では少し触った程度の浅い知識しかなく、入社早々任せていただいた仕事がAWS構成の刷新だったので一抹の不安はありましたが、最終的にはかなり色々なものを吸収させていただき、とても良い経験になりました。今回の業務を通じて得られたものを下記にまとめました。 AWS構成でどこにどれくらいのコストがかかっているのか？調べる力が身についた。 AWSマネージドサービスは常に進化しており、数年前は実現できなかったことが近年ではシンプルな構成で実現できるようになっていたりするので、ベストプラクティスは常に変化していることを知れた。インフラのコード化を初めて行ったが、テスト環境で構築した環境を本番環境に簡単に構築できるメリットを実感できた将来的に似たような構成を作る際に今回作ったCloudFormationが流用できる可能性を感じたので、インフラのコード化は業務効率化や標準化の観点からみても非常に有益な作業であると実感できた。 CI/CDを導入することでリリース作業の負担を減らすことのメリットを実感でき、かつリリース作業を属人化することなく、だれでも簡単な操作でできるようになったので、リリース作業の心理的負担もだいぶ和らいだ。以上となります。最後までご覧いただき、ありがとうございました。

2020/10/07

AWS Fargate, Github Actionsを利用したウェブアプリケーション開発から配布まで

はじめこんにちは、アプリケーションエンジニアとして働いてます。キムソンジュです。今回の記事では自分が参加したPJで利用した、インフラ構成から、CI/CD環境を利用して簡単にアプリケーション開発ができる方法について紹介しようと思います。システム投入・設計背景既存のレガシーシステムには、次の問題がありました。デプロイの手順が複雑で時間かかり、面倒な作業が多い環境ごとにミドルウェアのバージョンが異なるこの問題を解決し、かつ新しい技術にチャレンジするために、チーム内で次の内容で進めるようチームで決めました。 Dockerを活用して環境ごとの差をなくす GitHubでソースコードを管理するので、CI/CDにはGitHub Actionsを採用 Dockerを利用することによる、ECRとECSを活用入る前に本記事で話したい内容は「このような方法で、こんなに簡単にアプリの開発からデプロイまでできる」といった紹介をするのが目的です。案内してるAWSの各技術の細かい使い方、テストで使ってるGo言語の深い話については紹介しませんのでその点をご了承ください。登場人物 AWS IAM AWS ECR AWS ECS AWS ALB(※1) AWS Parameter Store(※2) Github Actions Docker Go ( Go以外のアプリケーションも利用可能です） ※1. ALBはFargateを利用する時の必須技術になります。 ※2. Parameter Storeは、Dockerを起動させる時に環境変数を利用して敏感な情報をアプリで利用するため使います。 ※その他の登場人物については、上記で決めたことを元にして登場しました。作業結果の予想図上記の登場人物を利用する場合、下記のような構成が出ます。作業の流れ Goを利用したアプリ作成 Dockerを利用したContainer環境構築 Local環境起動確認・テスト AWS設定 Github Actions設定実装テストこちらの流れで作業を進めて行く予定です。それでは始めましょう！ 1. Goを利用したアプリ作成 go-json-reset のModuleを利用します。この記事では上記の例文をそのまま利用する予定です。 go module を利用します。参考コードはこちらです。 2. Dockerを利用したContainer環境構築 goが設定されてるAlphine Linuxを利用します。 TimeZone設定がDefault UTCなので調整します（ログ書くときに時間がずれることを予防します） go moduleの設定と、Install作業を行います。 buildした後、実行させます。 dockerfile ## get alphine + go image ver.1.14 FROM golang:1.14.2-alpine3.11 ## pakcage update & install RUN apk add --update curl git pkgconfig curl-dev ## modified timezone RUN apk add tzdata ENV TZ=Asia/Tokyo ## setup env variables for go module ENV GO111MODULE "on" ## source code copy from host disk WORKDIR /go COPY . /go/src ## module install ## If You didn't set up go.mod in your local workspace, You can not use command go install WORKDIR /go/src RUN go install ## go build RUN go build ./main.go ## container listen port EXPOSE 8080 ## command ## start CMD [ "./main" ] ここまで来たら下記のようなディレクトリ構成になります。 . ├── Dockerfile ├── go.mod // go module 設定ファイルになります。 ├── go.sum // なくても構いません。 └── main.go 3. Local環境起動確認・テスト docker build postman, curl などを利用して、テスト docker build -t lifull_test . docker run -p 8080:8080 qiita_test:latest 自分はPostmanを利用して見ました。アクセスログが出力されているか見てみましょう？！よし、ここまで来たら準備は完了です。 4. AWS設定 AWSの環境を設定しましょう、ALB,SGの細かい設定についてはこの記事では案内しません、必要最低限の設定で作成します IAM 設定 Github Actionsが利用するDeploy用ユーザーを作成必要権限は　ECR,ECSに関連する権限を付与します。作成時　AccesToken、Keyを保存しましょう。 FargateのTaskが使うRoleを設定します。 ecsTaskExecutionRole　この名がDefaultです。権限は、ECR,ECSの権限に更に、CloudWatch,Parameter Storeへの利用権限が必要です。 Parameter Store 設定アプリで利用する各種環境変数周りがあります(Laravelの場合.env周りに設定する環境変数です)こちらをGo+Dockerで利用する場合、環境変数をOSで扱うのが一般的で、こちらを実現するためにAWSでは SystemManager > Parameter Storeに設定します。 key-valueで設定します。暗号化された文字列として保存するのがより安全ですね！ Security Group 作成利用するポートを許可します。　今回の場合は8080をOpenしましょう！ ALB 作成 Public Subetを設定します。 Public DNSが使える状態にします。もしくはHTTPS設定を利用して使える場合DNS設定を行います。（ACMなどが登場しますね） ECR 作成 Repositoryを作成します。（Docker-hubのPrivate版的な感じで、AWSでDockerを利用する時よく使います。） ECS 設定 ECSの構成について細かい説明は行いません。下記の設定は注意してください。 task定義が必要です。まだRepositoryにアップしたイメージがないので適当に書いておいても構いません。　　 Containerに渡す環境変数の設定が必要です。上記のParameter Storeで設定したパラメーター名を環境変数：パラメーター名構成で作成します。 Container側に必要はPortをOpenする必要もあります。ここでは8080ですね。 clusterを作成します。 serviceを作成します。 5. Github Actions設定一覧の設定が終わったら、Github Actionsを設定しましょう Github Actionsについては気になる方は以前自分が Qiitaに投稿した記事がありますので、参考にしてください Trigger push Target Branch master doing docker build task-definition.json を利用したDeploy作業 .github/workflow/main.yml ### main.yml name : test workflow for qiita on : push : # event trigger on push branches : master jobs : build : # job id name : sjkim action # job name runs-on : ubuntu-latest # virtual os steps : - name : set up go 1.14 uses : actions/setup-go@v1 with : go-version : 1.14 - name : Checkout branch go module directory uses : actions/checkout@v2 - name : package install uses : actions/cache@v2 with : path : ~/go/pkg/mod key : ${{ runner.os }}-go-${{ hashFiles('**/go.sum') }} restore-keys : | ${{ runner.os }}-go- - name : Configure AWS credentials uses : aws-actions/configure-aws-credentials@v1 with : aws-access-key-id : ${{ secrets.AWS_ACCESS_KEY_ID }} aws-secret-access-key : ${{ secrets.AWS_SECRET_ACCESS_KEY }} aws-region : ap-northeast-1 - name : Login to Amazon ECR id : login-ecr uses : aws-actions/amazon-ecr-login@v1 - name : Build, tag, and push image to Amazon ECR id : build-image env : ECR_REGISTRY : ${{ steps.login-ecr.outputs.registry }} ECR_REPOSITORY : qiita-test IMAGE_TAG : ${{ github.sha }} run : | # Build a docker container and # push it to ECR so that it can # be deployed to ECS. docker build -t $ECR_REGISTRY/$ECR_REPOSITORY:$IMAGE_TAG . docker push $ECR_REGISTRY/$ECR_REPOSITORY:$IMAGE_TAG echo "::set-output name=image::$ECR_REGISTRY/$ECR_REPOSITORY:$IMAGE_TAG" - name : Fill in the new image ID in the Amazon ECS task definition id : task-def uses : aws-actions/amazon-ecs-render-task-definition@v1 with : task-definition : task-definition.json container-name : qiita-container image : ${{ steps.build-image.outputs.image }} - name : Deploy Amazon ECS task definition uses : aws-actions/amazon-ecs-deploy-task-definition@v1 with : task-definition : ${{ steps.task-def.outputs.task-definition }} service : qiita-service cluster : qiita-test-cluster wait-for-service-stability : true Github Actions marketplaceにある ECS Deploy を元に作成してます。 Github Secretsについて Github Actions上で利用する秘密情報や、アクセストークンなどを利用する時に使います。 {{ secrets.AWS_SECRET_ACCESS_KEY }} などで利用可能です。 setting > secrets > new secrets task-definition.json { " requiresCompatibilities ": [ " FARGATE " ] , " inferenceAccelerators ": [] , " containerDefinitions ": [ { " name ": " qiita-container ", " image ": " ***/qiita-test ", " resourceRequirements ": null , " essential ": true , " portMappings ": [ { " hostPort ": 8080 , " containerPort ": " 8080 ", " protocol ": " tcp " } ] , " secrets ": [ { " name ": " ENV ", " valueFrom ": " dev " } ] , " logConfiguration ": { " logDriver ": " awslogs ", " options ": { " awslogs-group ": " /ecs/qiita-test ", " awslogs-region ": " ap-northeast-1 ", " awslogs-stream-prefix ": " qiita " } } } ] , " volumes ": [] , " networkMode ": " awsvpc ", " memory ": " 512 ", " cpu ": " 256 ", " executionRoleArn ": " ****/ecsTaskExecutionRole ", " family ": " qiita-task ", " taskRoleArn ": "", " placementConstraints ": [] } taskは上記AWSの作業手順のなか、Taskを作成したら、Task詳細タブの中にJsonて書かれてる部分があります。　その部分をコピしてLocalのPJ内に配置したらOKです。 Cloud Watchのロググループは存在してない場合、自動的に作成してくれます。（Deployユーザーに権限が無い場合Deploy中にNGになりますので注意） secretsの部分でContainerにわたす環境変数を設定します。nameは渡す環境変数名 valueFromはParameter Storeに指定した名前を入れます。 container name, task name, cluster name, service name など、先に設定しておかない、又はタイポで間違った内容を書くと、Github Actionsの動作中に落ちます。 6. テストもうほぼ準備は完了です。ここまでのPJの構成が下記になります。 ├── .github │ └── workflows │ └── main.yml ├── Dockerfile ├── go.mod ├── go.sum ├── main.go └── task-definition.json 実装をしてみましょう！ GithubのMasterブランチへPushしたら、Github Actionsが起動されます。その流れによって、ECSにデプロイ作業が開始されます。作業が終わったら、AWS管理ページを確認し、EC2＞ターゲットグループチェックします。 Public DNSや、利用してるDNSを利用してAPIが叩けるのか確認します！まとめ今回このような構成でアプリケーションの開発を行ったのは初の試みです。 AWSの知識が浅かったのでかなり苦労した記憶が残ってますが、かなりいい構成かな…と思ってるのでこちらをベースにPJをどんどん拡張していきたいなと思います。 Firelensなどを利用したLog設定や、Github Actions、AWS SNSを利用したアラーム設定、Containerのリソースモニタリングなど、どんどん入れてみたいなと思ってます。おそらくこの記事の情報だけではそんなに簡単にアプリを作るのは難しいかもしれません。でもこの記事の内容を参考にしてもらい、皆さんのPJや、悩みへ少しでもHINTになったら嬉しいです。本日案内したコードはここを参考してください。

2020/10/06

LIFULL HOME'S アプリでの Tech Lead 導入事例

こんにちは。LIFULL でネイティブアプリのスペシャリストをしている菊地です。普段は LIFULL HOME'S アプリ（iOS, Android）の開発チームで Tech Lead をしています。今回、Tech Lead としての活動が5年目となることから、LIFULL HOME’S アプリにおける Tech Lead の事例をご紹介いたします。ご自身のキャリアパスの一つとして Tech Lead を検討されている方、Tech Lead という役割を導入したい方々の参考になれば幸いです。はじめに Tech Lead とは Tech Lead はプロダクトに携わるエンジニアチームの技術リーダーになります。 Tech Lead は数年前から浸透してきた役割ですが、会社やチームによって Tech Lead に求められるものが異なるため、明確に「これが Tech Lead」というものはないと言われています。 Tech Lead の役割 Tech Lead の主な役割（責任範囲）として挙げられるのは以下の3つの要素になります。コードの品質チームが作るソフトウェアの品質を守るチームの生産性チームが設計・実装する上で障害となるものを事前に取り除くアーキテクチャ・設計チームに技術的なビジョンを示して、そこに導く Tech Lead に求められるスタンス Tech Lead に求められるスタンスなどが書かれた有名な記事がありますので、こちらも参考にしてみてください。 medium.com LIFULL HOME'S アプリの Tech Lead とは LIFULLでは主力サービスである LIFULL HOME'S を iOSアプリ、Androidアプリとして提供しています。 iOS アプリと Android アプリそれぞれに対して専属の開発チームが存在しており、この二つのアプリを開発するチームをまとめてアプリ開発チームとして扱うことが多いです。アプリ開発チームは以下の三つの職種から構成されています。企画デザイナーエンジニアこの三つの職種から構成されている LIFULL HOME'S アプリ開発チームに対して 2016年10月に Tech Lead という役割を導入しました。賃貸物件検索ホームズ部屋探し・お家探し・不動産・引越し LIFULL Co., Ltd ナビゲーション無料 play.google.com Tech Lead を導入するまで Tech Lead を検討した理由 LIFULL HOME'S アプリ開発チームで、Tech Lead の導入を検討した理由はいくつかありますが大きな理由としては、 iOS アプリ開発チームと Android アプリ開発チームに分かれているために iOS アプリと Android アプリという OS を横断した動きというものがとりにくかったということが挙げられます。それぞれ普段の業務としては各OSのアプリの開発・運用となるため、各職種の活動範囲や責任範囲がどちらかのアプリに限定されてしまうことがあり、いくつかの課題が上がっていました。技術的な窓口の分散各OSアプリ開発チームのエンジニアにはリードエンジニアは存在していましたが、LIFULL HOME'S アプリとして全体をリードするエンジニアは存在していませんでした。そのため、他部署や他職種（アプリ開発チーム内）からの問い合わせなどへ対応する際に各 OSのエンジニアがそれぞれ対応を行うため LIFULL HOME'S アプリとしての回答に時間がかかる共通で検討されるべきことがどちらかのプラットフォームのみで話されてしまうといったことがありました。サービスとしての体験の違い各OSで開発を行う際に、影響範囲として考慮されるのが所属しているチームの担当 OS の範囲内になってしまうことがあり LIFULL HOME'S アプリとして違う体験になってしまっていることがあるどちらかのアプリだけに存在している機能や仕様というものが増えてきたどちらかのプラットフォームのみを利用しているユーザーには影響はないかもしれませんが、両方のプラットフォームを利用しているユーザーやプラットフォームを乗り換えたユーザーにとっては、同じサービスなのに体験が違ってきてしまうという課題がありました。エンジニアのスキルセット当たり前のことですが、iOS アプリエンジニアは iOS アプリ、Android アプリエンジニアは Android アプリのスキルセットを持っています。ですが、iOS アプリと Android アプリの両方の技術についてスキルセットとして持っているエンジニアはいませんでした。そのため、iOS アプリと Android アプリで共通の機能開発を行う際にどちらかの OS では実現できるが、どちらかの OS では実現できないスケジュールの都合で、どちらかの OS が先行して機能開発を行った際に、後続の OS の事が考慮されていない API 開発や仕様調整が行われるという課題がありました。 Tech Lead を導入した理由アプリ開発チームとしてのリードエンジニアの必要性これらの課題を抱えていたことにより、LIFULL HOME'S としてアプリ（iOS、Android）を成長させていく際に、アプリ（iOS、Android）共通の話や将来的な思想といった部分がまとめにくく、アプリ開発チーム全体としてのレベルをあげることが難しい状態でした。そこで iOSアプリ開発チーム、Androidアプリ開発チームというOSを飛び越えて動ける存在として Tech Lead という役割を導入し、プロダクト全体としてチームのレベルをあげるために Tech Lead の導入を行いました。 Tech Lead を導入してから Tech Lead として求められたこと LIFULL HOME'S アプリの Tech Lead として求められたことは以下になります。プロダクトチーム全体の生産性の最大化技術的負債の管理設計・開発の妨げになるものの排除アプリとして共通のビジョンを提示すること OSを限定せず技術でプロダクトチームをリードすることエンジニア以外についても技術視点から意見を伝えて、起案段階から確度の高いものになるようにすること新たな体験の提供や価値の創造最新技術の調査・検証・プロトタイプ最新技術をサービスに落とし込み、チームに展開するチームの技術に対する責任を持つプロダクトが採用する技術や品質に対する責任エンジニアの技術に対する責任技術的な最後の砦になることいることでチームに安心感を与えること Tech Lead としてやってきたこと LIFULL HOME'S アプリの Tech Lead として求められてきたことを実現するために実際にやってきたこと、気をつけてきたことは以下になります。最新技術の調査・設計・プロトタイピング WWDC、Google I/O などで発表される最新技術などを最新技術を使うだけではなく、アプリの機能や体験にどう落とし込むのか？を検討して、チーム（または各職種）に展開します。時には技術資料をまとめて、時にはプロトタイプを作ったりして、職種毎にイメージしやすいように展開の仕方を変えるようにして、アプリ開発チームとしてスムーズにサービスに取り入れやすくするために様々な土台づくりをしています。基本的には、LIFULL HOME'S アプリで提供している「かざして検索」のように事前にプロトタイピングを行った上でアプリに導入することになりますが、場合によっては LIFULL HOME'S アプリとは別アプリとして提供することもあります。別アプリとして提供した例としては Google が提供していた Tango プラットフォームでお部屋の模様替えを体験できるアプリのプロトタイピングを行い、アプリとしてリリースしたという事例もあります。プロジェクトマネジメント Tech Lead の本来の仕事でないのですが、アプリの共通施策や大規模な機能開発、最新技術の開発といった場合にプロジェクトマネジメントも行うことがあります。かざして検索のプロジェクトでは全体のプロジェクトマネジメントを行いながら、Android アプリ側での実装を行うといったことも行いました。技術的負債の管理 iOS アプリ、Android アプリの双方で抱えている負債の把握を行い、将来的なアプリのあるべき姿に向けて施策などが行われる際に合わせて負債も返却できるような提案を行って、返済できるようにしています。いま出来ることと（負債により）出来ないことを把握して、アプリ開発チームがやりたいことをやりたいときにスムーズに行えるようにするため、障害となり得るものの排除を行っています。エンジニアの育成 Tech Lead は Enginnering Manager でないということもよく言われていることかと思います。エンジニアのキャリア形成や人事考課、チームの方向性の評価やキャリアについては Tech Lead の範囲ではなく、技術的な観点についての育成についてについてが Tech Lead の範囲となっています。具体的には、コードレビューについてとなりますが、普段のやりとりや流れてくる会話の中で技術的な観点でこう考えてほしいなどの助言をしたり、エンジニアとして、他職種と関わる際に意識することでチーム全体でより良い開発ができるような助言を行なっていますアーキテクチャの設計各OSアプリ毎に将来的に必要となるものを導入しやすい下地を作るため、アーキテクチャの選定や、影響の大きいライブラリの選定なども行っています。 Tech Lead が選定したものが導入されるというわけではなく、あくまで議論するための素案となります。最終的には各OSのアプリ開発チームと話し合った上で導入まで進めていきます。これまで、iOS では Clean Architecture の導入、Android では Instant Apps 対応時の multi module 導入や、Dynamic Feature Module の導入なども行っており、チームとして話すための素案などをまとめてきました。チームの生産性向上 Tech Lead はエンジニアチームの生産性の向上だけではなく、チーム全体の生産性の向上も求められています。そのため、LIFULL HOME'S アプリ全体としての技術窓口として、企画やデザイナーと起案段階から技術的な観点で事前に相談を行なったり、ユーザーからの問い合わせなどについても把握しておいて相談がスムーズに行えるようにしたりなども行なってきました。また、アプリ開発チームにおけるコミュニケーションのルーズボールを率先して拾って、適切なところに受け渡したり、対応を行なったりという一見地味なことも行なっています。技術的な最後の砦になること Tech Lead の役割として、常に安定していてチームの最後の砦のような存在になるようにするということがよく言われています。これは言葉としては単純ではあるんですが、とても大事なことなのに難しいなと感じています。どんな状況、どういった問題に対しても、常に落ち着いて対応をする必要があるため、それまでの状況の把握だけでなく対応するために必要な知識や情報を常にアップデートし続ける必要がありました。私の場合は、iOS と Android の両方について Tech Lead という役割を持っているため、カバーしなければならない範囲が iOS、Android だけではなく共通で使用する API（マイクロサービスや全社的なもの含む）やそれの裏側の設計、さらには技術的な話以外でそれぞれの業界の動向などとかなり広くなってしまいます。そのため、Tech Lead として職種間やアプリ開発チームのやりとりをスムーズにするために、技術的な観点以外にも最新の UI / UX、業界の動向やビジネス領域についてもキャッチアップをおこない続ける必要がありました。一見関係の無いようなものであっても新しい体験を生み出す時に組み合わせられることもあるため、そういったものについてもキャッチアップをするように心がけています。現時点でもカバーしきれていない領域があるとは思いますが、出来る限り幅広い知見を持つことで、アプリ開発チーム内で起きる問題に対して安定して対応することが出来るように、Tech Lead に聞けばなんとかなると思ってもらえることで安心感を与えるために、常に知見を増やし続けるようにしています。まとめ今回、LIFULL の LIFULL HOME'S アプリにおける Tech Lead の役割についてご紹介させていただきました。既に Tech Lead のようなことをやられている方もいるかと思いますが、Tech Lead という役割を導入することによって、その方のキャリアパスが明確になったり、チームにおける窓口が明確になることで得られるメリットなどもあるかと思います。もしあなたのチームに Tech Lead という役割がまだないのであれば、Tech Lead の導入を検討されてみてはいかがでしょうか？ LIFULLではメンバーを募集しております！カジュアル面談もありますのでご興味ある方は是非ご参加ください！ https://hrmos.co/pages/lifull/jobs/010-9999 hrmos.co

2020/10/05

LIFULL HOME'S 注文住宅 APIリプレイスにて期待する効果が得られず再設計した話

こんにちは。エンジニアの加藤です。普段はLIFULL HOME'Sの注文住宅領域にてエンジニアチームのマネジメントを担当しております。 LIFULL HOME'Sでは日々新機能の開発や機能改修を重ねておりますが、一方でレガシーコードや技術的負債も少なからず抱えており、開発速度低下や開発の幅を狭める一因となっております。そのような状況の下、ここ数年、機能開発と同様に技術的負債の解消への取り組みにも注力し、注文住宅領域においてもシステム基盤刷新プロジェクトとして、開発効率向上やビジネス成長に耐えうる基盤づくりに取り組んでおります。今回はそのシステム基盤刷新プロジェクトの一部であるAPIリプレイスを経て学んだ、当初の期待とそれに対するギャップ、そしてそれを踏まえた改善をお伝えしたいと思います。システム基盤刷新プロジェクトの初期設計システム基盤刷新プロジェクトでは最終的にはLIFULL HOME'S 注文住宅を構成するそれぞれのシステムのリプレイスを図るものとなっておりますが、領域毎フェーズを分けて実施をしております。その中でまずは以下のように全体的なシステム設計を行った上、リプレイスに取り組みました。 LIFULL HOME'S 注文住宅には大きく分けて3つのシステムによって構成されております。一つ目はエンドユーザ向けシステム（以降、web）、二つ目にハウスメーカーや工務店などクライアントへ向けた管理システム（以降、manager）、そして社内用管理システム（以降、client manger）となります。マイクロサービス化を想定し、それぞれのシステムに対しフロントエンド層とそれに対応するBFF層を構成し、将来的に複数の機能別サービスに対応するAPIを呼び出す可能性を考慮した設計を行いました。当初の設計時の期待としては以下となります。期待機能毎のサービスが増えた際、それらの呼び出しはBFF層で吸収しフロントエンド層をシンプルにするそれぞれのAPIにて依存関係や関心の分離を図る BFFは各システムのビジネスロジックや業務ルールに関心を持つ BFFはデータの取得先やDBには関心を持たない db-apiは意味のあるまとまりでDBからデータを取得・更新する db-apiは各システムのビジネスロジックや業務ルールに関心を持たない db-apiの各エンドポイントは特定のシステムによらない設計とし、複数BFFから呼び出し可能とする同様の処理を各システムにて重複実装することを防ぎ、開発の効率化を図る APIリプレイスを進めて見えてきたギャップ上記設計に基づき、まずはdb-apiとclient manager-apiのリプレイスを実施致しました。しかし、開発・運用フェーズを経ることで、徐々に期待に対しての以下のようなギャップが生じました。ギャップ機能毎独立したサービス（API）の必要性がない API開発のコストが増加リリースの複雑性が生じた一つ目のギャップはマイクロサービス化についてです。設計当初、将来的には機能毎マイクロサービス化とし、APIを切り出すことを考慮してシステム設計を行っておりました。しかし、注文住宅領域においてのサービス規模や少人数での開発体制を踏まえると、各機能別にチームを構成し開発を行う必要性が薄く、効率的でないという結論に至りました。二つ目はdb-apiの再利用性や関心の分離についてです。理想としてはdb-apiは各システムに依存せず、汎用的で複数BFFから利用可能なエンドポイントを構成するAPIとして期待をしておりました。しかし、トランザクション等を考慮するとシステムの業務ルールに依存したエンドポイントとする必要性が生じ、汎用的なエンドポイント設計の困難さを感じました。その結果、各システムに依存するエンドポイントが量産されることが予想され、開発コスト増大の懸念が高まりました。また、取得処理がメインなweb、更新処理がメインなmanageの双方から利用されるAPIである性質上、ReadモデルとWriteモデルは別々で作成した方がメンテナンスしやすいというDDD的な思想のアンチパターンにも陥っており、開発する上で考慮する観点が増え、こちらも開発コストが増加する一因となっておりました。三つ目は機能改修時のリリースの複雑性についてです。機能改修の際は、フロントエンド層、BFF層、db-apiそれぞれに対し開発を行い、リリースの順序によりシステムの整合性を保つ必要がありました。そのため、リリース時のシステム間での互換性の担保など考慮する部分が増え、結果として開発の複雑性の増大にも繋がりました。ギャップを踏まえた改善続くリプレイス対象のシステムとしてweb-apiが控えておりましたが、上記のギャップを踏まえ、当初のシステム設計を見直すこととしました。その際、見直したポイントとしては以下となります。見直したポイント基本的に機能毎のAPI開発を考慮しない db-apiからのデータ取得をやめ、DBから直接データを取得三層スキーマアーキテクチャにて、業務ルールをViewに集約新たな設計では、db-apiの廃止や各BFF間でのエンドポイントの再利用性などを排除した代わりに、影響範囲を一つのシステムに限定する構成としました。また、APIからのデータ取得部分においても一部変更を加えております。 DBに三層スキーマアーキテクチャを導入することで、単一データベースでの簡易的なCQRSを可能な設計としました。その上で、webでの利用に特化して条件を絞ったViewを作成し、参照することでAPIにて発行するSQLをシンプルにする期待を見込んでおります。改善点新たな設計に基づきweb-apiを構築することにより、以下のようなメリットを享受することができました。開発対象のAPIが一つとなり開発工数が削減影響するシステムが限定されることで開発効率が向上 Viewにロジックを集約することでAPIのデータ取得ロジックが簡略化され開発コストが低下まとめ今回のAPIリプレイスを通じ、結果に対しての振り返りを行い、課題を受け入れ改善することの重要性を学びました。一度決めたことを変えることはなかなかエネルギーが必要なことではありますが、状況に柔軟に対応しつつ、強い意志を持って変えること、そしてやり遂げることができるチームが強い組織であると考えております。今回の学びを活かし、今後も技術的負債の解消に向け取り組んで参りたいと思います。

2020/10/02

KubernetesクラスタのE2Eテスト

技術開発部の川合です。この記事ではアプリケーション実行基盤開発を支える視点での取り組みについて紹介したいと思います。キーワードはKubernetesクラスタE2Eテストと自動化です。背景提供機能の保証 Conformance E2Eテストの実行カスタムE2Eテストの実行クラスタ構築の不安を軽減するおわりに背景私が所属するチームではKubernetesを利用しアプリケーション実行基盤を開発しています。エンドユーザへの安定したサービス提供はもちろんのことアプリケーション開発者が開発に集中するための様々な機能提供を行っています。一例を紹介すると以下のような機能が提供されています。アラート・メトリクスを可視化するGrafanaダッシュボードの自動構築 OPAを利用したmanifestがベストプラクティスに沿っているかどうかの検証実行基盤への移行を容易にするテンプレートの開発他にも多数の機能を提供していますがそれらをさらにシンプルに導入する取り組みとして、CRDとして定義された設定ファイルを書くだけでまとめて手に入るという仕組みを開発しています。これが完成すればnamespaceの作成からデプロイ環境の構築、アラート・メトリクスなど多岐に渡る機能が統合的に導入できるようになります。こちらについてはまた別の機会に紹介できればと思います。チームでは「可観測性の向上」「アプリケーション移行支援」「コスト削減」といったテーマを決定しそれぞれに求められる改善・機能開発を継続して提供することを目標としています。こういった活動に対しスピード感を損なわず安定して価値を提供するための仕組みづくりが必要でした。また、実行基盤（クラスタ）にはマルチテナンシーを採用しており多種多様なアプリケーションがデプロイされます。多くの裁量を開発者へ移譲できるような思想で運用していますが、基盤自体を安定稼働させる責任としての調査・不具合等対応等が求められます。テナントが増えることで観測範囲も増加し基盤への開発・運用はより複雑なものになっていく傾向がありました。提供機能の保証提供機能も増え、それを利用するアプリケーションも増え影響範囲も増加していきます。さらにKubernetes本体や周辺エコシステムのアップデートはとても早く、さらなる価値提供のためにもいち早く適用していかなれければいけません。そこで実行基盤開発の「守り」を強化することを目指しテストを実装しました。 Sonobuoyというツールを利用してクラスタのE2Eテストを実行しています。 github.com このテストによって機能が正しく動作することを保証し、機能開発のデグレチェック・クラスタバージョンアップによる影響の確認が機械的に行えるようになります。 Conformance E2Eテストの実行 KubernetesにはCNCFが実施している認定プログラムがあり、 Certified Kubernetesとして認定されたアプリケーションはSonobuoyによる適合試験をクリアしていている必要があります。 ※認定済みのアプリケーションはこちらのリポジトリに登録されています。 github.com テスト実装についてはKubernetesリポジトリに格納されておりKubernetesのE2Eの実行方法や、ラベルの種類などはこちらから確認することができます。 github.com Sonobuoyはこれらのテストを便利に実行してくれるテストツールとして利用することが出来ます。実行されるテストの一部を紹介すると以下のようにConformanceラベルがついたテストを実行していく様子が見られます。 Sonobuoy namespaceを始め独自のnamespaceが作成され実行ログやnodeの様子、テスト実行結果などはSonobuoyが提供するコマンドを通じて確認することが出来ます。 "[sig-network] DNS should provide DNS for pods for Subdomain [Conformance]" "[sig-api-machinery] AdmissionWebhook [Privileged:ClusterAdmin] listing mutating webhooks should work [Conformance]" "[sig-storage] Projected secret should be consumable from pods in volume with defaultMode set [LinuxOnly] [NodeConformance] [Conformance]" "[sig-storage] Projected downwardAPI should provide container's memory limit [NodeConformance] [Conformance]" "[sig-node] Downward API should provide pod UID as env vars [NodeConformance] [Conformance]" 認定済みのアプリケーションを利用しているわけですが組み合わせによる不具合やクラウド固有の設定による挙動変化などがあった場合にそれを検知したいという意図がありLIFULLでは構築後のクラスタでConformanceテストを実行するようにしています。カスタムE2Eテストの実行また、前述の通りLIFULLのアプリケーション実行基盤として多くの機能開発を行っています。それらが期待通りに動作するかについてConformanceテストとは別にE2Eテストを実装しています。これらはKubernetes本家同様にテストフレームワークであるGinkgoとGomegaを使いSonobuoyのカスタムプラグインとして実行できるようにテストを実装しています。例として以下のようなテストを実装しています。 cluster-autoscalerを稼働させインスタンス増減が機能するかを確認するデプロイされたpodがすべてreadyとなっているかupstreamから検証する prometheusがscrapeするjobがすべて成功しているかどうか実行基盤にデプロイされているアプリケーションにおいてSIGTERMの挙動が期待しているものとなっているかrolling restartさせてみる spinnakerのpipelineを設定したアプリケーションがすべてデプロイされているかを確認する fluentdによるログ収集が機能しているかカスタムプラグインについては公式のドキュメントが充実しています。作成手順は簡単です手順通りに実行すればすぐに導入可能と思います。 sonobuoy.io 前述した内容についてテストを実装してimageをbuildし、 Sonobuoy pluginのcommandが以下のスクリプトを参照するようにしてGinkgoを実行するようにしています。 #!/bin/bash set -x results_dir = " ${RESULTS_DIR :-/tmp/results } " mkdir -p $results_dir saveResults() { cd ${results_dir} tar czf results.tar.gz * printf ${results_dir} /results.tar.gz > ${results_dir} /done } trap saveResults EXIT ginkgo_args = () if [[ -n ${E2E_DRYRUN :- } ]] ; then ginkgo_args+ = ( " --dryRun=true " ) fi ginkgo_args+ = ( " -ginkgo.focus= ${E2E_FOCUS} " " -ginkgo.skip= ${E2E_SKIP} " " -ginkgo.noColor=true " " -ginkgo.v=false " " -ginkgo.reportFile= ${results_dir} /junit.xml " ) e2e_args = () e2e_args+ = ( " -kubeconfig= ${E2E_KUBECONFIG} " " -disable-log-dump=true " " -dump-logs-on-failure=false " ) extra_args = (${E2E_EXTRA_ARGS :- }) target = " ${E2E_TARGET :-apps } " cd /go/src/github.com/lifull/cluster/ test /e2e ginkgo $target -- " ${ginkgo_args[ @ ]} " " ${e2e_args[ @ ]} " " ${extra_args[ @ ]} " | ( tee ${results_dir} /e2e.log ) && ret = 0 || ret = $? saveResults exit ${ret} 実はこのタスクは私が今のチームにJOINした際のオンボーディングの一環として担当させてもらったタスクでした。そういった経緯のためにクラスタ挙動の理解が浅く、運用開始当初は稼働中のクラスタでは動作するけど構築直後には動作しないといった不十分な実装になっていたりnodeの状態によって失敗するといった不安定さも多く残っていました。例えばこのコードは安定したdeploymentにおいては稼働しますが、spotインスタンスに配置されたpodがspotのterminationによってEvictされたり、deschedulerによってPodが移動されている最中に実行されたりすると失敗してしまいます。 Context( "Deployment" , func () { var dList *appsv1.DeploymentList BeforeEach( func () { deployments, err := cs.AppsV1().Deployments( "" ).List(metav1.ListOptions{}) if err != nil { panic (err.Error()) } dList = deployments }) It( "should be fullfill specified number of replica" , func () { errList := make ([] error , 0 ) for _, d := range dList.Items { if deployment.IsFulfilledDesiredReplica(&d) != true { e := errors.New(fmt.Sprintf( "Failure deployment ns:%s name:%s check replicas (%d desired | %d updated | %d total | %d available | %d unavailable)" , d.GetNamespace(), d.GetName(), *(d.Spec.Replicas), d.Status.UpdatedReplicas, d.Status.Replicas, d.Status.AvailableReplicas, d.Status.UnavailableReplicas)) errList = append (errList, e) } } Expect(errList).To(BeEmpty()) }) }) そういったケースを考慮してpolling処理を行いながらdeploymentを満たすかどうかを判定するような処理に修正しています。 Kubernetesの挙動を知る意味でもテストを書くのは有益ですし、Kubernetes本体に実装されているテストを参考にしつつ挙動を理解していくのは学習方法としても良かったと感じています。 interval := 5 * time.Second duration := 3 * time.Minute err := wait.PollImmediate(interval, duration, func () ( bool , error ) { return deployment.IsFulfilledDesiredReplica(&d), nil }) if err == wait.ErrWaitTimeout { e := rrors.New(fmt.Sprintf( "Failure deployment ns:%s name:%s check replicas (%d desired | %d updated | %d total | %d available | %d unavailable)" , d.GetNamespace(), d.GetName(), *(d.Spec.Replicas), d.Status.UpdatedReplicas, d.Status.Replicas, d.Status.AvailableReplicas, d.Status.UnavailableReplicas)) errList = append (errList, e) } 実行したテスト結果はslackに通知し、失敗時のログが後から確認できるようにS3に保存するように設定してあります。 Sonobuoyで実行されたテストは実行前のnodeの状態や実行時のログを残すことが出来、どういう状態で失敗したかの詳細を確認することが出来ます。こうしてテストコードで提供機能の正常稼働を保証しバージョンアップにおいてもそれらが正しく機能するかが判定できるテスト基盤が用意できました。クラスタ構築の不安を軽減する LIFULLではいつ誰が実行しても期待するクラスタが手に入る状態を一つの目標としていました。気軽に稼働中のクラスタのクローンが手に入り破壊的変更を試すことができるのは開発を支える視点でも優位なものとなります。そのための材料として構築の自動化と構築後のクラスタにおいてE2EテストがGreenになることは重要でした。現在、構築手順についてはすべてコードベースで定義されスクリプト実行に依存し手作業は一切排除されています。さらにリソースを操作するための権限差異、OS依存の環境差異などにより構築が失敗する状態を避けるため AWS CloudFormationでAWS Systems Manager Automationを構築し固定されたマシンイメージ・権限に基づいてスクリプトが実行できる環境として整備してあります。この構築環境を利用し「毎日、EC2インスタンスからクラスタ構築スクリプトと一緒にE2Eテストを実行する」ことにしています。毎日構築を試すことにより構築スクリプトの健全性が定期的に保証される構築されたクラスタはE2Eテストによって期待する動作を保証されるこの2つが担保されていることで構築スクリプトの風化やデグレの不安から開放されポジティブに開発に取り組むことが出来ます。おわりに以上、アプリケーション実行基盤開発を支える視点での取り組みについて紹介してきました。目新しいものではありませんがこういった取り組みによりスピード感を損なわずチャレンジングな開発に取り組むことができます。今後はテストの拡充を行うことでさらなる安心を得て、一切手作業が発生しないクラスタの完全自動切り替えなどにも挑戦して行きたいと思います。 E2Eテスト導入の参考になれば幸いです。また、LIFULLではメンバーを募集しております！カジュアル面談もありますのでご興味ある方は是非ご参加ください！ hrmos.co

2020/10/01

マーケティングとエンジニアの両立

どうも【エンジニアの「市場価値」を向上する】をキーワードに活動している @サムです。今回はエンジニアの新しいスキル『マーケティング × エンジニア』について書いていきます。昔と今のITエンジニア一概にITエンジニアといっても、Webエンジニア、インフラ（サーバ）エンジニア、フロントエンドエンジニア等、様々です。携わる環境や言語の違いから、必要なスキルも変わってくるため、より専門性の高さが求められていました。しかし最近は専門性の高さよりも、汎用性の高い（メインスキル＋サブスキルを持つ）エンジニアの需要が増えてきていると感じています。例えば、ほんの数年前まではiDC（インターネットデータセンター）と契約したり自分たちで物理サーバを用意するのが当たり前でした。用意したサーバにLAMP環境を構築したり、サーバやデータベースの保守運用も必要なので専用のエンジニアもいました。けれども、AWSやGCPなどクラウド化が進み、インフラ面の構築がGUIベースで簡単に行えるだけでなく、保守面もCI/CDを活用する流れに変わりました。そのため、 Webエンジニアがインフラ面も担当する事が多くなったと思います。そういった流れから、現状はITエンジニアは職種の掛け合わせ「 ITエンジニア ✕ n 」が当たり前になってきています。例えば... Webエンジニア ✕ インフラ iOS・Androidエンジニア ✕ バックエンドなど... その流れはエンジニアスキルの掛け合わせだけでは収まりません。プログラミング ✕ 数学などの統計学＝データサイエンティストエンジニア ✕ 人事＝ジンジニアつまり、ITエンジニアは専門性を高めるだけでなく、オイラー図のように様々な職種やスキルと掛け合わせることで、新しいサービスの開発や、既存サービスの成長に貢献できる人材が求められています。サービスが使われる仕組みを作り出す「エンジニア」サービスを世の中にリリースするにあたり重要なことな何でしょうか？それは「サービスが使われる」ことです。どんなに良いサービスも使われなければ、それまでです。そのため、サービスが使われる仕組みが必要になってきます。それをエンジニアスキルを使って実現するのが、今回のテーマである『マーケティング × エンジニア』になります。なぜマーケティングなのかまず、マーケティングを4Pで表すと、各分野でエンジニアリングが関係する部分がありますが、LIFULL HOME'Sの事業でいうと最も大きいのはコミュニケーション（プロモーション）です。コミュニケーションは新規客と既存客に分かれ、新規客はアドテク界隈の技術が代表的です。そして、主に既存客へのコミュニケーションの自動化を行うもので、CRMの考え方を母体とするのが「マーケティング・オートメーション・ツール（以下MAツール）」です。その名前のとおり、マーケティングを仕組み化するツールで、MAツールはGDPR等の第三者データの活用規制によってより一層注目度が高い分野と言えます。 MAツールを導入すればいいだけじゃないの？もちろん導入だけで見れは簡単です。しかし目的はMAツールの導入ではなく、使われるサービスの仕組み化なのです。MAツールはマーケティング全般をツールを使って実施していくため、ある程度のマーケティング知識が必要になってきます。そのため、マーケティングの知識や経験が浅い場合は、MAツールを使いこなせないというリスクもあります。それは一般的なソフトウェアも同様ですね。 MAツールを使うのがエンジニアである必要があるの？もちろんツールを使うだけならエンジニアである必要はありません。しかしオムニチャネル *1 を始め、ユーザーにアプローチする戦略のオートメーション化を考えると、MAツールとそれぞれのチャネル *2 との連携は欠かせません。もちろんLINEやメールと連携できる機能を最初から提供しているMAツールも多く存在します。しかし、既存のWebアプリケーションやすでに使われているサービスを全て１つにまとめるには、必ずサービスとMAツールを繋げるアプリケーション開発が係わってきます。こういった事から、マーケティングの知識を持ち、MAツールを使いこなし、サービスを横断して繋げるための開発ができるスキルを持ったエンジニアが必要になってくるのです。マーケティング × エンジニアのスキルとはマーケティングとプログラミングの知識を持ったエンジニアのスキルはどのようなものでしょうか？そもそもマーケティングのスキル全般を収めてしまうと、それはマーケターの領域になります。もちろんスキルはあればあるほど良いので、マーケター × エンジニアでも問題ありませんが、この場ではあくまでエンジニアとしてマーケティングに着目していきます。上記でも述べましたが、マーケティングを一番有効・効率的に行えるのが「MAツール」です。基本的にはこのツールを使いこなすスキルは必須となり、MAツールと連携できるサービスの開発が主軸になると思います。つまりスキルを分けると次のようになります。マーケティングスキル ...MAツールの利用、連携（、MAツールを使うために必要なマーケティング知識）エンジニアスキル ...MAツールや既存サービスと連携させるためのAPI開発もちろん、上記以外でもサービスを構築するためのインフラスキルや、各サービスが配信しているメールのHTMLコーディングやチャットボットなどのUI/UXなど、マイクロサービスを考慮すると必要なスキルは幅広くなってきます。マーケティング × エンジニアの目指すべきところマーケティング × エンジニアとは、サービスが使われる仕組みを作り出す「エンジニア」になります。 MAツールを中心として各サービスとの連携を開発し、エンドユーザに対して様々なチャネルを通じてサービスを配信していく機能を創り出すことです。それはサービスにおけるLTV（LifeTime Value）やARPU（ Average Revenue Per User）にも繋がる大切なものです。今後のエンジニアは現状のテクニカルスキルの延長線ではなく、そのスキルで何を成し遂げたいかで学ぶスキルが変わってくると思います。その中でも、ビジネス寄りでサービスの成長を考えたマーケティングスキルを持ったエンジニアは、企業にとって無くてはならない存在になるはずです。最後にこれまで『マーケティング × エンジニア』について書きましたが、今後もこういったハイブリット型のエンジニアは増えてくると考えています。フルスタックエンジニアがいるように、サービスを創るだけでなく、いずれはサービスそのものの成長にも新しい目線で貢献できるエンジニアになってほしいです。告知 Ltech では、LIFULLエンジニアが中心となって皆様の技術欲を満たすよう実例を交えた勉強会を開催しています。今後もLtechを積極的に開催していきますので、ぜひ気になった方は、connpassでLIFULLのメンバー登録をよろしくお願いします！ lifull.connpass.com *1 : オムニチャネルとは、店舗やアプリなどエンドユーザとあらゆる接点で最適な購入体験を提供すること *2 : チャネルとは、エンドユーザと接点を持つ店舗やアプリなどのサービスのこと

2020/09/30

技術基盤部門が、LIFULL HOME'Sの技術的負債解消に立ち向かった話

こんにちは、LIFULL HOME'Sの技術基盤部門に所属している戸野です。 LIFULL HOME'Sのエンジニア組織は大きく分けて2つに分かれています。 LIFULL HOME'Sに限らず、プロダクト・サービス全体の基盤システムを保守・改善する技術基盤部門と、ビジネスサイドと密接にコミュニケーションしながら、エンドユーザーが触れるプロダクトを日々開発する事業開発部門です。下記のエントリでは、事業開発部門における技術的負債解消の取り組みが紹介されています。 www.lifull.blog 一方、技術基盤部門でも各PJでLIFULL HOME'Sの技術的負債解消に取り組んでいます。そこで、今回は技術基盤部門での技術的負債解消の取り組みをご紹介したいと思います。大規模サービスになると、技術的負債との戦いは避けられないでしょう。私達の取り組みが少しでもお役に立てたら幸いです。技術基盤部門の体制と取り組み価値提供を加速させるために技術基盤部門では、技術的負債解消の文脈でバックエンド・フロントエンドともに既存アプリケーション改修を行っていますフロントエンドの既存アプリケーション改修についてはこちらの記事で紹介されています。 www.lifull.blog 私がアサインされているPJでは、バックエンドの既存アプリケーション改修を、現在2名体制で取り組んでいます。具体的にどのような技術的負債があったかと言いますと、設計レベル何重にもなっているクラスの継承関係処理の流れがとても分かりづらい複雑な依存関係実装レベルマジックメソッドがあらゆるところで使われているためデバッグしづらい動的に呼ばれるクラス、メソッドが多くデバッグしづらいビジネスロジックがテンプレートエンジンに記載されているなどがあってそれぞれに対応していきました。 PJを進める上での制約このような技術的負債に立ち向かっていくわけですが、技術基盤部門と事業開発部門が並行して開発を進めるため、当然制約がある中での開発でした。そして、具体的には次のような制約がありました。制約💁‍♂️ 事業開発部門の人数の方が多く、並行開発による衝突のリスクが常にあるので、事業開発部門の変更をウォッチしコミュニケーションを適宜取り調整する必要があった。事業開発部門の人数の方が多く、速度的に技術的負債の「増大スピード > 解消スピード」であるため、手当たり次第にリファクタリングを行うのではなく、効果の高い部分から対処する必要があった。事業開発部門の開発を停止させることはできないため、バグが確実に出ないようにQCDのQ重視でテストを厚くし、後方互換性を維持したAPI設計の必要があった技術的負債解消のために講じた具体的な取り組みこれらの制約の中で私達は技術的負債の解消を進めていきました。そこで、設計実装レベル両方で技術的負債を解消するための取り組みを3つ紹介します。それぞれの取り組みの説明、メリットと大変だったことを具体的に説明しています。全体を俯瞰して分析し本質的な問題点と解決策の洗い出し技術基盤部門がLIFULL HOME'Sの技術的負債を解消することに取り組むメリットは、事業開発部門が工数的にできないような、広い範囲での根本的なリファクタリングを行えることだと思います。広い範囲での改修になるので、部分最適な設計実装にならないようにする必要があります。そこで、UMLを駆使してリバースエンジニアリングを行い、全体的にクラスの依存関係、継承関係、API呼び出しなどを調査し現状の本質的な問題と解決策を分析しました。メリット🙆‍♂️ そもそもの設計レベルから見直すことができ、できるだけ理想に近い形の設計をすることができた大変だったこと🤷‍♂️ 継承関係と依存関係が複雑すぎて現状のソースを理解、分析するのにかなり苦労した古いAPIをやめて新しいAPIを呼び出すように改修 LIFULL HOME'Sでは複数のAPIが使われていて、中には古いAPIが使われている箇所があります。古いAPIはアーキテクチャの技術的負債があったりして利用しづらいので、できるだけ古いAPIの呼び出しをやめて、新しいAPIを呼び出す実装に修正していきました。新しいAPIはテストコードが完備されているのとアーキテクチャの面で分かりやすいので、以前よりも保守性可読性が上がったと考えています。メリット🙆‍♂️ (廃止予定の)古いAPIを廃止するのに1歩近づいた大変だったこと🤷‍♂️ 古いAPIのアーキテクチャが複雑で、調査分析の工数がかなりかかったビジネスロジックと表示ロジックの適切な分割ビジネスロジックと表示ロジックがフロント側のシステムに混在していて、フロント側のコードが肥大化し、かなりメンテナンスしづらい状況でした。そこで、他PJが考えていたビジネスロジックと表示ロジックの切り分けのルールを参考にしながら、ビジネスロジックをAPI側、表示ロジックをフロント側に実装するように切り分けていきました。メリット🙆‍♂️ フロント側のコードのボリュームが小さくなり、以前よりも調査しやすくなった各システムの責務が明確になり、以前よりも凝集度の高いメンテナンスしやすいコードになった大変だったこと🤷‍♂️ 単位やprefixのような文字列をドメインとして扱うかどうかの判定で悩み、ビジネスロジックか表示ロジックかの切り分けが難しかった最後に技術基盤部門での技術的負債解消の取り組みを紹介させていただきました。技術的負債解消は、直接的にビジネスの価値提供をするわけではないので、どうしても優先順位を高くつけづらいところがあると思います。しかし、技術的負債が積み重なるとビジネスの価値提供も鈍化するので、かなり重要なことだと考えています。技術基盤部門という立場で、今後も技術的負債解消に立ち向かい、長期的に価値提供ができるシステムを構築していきたいです。

2020/09/29

地方開発拠点で働くエンジニア

LIFULLのエンジニアの村田です。私は2018年までLIFULL東京本社で勤務していましたが、現在は北海道の札幌拠点に勤務しています。当時LIFULLには、全国に営業拠点はあったものの地方開発拠点はありませんでした。私が北海道に移住するタイミングで札幌の営業拠点に開発拠点を整備することになり、LIFULLにとって初の地方開発拠点が誕生しました。本エントリーでは、東京に長年勤務していたエンジニアが地方開発拠点で働くようになって感じたメリット・デメリットおよび、今後どのような働き方になっていくのか思うことをつらつらと書いていこうと思います。内容が札幌に限定されている部分も多々ありますがコロナ禍でのリモートワークが普及する中、地方に移住しようと考えているエンジニアの方に向けて参考になれば幸いです。地方(札幌)拠点の良いところ家賃が安いまず何と言ってもこれ。都心に比べると、家賃が圧倒的に安いです。同じ家賃で広い部屋に住める！私の場合は、3人家族で2Kから3LDKに引っ越しましたが東京にいた時よりもトータルで家賃が安くなったにも関わらず広さは2倍近くになりました。参考までにですが、私が住んでいる行政区の家賃相場と東京23区で比較的家賃相場が低い足立区と比べてみても ▼ 札幌市豊平区の家賃相場 https://www.homes.co.jp/chintai/hokkaido/sapporo_toyohira-city/price/ ▼ 東京都足立区の家賃相場 https://www.homes.co.jp/chintai/tokyo/adachi-city/price/ およそ2倍の家賃の差があります。リモートワークにおける仕事部屋の確保のしやすさという点では非常に大きなメリットですね。上記の例では札幌ですが、他の地方でも都心に比べれば家賃が下がる可能性は高いはず。通勤が楽になった通勤のストレスがまったくないというわけではありませんが、毎日満員電車に揺られていた頃に比べると、雲泥の差です。札幌はコンパクトシティで、地下鉄の最寄駅から中心地さっぽろ駅まで、通勤時間がだいたい10〜15分以内に収まります。住む場所によっては、自転車で通勤することも十分可能です。リモートワークであれば、そもそも通勤に関しては問題になりにくいかもしれませんが、場合によっては出社する必要があるケースも出てくるので通勤が快適であるに越したことはないですよね。採用・勤務範囲が広がる会社の勤務範囲が広がることは会社にとってもメリットになります。今まではエンジニアの採用は東京勤務が必須であり、本社に通勤できる範囲のエンジニアしか採用できませんでした。札幌拠点ができたことで、札幌にいるエンジニアも採用の対象となり、採用の幅が広がりました。また、北海道出身の社員もLIFULLにはたくさん働いていますので、彼らが北海道に戻るようなケースがあった場合は札幌拠点で働き続けるといった選択肢も用意できるようになりました。その他メリットエンジニア視点ではありませんが、他にもご飯が美味しい、子育てに優しい環境、夏それほど暑くないなどなど、総じて言えることはQOLがかなり向上したと思います。地方(札幌)拠点の気になるところ勉強会の開催数が少ない。東京にいた頃は、平日もぎっしり様々な種類の勉強会が行われていましたが北海道の勉強会の開催数はかなり少ないです。人口比率からして仕方ないことですが、エンジニアにとっては残念な点になるかと思います。しかし、コロナ禍で勉強会がオンライン開催されることが多く札幌にいながらでもこういった勉強会に参加できるようになってきたのでこの点のデメリットはなくなりつつあります。情報システム部のサポートが手薄情報システム部のメンバーが拠点に存在しない場合、 PCのキッティング等は本社の情報システム部門が行ないます。万が一業務PCが故障した場合、本社から新しいPCが送られてくるまで業務がまったくできない状態になってしまいます。また、PCが不調の場合でも本社であれば、直接PCを持ち込むなどして情シスのサポートをすぐに受けられますがそれが地方拠点だとできないため、このあたりのケースに備えて予備のPCをあらかじめ用意しておく等、対策を考えておく必要があります。冬が厳しい(北海道限定) 一年の半分は寒く、1月〜4月は雪が積もりっぱなしです。北海道に来た年は、3-4回盛大に雪の上を滑りました。エンジニアにとって、手は命なので雪で滑って骨折したなんてことにならないよう、細心の注意を払う必要があります。在宅勤務の場合は、吹雪にさらされる場面は少なくなるものの自宅の暖房代がかさんでしまうのが辛いところです。地方拠点で苦労したこと私のミッションは、LIFULLの価値創造を加速させるようなエンジニア組織を札幌拠点でも構築することでした。本社にエンジニアが集中している中で、1人だけ物理的な場所が離れたオフィスにいる身としては本社とどうやって連携を取っていけば良いか手探り状態でした。その中でも特に困った事が、本社との会話におけるコミュニケーションです。本社の会議に私だけリモートで参加するスタイルになるわけですが、会議の音声がクリアに拾えるかどうかは会議室の設備に大きく依存します。高価なマイク設備が設置された会議室であれば、ある程度広い範囲のメンバーの声をクリアに聞き取れることができます。逆にマイク設備がなくメンバー一人のPCを利用したミーティングでは、そうはいきません。ミーティングを行う場所によっては、あらかじめ集音マイクを用意してもらうように参加メンバーに依頼したりしていました。設備を揃えたとしても、離れた位置にいるメンバー同士での会話はどうしても把握しづらいなど体感値として、MTGの内容のうち6〜7割キャッチアップできれば上出来だったのではないでしょうか。コミュニケーションに苦戦しつつも私が強く意識していたことは「この仕事を任せたいけど、メンバーが本社にいないなら無理かも」といった、判断をされないように実績を積み上げていく事でした。前例が無い状態で、成功事例を作ることは非常に重要です。拠点のメンバーでも、本社のメンバーと問題なく連携して仕事を遂行できるということを証明するため、基本はどのような仕事も引き受けるようにしました。実績を積み上げることで、開発拠点の可能性を広げ全国にどんどん開発拠点を展開していくような未来を描きたいと思っていたからです。最終的には、全国にいるエンジニアが横断でチームを組んで PJを遂行するような働き方を実現したいと思っていました。コロナになって変わったこと開発拠点が設立されて1年が過ぎ、新しいメンバーが増え実績を着実に積み上げている中、ある出来事で状況は一変しました。そう、コロナです。コロナによる緊急事態宣言下の中、 LIFULLでは比較的早くリモートワークが導入されました。これがきっかけで、拠点と本社のコミュニケーションの質が劇的に改善されることになります。札幌拠点の開発チームは2020年から、東京にいるチームと組んでPJを進めていたのですがコロナ禍以前では、彼らとのやりとりは基本はチャットベースが中心で週1回の定例MTGで情報共有を行う程度でした。 MTGも回線や設備が悪い状態で音声が聞き取りにくいこともあり、非常にストレスでした。現在は各メンバーがZoomで常時接続しながら仕事をしており、何かあればすぐにコミュニケーションをとれるようにしています。画面共有によるペアプロや、オペレーションのダブルチェックといったことも苦労なくできるようになりました。あれほど苦労していたMTGも、全員が同じ条件でWeb会議システムに参加する形式になったので参加メンバーの声がききとりやすくなり、MTGの雰囲気も掴みやすくなりました。拠点も本社もフラットに今まではどんな工夫を施したとしても本社、拠点という区切りがありました。物理的な距離が離れた拠点にいる、という事実は消すことができず何かを判断するにもそこは意識せざるを得ません。コロナになって、リモートワークが導入されたことでどこで働いているのか、ということはあまり問題ではなくなりました。本社だからとか、拠点だからとか、地方だからとか、東京だからとかそれらに差が生まれなくなり、働く場所における条件がフラットの状態になったのです。拠点ならではの価値を出す事や、本社とうまく連携するためのノウハウを溜め込んでいくといった必要性がもやは無くなりました。こうなってくると、組織の形も変わってくるのではないでしょうか？今までは同じ拠点の社員で組織を構成せざるを得なかったケースが多いようでしたが拠点という概念を外して、組織を編成することが容易になりました。少なくとも、エンジニアのグループをあえて拠点で区切る意味はもう無いように思えます。日本全国に散らばった「働きたい場所で働くエンジニア」同士がチームを組んで、リモートでコミュニケーションをとりながら仕事を進めていけるような、私が目指していた遠い未来にぐっと近づきました。まとめコロナによる新しい生活様式が確立され、リモートワークが広がりつつある今、物理的な場所に縛られず働くことが可能になってきました。地方拠点においても、リモートワーク浸透により本社との連携が劇的に改善されるなど、今までのデメリットが改善されより生産性を上げて仕事ができるようになりました。選択肢がぐっと広まったこの機会に、自身の働き方を見直してみても良いかもしれません。何はともあれ、北海道はいいところです。

2020/09/28

負債化したレガシーブラウザ対応のリファクタリングへの取組み

プロダクトエンジニアリング部の柴田です。普段は LIFULL HOME'S の賃貸領域でフロントエンドの開発・設計を担当しております。今回は LIFULL HOME'S での Web フロントエンドおけるレガシーブラウザ対応の負債解消への取り組みについてご紹介いたします。背景現在の LIFULL HOME'S の大枠は 2011 年ころに作られたものであり、当時の CSS3 サポート状況に差異のあるブラウザで表示を担保するには装飾的なパーツはほぼ画像で実装する必要がありました。例えば、次に示すような枠の装飾はガイド線の外側を 8 つにスライスし、それぞれを background-image として割り当てるような実装を行います。カードUIのスライス例 < div class = "ui-frame" > < div class = "content" > ... </ div >  < div class = "ui-frame__top-left" ></ div > < div class = "ui-frame__top" ></ div > < div class = "ui-frame__top-right" ></ div > < div class = "ui-frame__left" ></ div > < div class = "ui-frame__right" ></ div > < div class = "ui-frame__bottom-left" ></ div > < div class = "ui-frame__bottom" ></ div > < div class = "ui-frame__bottom-right" ></ div > </ div > 現在では css のみで実現できるデザインであっても当時はこのように手間がかかる実装だったわけですね。 LIFULL HOME'S での課題と対応リフロー・リペイントの発生情報をよりリッチに表現するため LIFULL HOME'S でもこの手法を広くサービス内の UI で適用してきました。具体的には JavaScript で特定のセレクタを持つ要素に対し、各スプライトの背景を設定した空の DOM を挿入する処理を行うことで、実装時にクロスブラウザを意識することなく少ない工数でリッチな UI を実現できるようにしていたのです。しかし、これにはリフロー・リペイントを発生させ、対象要素の数が増えるごとに比例的にレンダリングコストを増やしてしまうという大きな問題がありました。この問題は特に物件一覧ページ上が顕著で、それぞれの紹介物件ごとにこの実装を利用したパーツが使われていたため Lighthouse 上でも大きくパフォーマンススコアを下げる要因となっていました。物件一覧ページの例。赤太枠で示した箇所でリフローを起こしており、このページ全体では約 30 箇所利用されていた。対応当時各ブラウザ間の CSS3 の実装足並みが揃っていなかった名残が現在の技術的負債となっていたため、これを JavaScript を利用せず、完全に CSS に置き換える対応をとりました。私は主に賃貸領域のフロントエンド開発を担当しているのですが、このパーツは全マーケットで広く利用されていることもあり、特に以下に注意を払い対応をすすめました。追加したプロパティ起因でレイアウト崩れが起きないこと全マーケットを通してのデザイナー・企画職との合意結果この改修をリリースしたことで、ページの表示速度を大きく向上することができました。 Lighthouse で計測した具体的な効果としては Performance スコアを 5.8 ポイント向上 Speed Index において 2.6 秒の改善となっており、実際に体感できるレベルでの速度改善となりました。PC から LIFULL HOME'S を利用する際の快適さの向上にも貢献できたかと思います。利用箇所が多すぎて刷新後のチェックを網羅しきれない課題がありましたが、こちらは全社的にエンジニア・デザイナーにご協力いただいたこともあってデザイン崩れなどが発生することもなくリリースすることができました。まとめ聖域をつくらないことが大事今回実施した改修は技術的な観点ではさして難しくない改善であるといえます。しかし、長年の運用によって肥大化した View の「どこで壊れるかわからない」という不安から表面的に見える課題であっても聖域化してしまう場合があることを学びました。特に汎用的に利用される UI であればあるほど解決が難しくなってくると思います。これについてはエンジニア・デザイナーが簡単にアクセスできるスタイルガイドの運用を開始し、解決と防止に取り組んでいます。 LIFULL HOME'Sのフロントエンド環境にSassが導入されたので色々やった話技術負債 ≒ 改善の種この 10 年でフロントエンドは大きく進歩しましたが、取り残されたレガシーコードが LIFULL HOME'S にはまだまだ存在します。それらを辛さと捉えるのではなく、潰せば DX または UX を向上させられる鉱脈と捉えて着実に改善していけたらと思います。

2020/09/25

技術的負債の返済の足がかりにテンプレートのParserを作った話

プロダクトエンジニアリング部の中島です。今回はフロントエンドのテンプレート部分についての負債やレガシーな機構に対する改善の取り組みについて紹介させていただきます。背景 LIFULL社のメインサービスであるLIFULL HOME'SのメインリポジトリのサーバサイドはSymfony + Twig(※テンプレートエンジン)の構成を採用しています。このリポジトリの歴史は古く、2011年頃から開発は行われており、今となってはレガシーな機構であったり、開発体験を損ねる負債的な記述も多くあります。テンプレート部分で多くみられる問題のうちいくつかをピックアップすると弊社ではこのようなものが悩みのタネになっています変数などを用いた動的な部分テンプレートの呼び出しによるgrepしやすさの低下部分テンプレートをロードするときにスコープ制御(Twigだと only属性 )をつけ忘れてテンプレート間依存関係を不透明にしてしまうテンプレートの深すぎる継承関係負債化してしまったTwig拡張関数の呼び出しが各所にちらばって残っているなどなど新規実装部分にだけに着目しても、レビューによるチェックでこれらを抑える努力はすれど負債コードを誤って参考にした開発は度々あり、レビューの漏れやレビュアー/実装者の経験不足等で徐々にこういった負債は増えていきます。こういった現状を長年みていると、次第にこれらを「commit-hook等で自動検出する仕組みがほしいな」と感じるようなり、その検知のためにテンプレート(twigファイル)をパースしてTraverseしたいという思いが芽生えてきました。もしestoolsのようにプログラムを抽象構文木(AST)に変換するParserと、それを探索するTraverser、そのASTからコードを生成するCodegenの三種の神器があれば、強引な正規表現に頼ることなく問題コードを検出したり、レガシーな機構をモダンな機構に変換したりすることも可能になります。 github.com こういった思いからLIFULL HOME'SでもTwigのParser/Traverser/Codegenを作成することにしました。 Parserを作成するためのステップ私の知る限り、界隈では一般？的にこのようなステップをたどる感じになると思います。字句解析を行う(Lexer) 字句をToken単位にまとめる(Tokenizer) TokenをNode単位にまとめる(Parser) 実コードレベルでそれぞれのステップを見てみるとこんな感じになります元コード < div class = "sample" > {% spaceless %} < div > {{ a|some_filter(b) }} </ div > {% endspaceless %} </ div > Twigでは {% ~ %} で構文を、 {{ xxx }} で値のプリンティングを表現します。 LexicalAnalyze (字句解析してTokenごとに分解) TokenStream { tokens: [ Token { type: 0, value: '<div class="sample">\n ' }, Token { type: 1, value: '' }, Token { type: 5, value: 'spaceless' }, Token { type: 3, value: '' }, Token { type: 0, value: ' <div>\n ' }, Token { type: 2, value: '' }, Token { type: 5, value: 'a' }, Token { type: 9, value: '|' }, Token { type: 5, value: 'some_filter' }, Token { type: 9, value: '(' }, Token { type: 5, value: 'b' }, Token { type: 9, value: ')' }, Token { type: 4, value: '' }, Token { type: 0, value: '\n </div>\n ' }, Token { type: 1, value: '' }, Token { type: 5, value: 'endspaceless' }, Token { type: 3, value: '' }, Token { type: 0, value: '</div>\n' }, Token { type: -1, value: '' } ], current: 0, filename: '/path/to/twig-tools/sample/twig/017.html.twig' } Parse (TokenStreamからNodeTreeへ) Node { nodes: [ TextNode { value: '<div class="sample">\n ' }, SpacelessNode { body: Node { nodes: [ TextNode { value: ' <div>\n ' }, PrintNode { expr: FilterExpression { node: NameExpression { name: 'a' }, filter: ConstantExpression { value: 'some_filter' }, args: Node { nodes: [ NameExpression { name: 'b' } ] } } }, TextNode { value: '\n </div>\n ' } ] } }, TextNode { value: '</div>\n' } ] } ToAST (NodeTreeをASTとしてJSONフォーマットに変換する) { type: 'Node' , nodes: [ { type: 'TextNode' , value: '<div class="sample"> \n ' } , { type: 'SpacelessNode' , body: { type: 'Node' , nodes: [ { type: 'TextNode' , value: ' <div> \n ' } , { type: 'PrintNode' , expr: { type: 'FilterExpression' , node: { type: 'NameExpression' , name: 'a' } , filter: { type: 'ConstantExpression' , value: 'some_filter' } , args: { type: 'Node' , nodes: [ { type: 'NameExpression' , name: 'b' } ] } } } , { type: 'TextNode' , value: ' \n </div> \n ' } ] } } , { type: 'TextNode' , value: '</div> \n ' } ] } 実装について上述のサンプルデータでなんとなくそれぞれの役割的なものが見えてきたかと思います。全てのフェーズをゴリゴリと自前で実装するのは仕様把握などの面で非常に大変ですが、そもそもTwig自体の中にLexer/Tokenizer/Parserの現行実装があるわけで、それを参考にしながら書いて、それに加えて、最終的なNodeをASTとしてJSONフォーマットで吐き出させる機構・そのASTを再帰的に探索するコード、ASTからのコード生成部分だけを作ればいいだけなので実はそこまでチャレンジングな取り組みというわけでもないのです。 TwigのLexerをみてみましょう。 Lexer.php while ($this- > cursor < $this-> end) { ... switch ($this- > state) { case self::STATE_DATA: $this- > lexData(); break; case self::STATE_BLOCK: $this- > lexBlock(); break; case self::STATE_VAR: $this- > lexVar(); break; case self::STATE_STRING: $this- > lexString(); break; ... } } テンプレート文字列を先頭から順次スキャンしていって構文部分のキーワードの出現をみながらモードを切り替え、それぞれをTokenとして分割していきます。そうしてできたTokenの集まりをToken Streamというオブジェクト表現にして Parser でNode単位を作っていくわけです。このNodeのSyntaxはNodeの種類によって変わるので、すべてのNodeのParserを作りきらないといけないわけなのでやや骨がおれますが、これも参考コードとしてTwigの既存のパーサがあるので明けない夜はないという感じで進められるわけです Node一覧(github/twig) また、Twig拡張でNodeを自前で増やしてる方々はそこのParserもかくことになります。弊社の場合はSymfonyがTwigの拡張をいくつか(3~4個 )作っていたのと、自前で拡張を1~2個かいてたのでその分も書くことにしました。かかった工数はTraverser{traverse|replace}/Codegen/Spec含めてだいたい半月程度です。 NodeとSyntaxバリエーションの一部コード自体はまだ公開してはいないのですがこんな感じで動きます。 (TwigのバージョンによってLexer部分が変わるので公開してもあまりoss的に意味ないかなというのが本音です) const { parser, codegen, traverser } = require( '@lifull/twig-tools' ); let template = ` <div class = "sample" > { % spaceless % } <div> { % include '/path/to/partial.html.twig' % }{ # onlyをつけ忘れている # } </div> { % endspaceless % } </div> `; let ast = parser.parse(template); traverser.traverse(ast, { enter(node, parent ) { if (node.type === 'IncludeNode' && !node.only) { console.warn( 'onlyをつけ忘れのinclude nodeがありました。規約違反です！' ); console.warn( '>' , codegen.generate(node)); } } } ) 実行 % node sample.js onlyをつけ忘れのinclude nodeがありました。規約違反です！ > { % include " /path/to/partial.html.twig " % } 出力を見るとうまく検知できていることがわかります。 Traverser等のインタフェースはestoolsをとくに参考にして書きました。おわりに上述のコードからもテンプレートをAST化してTraverseできるようにすることにより、問題コードの検知や変換等の処理をたった数行でかけるようになったことがわかります。現在はこの三種の神器(Parser/Traverser/Codegen)を用いて問題コードの検知や、古い機構の一括変換を遂行してレガシーなテンプレートと戦略的に向き合う努力を進めています。人力で修正する前提では何年たっても実現できないような大規模なリファクタリングであっても、仕組みを整えることで実現に近づけることもあると思います。これからも、緩やかではありますが、着実な改善を続けていきたいです。

2020/09/24

LIFULL HOME'Sのフロントエンド環境にSassが導入されたので色々やった話

プロダクトエンジニアリング部のえびさわです。この一年でLIFULL HOME’Sのメイン開発サーバーのフロントエンド環境が大きく刷新されました。以前は使えなかったSassも導入され、モリモリとDXが向上しております😭 今回はマークアップにフォーカスし、刷新前に感じていた課題とSass導入後に行なった改善策をご紹介します。課題カラーコードのtypo, 種類が多い LIFULL HOME’S にはデザインガイドラインが存在し、使う色はある程度パターン化されています。代表的なもので言うと弊社のコーポレートカラーでもある #ed6103 です。 LIFULLのコーポレートカラー #ed6103 CSSしか使えない場合、カラーコードは手打ちないしコピペするしかありません。しかし、以下のような微妙な違いの場合はデザイナー・フロントエンドエンジニアともにレビューで見落とす可能性があります。違いがわからないデザイン的にあえてずらしているのかtypoなのか、あとから開発している人間にはわかりません。「すでに実装されているものだから正だな！コピペ実装したろ！」とかやっちゃうともう地獄です。秩序が崩壊します。また、似たようなカラーコードも多いです。例えば以下の図はすべて同じページで使われているグレーです。グレー激戦区特に #fafafa ~ #f5f5f5 は激戦区かつモニタ輝度によっては真っ白にしか見えないので誤実装が発生したり、雰囲気で色を当ててレビューまで持っていってしまうことがあります（大抵デザイナーさんにしょっぴかれます）同じスタイルのcssが大量にある、コピペが大変 LIFULL HOME’Sはモジュールという単位で各コンポーネントを管理しており、それぞれ HTML + CSS (+ JS) が1セットになっています。 LIFULL HOME'S 賃貸の物件ページで使われているモジュールこちらの図は実際に使われているモジュールです。少しわかりにくいですが、「物件の費用目安を見る」「お気に入りに追加」「シェア（LINE/メール）」の3モジュールに分割されています。これらはボタンの見た目は同じですがHTML/CSSは完全に別となっており、いずれかのCSSを変更してもスタイルが同期することはありません。そのため影響範囲を最小限に止めることができ、大規模開発においては大きなメリットとなっています。一方で似たようなデザインでコンポーネントを作成する際はCSSも丸ごとコピペする必要があります。その際に微妙な差異を生み出してレビューを通過してしまったり、UIリニューアルの際に大量のファイルを更新しないといけないなどのデメリットもありました。「ここで実装されているやつと同じで」がしづらい前述の通りLIFULL HOME'Sでは殆どの場合再利用性のあるコンポーネントは作られず、独立したモジュールになっています。似ているけれど微妙に見た目が違うモジュールが存在していたり、インタラクションが異なったりしています。歴史の長さ・開発者の多さ故にすべてを制御しきれておれず、どれが正なのかがわかりません。そのため、「ここで実装されているやつと同じで」と言われても他のモジュールの方が正しいのでは…？と疑心暗鬼になりがちです。改善策共通変数・mixinの導入まず「カラーコードのtypo, 種類が多い」に対して共通変数を用意しました。変数を使うことによってtypo防止・色のリスト化が行えるため、野良色の発生を抑止できます。命名は ${$prefixColor}-{$uniqueName} としています。カラーサークル prefixは上記のカラーサークルに近いものを選び、uniqueNameはHexColorを参考につけています。たとえば #d8d8d8 であれば $mono-gainsboro といった具合です。名前がユニークすぎて色が想像できない、というのがデメリットですが $red-default , $red-lighter などの命名は中間色が来た場合が辛いですし将来的にどんな色が追加されるかもわからないので、命名被りが起こらないことを重視しています。また、UIでよく出るElements( background , border , box-shadow )は専用のcolor aliasを用意し、実装時にブレが出ないようにしています。 map-gettersの利用も検討しましたがタイピング量が増える割には恩恵が少なかったので、 $bg-xxx など専用prefixをつける形で落ち着きました。また、「同じスタイルのcssがたくさんある、コピペが多い」についてはmixinを作成しました。 LIFULL HOME'S 賃貸の物件ページで使われているモジュールこの図のボタンについては以下のmixinで解決できます。 // mixin @mixin white { border: 1px solid #d8d8d8; border-radius: 4px; box-shadow: 0 1px 1px rgba(0, 0, 0, 0.3); font-weight: bold; } // 使用時 @use 'path/mixins/buttons' as buttons; .mod-meyasu { &__button { @include buttons.white; text-align: center; padding: 12px; } } 余白はあえて設定していません。というのもボタン内のレイアウトパターンは無数のようにあり、強い制約も設けられていません。使う場面によって全く異なるルールのため、mixinではスタイリングのみ提供するという形をとっています。（引数で設定も検討しましたが、指定し始めるとキリがないのでやめました）当初はごく一部の変数とmixinのみ提供していましたが、数ヶ月に一度のペースでアップデートを行い対応範囲を広げています。スタイルガイドの導入共通変数・mixinの可視化スタイルガイド（変数一覧）スタイルガイド（mixin一覧）共通変数・mixinを導入しても、使ったらどんな見た目になるかは自分で当ててみないとわかりません。そこで、開発サーバー上にスタイルガイドを作成して共通変数・mixinをビジュアライズしました。 Usageに従ってコピペすればすぐに使えるため、実装時のブレも抑制することが可能です。スタイルガイドに載せているものは実際に運用されているコンポーネントがベースになっていますので、どのスタイルが正なのかという指針にもなります。そのため、「ここで実装されているやつと同じで」がやりやすくなります。アクセシビリティに関する実装ガイドラインスタイルガイド（フォームアクセシビリティについて）スタイルガイド（aria-*について）また、Sass導入の文脈とは異なるのですが実装時の諸注意としてアクセシビリティに関する内容も記載しました。 LIFULL HOME'Sではアクセシビリティに関するコーディングガイドラインが存在せず、雰囲気で実装しているところがありました。長年可動しているが故に最新の対応が出来ているところも少なく、以前の実装をそのまま流用してアクセシビリティが壊滅的……なんてこともあります。そこで今回スタイルガイドにガイドラインを表記し、実装例を併せることで正しいアクセシビリティ対応をできるようにしました。導入してみて実装が爆速になった全世界で500億回は言われていることだと思いますが、本当に実装が速くなりました。今まで手作業で数行〜数十行書いていたものが1,2行で書けるようになったため、ちょっとしたモジュールであれば一瞬で組めるようになりました。変数・mixinが頭に叩き込まれているか否かで実装速度は前後しますが、スタイルガイドの存在によって差は埋めやすくなっているとは思います。レビューも楽になったこれも5000億回は言われていると思いますが、レビュー時にスタイリングが正しいか否かに心血を注ぐ必要がなくなり、他の事項に集中できるようになりました。デザイナーさんとの意思疎通がしやすくなった LIFULL HOME'Sは施策の規模によってはデザイナーさん無しで開発を進め、フロントエンドエンジニアが組んだものをデザイナーさんにレビューしてもらいリリースする、ということがあります。そういった場合に「この色とこのパーツで」とざっくり相談ができるので、意思疎通が楽になりました。おわりに Sass導入前に苦しんでいた問題が緩和され、大変快適なマークアップライフを送れるようになりました☺️ 10年以上運用されている大規模サイトのためどこまでSassで対応していくかが大きな悩みでしたが、周りのデザイナーさんやエンジニアさんに助けられ対応範囲を広げていくことができました。この場を借りてお礼申し上げます🙇‍♂️🙇‍♂️ありがとうございました引き続きアップデートを行い、より良いマークアップ体験を提供できるよう努めて参りたいと思います！

2020/09/23

「データサイエンスの社会実装」を成功に導くプロジェクト・マネジメントについて考える

　こんにちは、LIFULLでData Analystとして働いている竹澤です。社外では、Mediumの Towards Data Science でContributorとして寄稿したりしています。　2020年私は主にデジタルマーケティング領域で効果検証の自働化や異常検知ロジックの開発、DXプロジェクトの立ち上げに携わってきました。　今回はデータアナリティクス/データサイエンス・プロジェクトにおけるマネジメント論の整理を試みます。あくまで私見の塊（いわゆるオレオレ）ですが。想定読者としては、Data Analyst、Data Scientist、DXプロジェクトのPMなどデータサイエンス及び分析プロジェクトに関わる全ての人を考えています。はじめに　突然ですが、あなたは「ビジネスにおけるデータサイエンスの本質的価値とは何か？」という問いに対してどう回答するでしょうか。　私は個人的に、以下の言葉でその価値を定義しています。 ”データサイエンスの価値は「プログラムに対する意思決定の権限委譲」である” 　なぜ、意思決定を権限委譲できることをビジネスの価値と定義できるか。その理由は、「ビジネスは、Decision Making（意思決定）とExecution（実行または製作）の2つで支配されている」という論拠がまず根底にあります。　そして抽象度を極限まで上げた場合、頭を動かして「考える」時間と手を動かして「実行」したり「作る」時間に分けられるということです。　その上で、人間にとって難易度が高いあるいは時間を要する意思決定が存在したとして、それらをアウトソースできることは十分価値があると考えています。具体例として、製造業の検品においてディープラーニングを用いた異常検知（画像認識）はまさに人間の目視による判断をより高精度でリプレイスするケースなど。　あるいは似た言葉として、トヨタ生産方式(TPS) で提唱されている「自働化（ニンベンのついた自動化）」のニュアンスに近い概念だと考えたりします。　以上が情報技術の専門家ではない私が、純粋に問題解決の1ソリューションとしてデータサイエンスという大きな仮説に賭けてきた背景です。なぜ書くか　前述した通り、私はデータサイエンスの問題解決能力を信じていますが一方で現実世界では、それを否定するようなファクトが目に付きます。　つまり、現状の課題として自社を含めた日本のビジネス現場におけるデータサイエンスを用いた問題解決が思うように進んでいないと考察しています。　今回はその原因の1つしてデータサイエンスプロジェクトにおける「マネジメント手法の未整備」にあると仮定し、その解決策を検討します。　その上でまずは、データ分析プロジェクトという大きな括りの中におけるデータサイエンスプロジェクトの位置付け、各プロジェクトの進み方を確認し、プロジェクトがクローズするような潜在的リスクを検討していきます。　その他、ITプロジェクトにおけるPM論は既にある程度体系化されていますが、データサイエンスプロジェクトはそうではない現状に対する問題意識があります。　また最近は特に、データサイエンスプロジェクトの遂行過程に潜む不確実性を対処するには、モデリングの能力以外のリソースの必要性を実感しています。　以上から、過去の業務経験を抽象化することで未来のプロジェクトに応用可能な、汎用的フレームワークへと昇華することを検討してきました。　まだ全く完成系ではないですが、未来への足跡として今回は現時点での限界（一次結論）を残します。分析プロジェクトの種類と目的の違いについて　ここでは、プロジェクト・マネージャー(以下PM)の視点から個人的な分析プロジェクトの分類の提案とマネジメント・スコープの明確化に取り組みます。　まずは「分析プロジェクトの分類」について見ていきます。　結論から言うと、私は「データアナリティクスプロジェクト」と「データサイエンスプロジェクト」の2つにデータ分析による問題解決を区別しています。そもそもなぜ分類が必要かというと、問題解決の種類によってプロジェクトの全体像や体制、必要なリソースが大きく変わるという結論に経験上至ったからです。　以降では、両者の違いをより鮮明にしていきます。データアナリティクスプロジェクトとは　前述した通り、私はデータサイエンスの価値を、「プログラムに対する意思決定の権限委譲」と定義しています。　よって、シンプルに上の定義域に収まると認識している問題解決はデータサイエンスプロジェクト。それ以外をデータアナリティクスプロジェクトとしています。　データアナリティクスプロジェクトの特徴は、データ分析を使ったアドホック的（一時的）な問題解決であることです。　具体例としては、統計的仮説検定によるABテストの効果検証やKPIダッシュボードの作成などが該当します。ここでは「意思決定の支援」までが責務となります。　詳細はこちらの記事に譲りますが、「意思決定の支援」においては組織の意思決定に求められる品質には「正確性・速さ・納得感」の3つがあります。　なので、その3つのうちどれかを引き上げることが目的（価値）となります。データサイエンスプロジェクトとは　データサイエンスプロジェクトの特徴は、継続的かつ定期的に訪れる意思決定をプログラムが肩代わりするような問題解決であることです。　具体例としては、コンテンツのレコメンドシステム開発やサーバーメトリクスに対する異常検知、画像認識技術によるモノの判別自動化などが該当します。　つまり、「誰にどのコンテンツをどの順番で見せるか？」というレコメンドTaskのように、定型的な意思決定の機会が何度もイテレートするTaskがサービスのバリューチェーン上に存在するとき、それらを代行するシステムの開発が目的です。　そして、データサイエンスプロジェクトの責務が「意思決定の代行」であることはプロジェクトの難易度の高さに直結します。　まずは、品質（Quality）の問題。「同じ時間で人間（既存機能）よりも高い精度」あるいは、「より短い時間で人間（既存機能）と同水準の精度」のどちらかを満たすタスク遂行能力がアウトプットの品質としてほぼ常に要求されます。　また、機械学習ライフサイクルのスケール化を目的とする MLOps の領域は、業界全体でベストプラクティスを探っている途中にあります。　以降ではデータアナリティクス/サイエンスプロジェクトそれぞれのプロジェクト・マネジメントにおけるMethodologyを整理していきます。データアナリティクスプロジェクトにおけるPM論　まずは、私のようなData Analystといった職種の主な責務であろう、データアナリティクスプロジェクトにおけるマネジメントについて見ていきます。　私はLIFULLに入社してから約1年半、CausalImapctを使ったTVCMの効果測定やABテストに対する有意差検定、事業KPIをモニタリングするためのDashboard作成など多様なアナリティクスプロジェクトに伴走してきました。　本質的にはその役割を、「今回のTVCMはうまくいったのか？」や「このUIの変更はサイトKPIにポジティブだったか？」などの問いに定量的（統計的）なアングルから新たな知識を創造する、「意思決定の支援」業務と捉えています。　そのため、上記は全てアドホック的（一時的）に発生する問いに対しての問題解決なることが多く、消費期限（使用期間）が長くても半年ほどです。　以降では、データアナリティクスプロジェクトを以下3つの観点から整理します。プロジェクトのプロセス（進み方）プロジェクト遂行に必要なリソース（スキル）と主な担当職種プロジェクトがクローズ・振り出しに戻るリスク　なお、後述するデータサイエンスプロジェクトでも同じ整理をします。プロジェクトのプロセス（進み方）ヒアリング : ステークホルダーにInterviewを行い、要求や解決すべき真の問題と制約条件（非機能要件）を見極めるために情報収集をする要件定義 : 今回の問題解決の全体像を整理するため、背景・目的・課題・原因・解決策などをドキュメント化。ステークホルダーや納期もここに記載データ抽出 : 検証や分析に必要となるデータを、DBやDWHからSQLを使って抽出。検証内容によっては、社外のデータを使用する分析集計 : LIFULLでは、分析イシューを現状調査・課題発見・効果検証・予測判別の4つに分類し、適切な解決策（統計手法）を選定結果説明 : TableauなどのBIによる結果の可視化と、その解釈を記載。ビジネスサイドに伝わる言葉でのStory Tellingが求められるプロジェクト遂行に必要なリソースと主な担当職種プロジェクト管理機能 : Project Manager（Data Analyst）データ分析機能 : Data Analyst（Data Scientist）分析レビュー機能 : Data Analyst（Data Scientist）　ただし、A/Bテストの効果検証などの比較的小規模な案件の場合、データ分析者が要件定義などの上流設計から分析まで一気通貫で行うことを想定しています。　実際にLIFULLでも、上記のアナリティクスプロジェクトと分類される案件のうち8割は、1人の人間がレビュー以外の全プロセスに実行責任を負っています。プロジェクトがクローズ・振り出しに戻るリスク問題設計のリスク : ステークホルダーが真に行いたい意思決定が曖昧なまま分析を進めると、付加価値のない分析に人件費をかけることになる説明可能性のリスク : 分析結果をステークホルダーが咀嚼しきれない問題を解消するために、解釈性に優れた解決策（統計手法）の選定が求められる役割分担のリスク : 分析の品質（正確性）を担保するために適切なレビュワーの配置や、検証内容が複数ある場合の最適な役割分担を設計する必要がある計画進捗のリスク : 書くまでもないが納期を守るために、同時並行で進む他のプロジェクトも管理する必要がある。自分の力量にあった納期の設定が大切　上記では、あえてジェネラルな問題解決における落とし穴を列挙しました。　その意図は、個人的に汎用的な問題解決能力こそが分析のValueを最大化すると考えているからです。（もちろん統計などのある程度の理解は当然だとして）　また、予算が大きいTVCMの効果検証などの事業上重要かつ手持ちの統計手法で解決可能な問題を見極めるスキル、つまりイシューから始める力も重要です。　以上で、データアナリティクスプロジェクトの進み方や、潜在的なリスクへの対処に必要となるスキルについての考察を終わります。余談：統計的因果推論の価値について　LIFULLのData Analystたちは、特に近年注目度の高い（統計的）因果推論の領域にフォーカスし、様々なチャレンジをしてきました。　その背景には、「派手な予測モデルより、因果関係の実証の方がビジネスの現場で必要とされる頻度が高いだろう」という仮説（スタンス）があったからです。　例えばA/Bテストにおいて、p値を用いる必要がある頻度主義の仮説検定ではなく、ベイズ主義に基づく仮説検定を導入しました。　また、前後比較に対する回帰分析を用いた差分の差分法(DID)。時系列データに対するグレンジャー因果検定や CausalImpact による効果測定を行いました。　このように、Webサービス開発や事業運営で遭遇する効果検証に対して、多様な統計手法を適応することで組織への価値提供に努めてきました。データサイエンスプロジェクトにおけるPM論　次に、Data ScientistやML Engineerといった職種の主な責務であろう、データサイエンスプロジェクトにおけるマネジメントについて見ていきます。　ここではいわゆる「機械学習プロジェクト」を想定して、整理していきます。　ただ繰り返しになりますが、私の中のデータサイエンスプロジェクトの本質は「プログラムに対する意思決定の権限委譲」にあると考えています。　なのでアルゴリズムの中身がML/DLかは必要条件であり、人間の意思決定のリプレイス（単なる「作業」の自動化ではない）に価値があることを強調します。　また筆者である私は、現時点で機械学習プロジェクトを完遂した経験（プロダクション環境におけるデプロイ・運用保守）はまだありません。　なので今回は、自社における未来のデータサイエンスプロジェクトに備えることを目的としてPMが把握すべきリスクをまとめます。　特に私が実務経験のない効果検証以降のプロセスは、「仕事ではじめる機械学習」の著者である有賀さんの MLOps の歩き方などを参考にさせて頂きました。スコープ：書かないこと　今回はあくまで、プロジェクト・マネージャー（PM）視点でのプロセスの抽象化やリスクの列挙になります。　なのでData Scientist視点でのモデリング過程の詳細や、Software Engineer視点でのエンジニアリングにまつわる技術的な諸問題は取り扱いません。　また、自社でWebサービス（アプリケーション）を持つ事業会社における、インハウス開発を想定しています。なので、QCDにおけるCDへの配慮等は手薄です。プロジェクトのプロセス（進み方）要件定義 : まず機械学習をしない方法も検討した上で、 Problem/Solution Fit (PSF)の理論的な妥当性を確認。またプロダクション環境での非機能要件とステークホルダーの体制の明確化、利用するローデータの確認も忘れない概念実証(PoC) : 学習データに対するEDAの結果をもとに、前処理や特徴量選択を行い、アルゴリズム候補を選定。RMSEなどの精度指標を用いたオフライン検証によって、最終的なモデルを（複数）選択効果検証 : プロトタイプ化した機械学習モデルを本番環境へデプロイ。本番トラフィックの一部を利用してA/Bテストなどを行い、ビジネスKPIを基準に既存手段との比較・評価を繰り返して本番適応の意思決定をする本番開発 : リファクタリングやワークフローのパイプライン整理、またシステムデザインや各クラウドコンポーネントを最終決定。単体テストと統合テストだけでなく、入力データの分布等に変化がないかも確認が必要保守運用 : 機械学習モデルの精度やビジネスKPIだけでなく、レスポンスタイム等のシステムメトリクスなどの指標も監視する。また、CI/CDのみならず継続的トレーニング(CT) が実行できる環境を整備するプロジェクト遂行に必要なリソースと主な担当職種　前述の通り、以下では事業会社における機械学習プロジェクトでの理想的なプロジェクト体制について検討していきます。プロジェクト承認機能 : Project Owner（Business Manager）プロジェクト管理機能 : Project Manager アルゴリズム開発機能 : Data Scientist（Machine Learning Engineer）本番開発機能 : Machine Learning Engineer（Data Scientist）保守運用機能 : Software Engineer（Machine Learning Engineer）　補足としてアルゴリズム開発以降の後半3機能は、こちらの記事におけるDevelop・Deploy・Driveの3プロセスの責務に対応するイメージです。　そして、とても重要だが十分にその必要性が検討されていない機能（体制）は、1番目と5番目の役割です。　「プロジェクト承認機能」とは具体的に、デプロイ先のプロダクトが生み出すビジネス成果（コンバージョンなどのKPI）に責任を持つBizDevの人です。　また「保守運用機能」とは、機械学習システムをデプロイ対象となるプロダクション環境のドメイン知識を持った開発者を指しています。　これらの人々は社内のMLチームの”外”にいる場合が多いですが、彼らの積極的合意がなければ、不確実性の高いMLモデルの本番適応は難しいです。　なので彼らをいかにプロジェクトの適切な段階で巻き込むことできるかが、小さな（大きな）失敗を許容してもらう上では非常に大切です。　その他にも、仮にビジネスKPIを改善できたとして、MLのデプロイはシステムに対してほぼ確実にさらなる技術的負債や不確実性を積むことになります。　そうなるとプロダクション側の開発者に旨味がなく、また運用保守の精度を保証する術も無いため、最終的な受け入れ拒否に繋がりかねません。　こうした問題への対処や交渉のために、2番目の「プロジェクト管理機能」の存在が重要になります（こちらも軽視されがちですが）。　総じて、スクラム的な顧客一体型の開発体制やPMの配置が、プロジェクト後半の受け入れ拒否のリスクを最小限に抑えたる上で重要かと思います。プロジェクトがクローズ・振り出しに戻るリスク役割分担のリスク : モデル開発やETL処理のパイプライン化、インフラの選定、本番環境への結合とそのテストなどやることと求められる知見幅が非常に広い。しかし、PoCを乗り越えることすら不確実なため、プロジェクトの立ち上げ期からそのリソース確保や体制を確立することが難しいのが実情推定精度のリスク : いわゆるPoC死や効果検証フェーズでの敗北。新しいモデルの精度不足または既存手段を上回れないことの方が多い非機能要件のリスク : MLチームにとっては暗黙知的な本番環境で要求されるシステムの制約や、レイテンシーやクラウドの費用、セキュリティ要件を満たせるかなどの一般的な非機能要件も早く正確に認知する必要があるデータ依存のリスク : CACEの原則。機械学習モデルの振る舞いは、入力データに依存して決まり、データ自体（分布）も時間の経過に従い変化しうる CI/CD/CTのリスク : ローンチ後にKPIや推定精度が下がった際に、どう解釈（説明）するか。常に最新のデータに適応した、最良のモデルであることを担保するための環境の整備が難しい　上記以外にも、システムデザインの選定や決定的テストの難しさなどの私の知見不足でまとめられなかった難関は他にも多数存在します。　これらに関しての解決策は、 MLOpsの歩き方やGoogle社によるこちらの記事内でいくつか提案されています。 MLOps: 効率的な開発を阻害する要因　プロジェクトがクローズとまではいかないものの、機械学習プロジェクトに「遅延」をもたらすお馴染みの課題は上記以外に存在しています。テスト環境と本番環境の違い : Jupyter Notebookに書いた前処理や推定のプログラムをパイプラインにまとめたり、クラス化し直す必要があるバージョン管理が必要な対象の広さ : 学習に使用したデータ・アルゴリズム・ハイパーパラメータ・評価指標をセットで管理する必要があるパイプラインのジャングル化：MLパイプラインの乱立により、システムを占めるグルーコードの比率が肥大化し、メンテナンスが困難になる　これらを解消するために、機械学習ライフサイクルのスケーラブルな運用を可能にするMLOpsツールが日進月歩で開発されています。　ツールは大きくハイパーパラメータ管理、実験管理、パイプライン（ワークフロー）管理の3つのカテゴリーに大別でき、カテゴリーと具体的なOSSの対応についてはこちらの記事が非常に参考になります。　一方で、ツールの比較・検討をプロジェクト中に行うような余裕は基本ないため、自社におけるMLOpsツールの選定をいつ行うかは工夫する必要があります。　ツール以外にもデータサイエンスプロジェクトとアジャイル開発がどう溶け合うかなど開発スタイルに関する議論も個人的には面白いトピックだと感じています。さいごに　今回はプロジェクト管理の視点から、LIFULL発の「データサイエンスの社会実装」の成功確度を高めるアプローチを模索してきました。　改めて執筆すると、技術的な理解の甘さを痛感しました。やはりテストやCI/CDは実際に手を動かしてみないと解像度が上げられないと思いました。　LIFULLでは、キャリフルという社内副業制度があるので、エンジニアリングの職種に応募してDevOpsやマイクロサービスなどを手を動かして体感する機会をぜひ作りたいと考えています。　今後もData ScientistやML Engineerたちにとって、伴走しがいのあるパートナー（PM）になっていけるよう毎日の業務で成長していきます。　LIFULLのアナリティクスチームは、上記のデータアナリティクス/サイエンスプロジェクト両方の問題解決に貢献できるよう、これからも越境し続けます。　ご拝読、ありがとうございました。参照: 企業におけるデータ分析プロジェクトと求められるスキル機械学習を「社会実装」するということゆるふわMLOps入門 MLOps: 機械学習における継続的デリバリーと自動化のパイプライン機械学習システムの設計パターンを公開します。機械学習アプリケーションにおけるテストについて機械学習：技術的負債の高金利クレジットカードマイクロサービスアプリケーションとしての機械学習 Data Science Project Flow for Startups 機械学習アプリケーションにおけるテストについて

コンテンツ

トップイベントマガジンブロググループに関するお問い合わせ