every Tech Blog

株式会社エブリーのTech Blogです。

データサイエンティストチームにおける数学輪読勉強会の取り組み紹介

はじめに

エブリーでデータサイエンティストをしている山西です。
今回は、社内で継続的に実施している数学勉強会について紹介します。
勉強会を続けるうえで工夫したポイントや、取り組みを続けての所感をお伝えします。

概要

エブリーのデータ&AIチームでは、「数式に向き合う習慣を維持する」目的で週に1回のペースで数学の勉強会を実施しています。
記事執筆時点では、データサイエンティスト(MLエンジニアを含む)3名で、『機械学習スタートアップシリーズ ベイズ推論による機械学習入門』を輪読形式で進めています※ www.kspub.co.jp

勉強会の進め方は、各回で担当メンバーが前回の続きから読み進め、数式を咀嚼しながら書き出していくスタイルです。
iPad上の共有ノート(GoodNotes 6の共同作業機能を活用)にリアルタイムで式を書き出しつつ、他のメンバーが質問したり、時には並列で式展開したりして文殊の知恵的に理解を深めています。

ノートの例

2022年初頭にスタートし、教材や進行方法を途中で変えつつも、約3年間継続という比較的歴の長い取り組みになっております。

※ 過去には『統計的機械学習の数理100問 with Python』を扱っていました。今は2冊目になります。 www.kyoritsu-pub.co.jp

実施の背景

この勉強会は、自分が言い出しっぺとなってスタートさせました。
その背景には、「事業主体であることを言い訳にして、数式と向き合う時間をおろそかにしたくない」という思いがありました。

データサイエンス組織のあらまし

前提として、弊社のデータ組織はR&D寄りではなく、事業に寄り添ったビジネス要求対応の比重が高い体制です。
さらに、少数組織であることから、データサイエンティストも一定のデータエンジニアリング業務を兼務する構図となっています。

データサイエンススキルの活かし方

このような体制下では、生のビジネス現場でデータを活用する多くの実務的な学びが得られます。
一方、意識せずに「事業並走」や「データ基盤の整備」などの比重が増しすぎると、統計や機械学習と向き合うための“可処分データサイエンス時間”が減ってしまう傾向があります。
これは、いわゆる「データサイエンティストだけど、データの整備や可視化、簡単な記述的分析に留まってしまう」状態です。

とはいえ、実際の業務でも「その先の活用」が求められるシーンは多く存在します。
たとえば、統計的な予測や効果検証、プロダクトへの機械学習技術の応用などです。
いざそうした要求が出てきたときに力を発揮するためには、基礎的な理解&実行力が不可欠です。

「ライブラリに頼り切り」は良くないという話

近年は、ライブラリやLLMの発展により、分析の実行そのものは圧倒的に手軽になりました。
しかし、「なぜその手法が使えるのか」「どのような前提で動いているのか」といった背景を理解せずに使うことは、意思決定や改善において、再現性等々の危うさを孕みます。

だからこそ、数学の原理に立ち返り、技術の背後にあるロジックを丁寧に理解しておくことが大切だと考えました。

とどのつまり

つまり、日々のビジネス要求にしっかり応えながらも、ここぞというシーンでデータサイエンティストとしての専門性を発揮するためには、継続的で幅広い数学の素養がベースになるということです。

裏を返せば、この視点を疎かにして業務のルーチンが固定化しすぎると、新たな発見や創造的なアプローチが生まれにくくなるリスクにもつながると考えます。

こうした課題感を持つ中で、同じ想いを抱くメンバーとともに、日常業務とは異なる角度でスキルを磨く場として勉強会を企画する運びとなりました。互いに刺激を受けながら学び合い、知識の定着や応用力の向上につなげていきたいという狙いもあります。

運営の工夫

勉強会を継続するために、以下のような工夫を取り入れています。

参加のハードルを下げる

「予習はしない(しても良いけど義務ではない)」「みんなでその場で考える」ベストエフォート式で進行しています。
事前準備の負担を極力抑えることで、忙しい業務の合間でも無理なく参加できるようにしています。

「継続は力なり」の精神で、少しずつでも約3年続けられたのは、このような実施のハードルの低さの寄与が大きいのではないかと思います。

みんなで悩む、考える

心理的安全性の面では「わからないは恥ではない」「みんなで悩もう」という意識で臨むようにしています。
結果として行き詰まってほとんどページが進まないこともありますが、その過程を許容しながら進めることを大切にしています。

一人での学習に比べ、チームで議論することで多様な視点を得られています。
業務に関連するテーマを中心に意見交換を行うため、知識が定着しやすく、互いに学びを高め合うことができています。

行間含め、数式に向き合う

「数学の基礎体力をつける」をモットーに、数式の行間や詳細な導出過程を(書籍で省略されている部分も含めて)追える限り丁寧に追っています。
例えば現在取り扱っているベイズ本では、事前分布から共役事前分布を経て事後分布を導出する流れを、噛み砕きながら丁寧に追っています。
プログラミング上では結果の式さえあれば実装できる(何ならライブラリを使えば式すらラップされて利用できる)部分ですが、この勉強会の時間ではあえてその背後の理論に向き合うことを大切にしています。

個人的には、この習慣の継続によって行列計算の苦手意識が薄まってきたことが一定の成果です。
他の書籍や技術記事で統計数理をキャッチアップする際の壁も、徐々に乗り越えられるようになってきました。

電子媒体(iPad & GoodNotes)の活用

当初はオフィスのフリースペースでホワイトボードを使っていましたが、現在はGoodNotes6アプリを利用したデジタルノートに移行しました(たまたまメンバー全員がiPadでそれを行える環境だったため)。
この移行により、板書を自動記録し、全員で共有できるようになりました。
過去の内容を容易に検索・参照できたり、必要な式をコピー&ペーストで再利用できたりと、クラウド時代ならではの恩恵を感じています。

過去の章で扱った式を今の計算のために引っ張ってきたいとき、コピペの要領でできるのが大変便利(赤枠部分

継続する中での課題

「実施のハードルの低さ」や「数式の細部に向き合うこと」による良い側面がある一方、それならではの課題感もあります。

例えば、予習が義務でないことで「前回の内容を思い出すのが難しい」ことがあります。
間が空くことで細部は思い出せても、全体的な流れや体系的な理解が薄れてしまうケースがあります。

また、「行間を埋める」目的で目の前の数式や概念に集中するあまり、「そもそもこのテーマは何のために学んでいるのか?」という全体像を見失いがちになることもあります。
そして、読み進める速度もどうしても遅くなりがちです(今の本も、1年数ヶ月続けているものの、進捗としては70%程度です)。

さらに、「みんながiPadを持っている前提」で進めているため、新しいメンバーを受け入れる際のハードルがあるという細かな悩みもあります笑。

このあたりは、メンバーそれぞれと実施目的や状況を振り返りつつ、形式の一長一短を吟味しながら適宜アップデートしていけると良いと考えています。

今後の展望: 実務への還元

この勉強会は、「あえて日常業務から離れ、基礎力を向上させる」という趣旨の取り組みである一方、具体的な実務貢献という形でも成果を還元できるとより理想的です。
その一歩として、現在「ベイジアンA/Bテスト基盤」の実装にチャレンジしています。
勉強会を通じてベイズ推論の理論的な理解が深まり、実際のプロダクトへ応用する準備が整ってきたためです。

もともと輪読の教材としてベイズの教科書を選んだ背景には、メンバーの多くが明示的にベイズの文脈での学習/活用経験が少なかったという事情がありました。
その意味でも、この勉強会が新たな技術的創発のきっかけとなり、実践に結びついていくことを期待しています。

おわりに

この記事では、エブリー社内で継続して行っている数学勉強会の取り組みについて紹介しました。
「数式と向き合う習慣を維持する」というシンプルながら重要な目的のもと、少人数・低ハードル・実務と地続きという特徴を持った学びの場を育ててきました。
これからも、事業貢献と専門性向上のバランスを意識しながら、実践と理論の往復を大事にした取り組みを続けていければと思います。
そして、同様の課題意識を持つ方々にとって、少しでも参考になる内容であれば幸いです。