DataOps Night #1 ~データ品質を守り抜くためのプラクティスを共有しよう!~
イベント内容
この勉強会について
DataOps Night は、データ品質の向上に取り組むエンジニアを集めて知見を共有する勉強会です。
"garbage in garbage out"という言葉があるように、データ品質が低くては、データ利活用は不可能です。KPIを管理するにしても、KPIの定義が部署ごとにズレていては意思決定には使えません。機械学習においても、「アルゴリズムの改善以上にデータ品質の向上が重要である」という見解(※)も出てきています。
データ品質は、特定のツールを導入することで簡単に解決できるような問題ではなく、より広い視点からデータ品質を守り抜くための一貫した考え方、つまり「DataOps」が必要です。
各社でデータ利活用に関わるエンジニアの皆さん、ぜひ奮ってご参加ください!
※ A Chat with Andrew on MLOps: From Model-centric to Data-centric AI
DataOps Night ではLT登壇者を募集しています。ご興味ある方は以下からご連絡ください。
参加方法
Zoomウェビナーでの開催を予定しています。
※前日までに URL をご案内します。
※参加者の方は、本ページの「参加者への情報」欄でもご確認いただけます。
タイムテーブル
時間 | スケジュール |
---|---|
18:55 | Zoom オープン |
19:00 | オープニング・登壇者自己紹介 |
19:05 | LT1 / ナウキャスト 隅田敦さん / データを「開発」するためのDataOps |
19:20 | LT2 / Ubie 田中聡太郎さん / データ基盤の○層構造を独り歩きさせないデータモデリング設計 |
19:35 | LT3 / MonotaRO 竹野峻輔さん / 「指標」サービスをささえるData Engineering |
19:50 | QA&トーク |
20:10 | クロージング |
セッション内容とスピーカー
LT1 / データを「開発」するためのDataOps
ナウキャストではPOSデータやクレジットカードデータに様々な加工やアノテーションを行い価値を向上させています. 出来上がったデータは他の様々なシステムの入力として使用されます. したがって, データの品質やバージョンの管理が不可欠です. ソフトウェア開発においては, 従来からバージョン管理や継続的インテグレーションにおいて有用なフレームワークやベストプラクティスが蓄積されてきました. それらをデータの文脈に適用し, 迅速に高品質なデータを「開発」するための取り組みや見えてきた課題について紹介します.
スピーカー:株式会社ナウキャスト データエンジニア/アナリティクスエンジニア 隅田 敦
東京大学経済学部経済学科にて計量経済学を専攻。経済現象の理解のためには高品質高頻度のデータが必要との想いから2018年よりナウキャストにてインターンを始める。エンジニアリング業務をこなす中で情報科学への関心が高まり、2019年より東京大学大学院情報理工学系研究科コンピュータサイエンス専攻に進学し、計算言語学/自然言語処理の研究を行う。2021年4月にナウキャスト入社。
LT2 / データ基盤の○層構造を独り歩きさせないデータモデリング設計
昨年末、別イベントにて「dbtを活用したデータ基盤の論理・物理設計の現在地と振り返り」というタイトルで登壇したとき、「○層構造」の話が独り歩きしてしまっているように感じ、その背景にあるWhyをうまく伝えられませんでした。
そこで今回は、○層構造の話を独り歩きさせないための、データモデリングのWhyの話をしたいと思います。
スピーカー:Ubie株式会社 Data Engineer 田中 聡太郎(そたろん)
2017年9月に大学院を中退し、同年10月より株式会社エウレカに新卒として入社。2020年10月まで勤続した後、2020年11月よりUbie株式会社に入社。
LT3 / 「指標」サービスをささえるData Engineering
事業会社で変化をおいかける我々にとって「指標」は意思疎通の中核となる重要なサービスといっても過言ではありません。「指標」サービスは、OKRやKPI、North Star Metrics といた事業組織の羅針盤である「デザイン」の観点、計測や統計誤差、バイアス、実験計画などプロセスとしての「サイエンス」の観点を併せ持つ複合領域です。事業・組織規模が大きくにつれ困難が多くなるこのサービスをいかに体系的なエンジニアリングの問題に落とし込むかは実は自明ではありません。
本発表では弊社の取り組みを交えつつ、「指標」サービスを支えるエンジニアリングと指針についてまとめていきます。
スピーカー:株式会社MonotaRO ソフトウェアエンジニア(ML) 竹野 峻輔
データ活用にまつわるエンジニアリングが好きなエンジニア。2021年2月よりMonotaROで推薦システムなどの開発に従事。
注意事項
・イベントの内容は予告なく変更になる可能性があります。
・イベントの様子は主催者の PR 目的でウェブサイトやソーシャルメディア等に掲載される可能性があります。
・人材紹介業、営業、ネットワークビジネス勧誘目的の参加はご遠慮ください。
・その他、主催者が不適切と判断した場合は、ご参加をお断りさせていただく場合がございます。
個人情報の取り扱いについて
主催者は、本イベントで取得した個人情報を以下の方針に沿って取り扱います。リンク先をご確認いただき、同意の上でお申し込みください。
株式会社Finatextホールディングス プライバシーポリシー
株式会社ナウキャスト プライバシーポリシー
Ubie株式会社 プライバシーポリシー
株式会社MonotaRO プライバシーポリシー
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。