Data Engineering Study #25 データカタログの現在地
イベント内容
過去の Data Engineering Study のアーカイブはこちらからご視聴いただけます。
開催内容
概要
本イベントは、Infra Study Meetup を運営する Forkwell と、データ基盤の総合支援サービス「TROCCO®️」の開発・運営を行う primeNumber による共催イベントです。データ分析に精通した講師をお招きし、データ分析基盤の「これまで」と「これから」を学ぶことを趣旨として開催いたします。
複数回にわたって、各回テーマに沿った内容で各分野でご活躍されているエンジニア/研究者に講演いただきます。
質疑応答の時間には、ゆずたそ氏(@yuzutas0)にもご参加いただきます。
プログラム第25回「データカタログの現在地」
データ量が増加し続ける中、企業におけるデータ管理の重要性が一層高まっています。そのような動きに合わせて、組織全体のデータ資産を管理して、データの発見・理解を促進するデータカタログの需要も高まりつつあります。
今回は、データカタログとは何か、またOSSである「OpenMetadata」に関するご紹介やCommiterとしての活動をOpenMetadataのCommiterであるDATUM STUDIO 川口氏にお話しいただきます。その後、GENDA 山口氏、サミーネットワークス 森氏から実際に各社がデータカタログをどのように活用されているか、事例をご紹介いただきます。
基調講演「データカタログに求められる機能とOpenMetadataでどのように実現されているかのご紹介」
川口 氏
DATUM STUDIO株式会社 データエンジニア部
2019年にDATUM STUDIOに入社。データ分析やデータマイグレーション、データ基盤構築のプロジェクトに携わる。
▍発表内容
データカタログはデータ基盤において必要とされながらも、実際には導入が後回しにされがちな面があるかと思います。本発表ではメタデータ管理やデータカタログの概要と求められる機能についてご紹介し、その重要性や活用方法についてお話しできればと考えています。具体的なデータカタログの例として、OSSのデータカタログの一つであるOpenMetadataについて基本的な機能や特徴についてお話しいたします。また、私はOpenMetadataのコントリビューターとして活動をしているのですが、どのように活動しているかについてもご紹介いたします。
事例講演①「Streamlitのデータカタログが社内にもたらした変化」
山口 歩夢 氏(@Yamaguchi_aaaaa)
株式会社GENDA IT戦略部・データエンジニア
2023年にGENDAにデータエンジニアとして入社。
データ基盤の構築や運用、Streamlitでのデータ可視化アプリケーションやデータカタログの開発に携わる。
▍発表内容
弊社では、多様な事業とデータを保有しており、これらを効果的に管理するため、データマネジメントを進めたいと考えております。その一環として、データカタログが非常に有用なツールであると考えました。
それにあたり、昨年、PythonフレームワークであるStreamlitを用いて、データカタログを開発・導入いたしました。今回の発表では、データカタログに実装した機能とその実装理由、Streamlitを選んだ理由、そしてこのデータカタログが社内にもたらした変化についてお話させていただきます。また、併せてStreamlitで開発した他の社内アプリケーションについてもご紹介いたします。
事例講演②「COMETAを用いたデータ品質管理と業務標準化への取り組み」
森 和也 氏
株式会社サミーネットワークス マーケティング部
金融機関や物流会社を経て、2019年サミーネットワークスに入社。
データ分析チームに所属してデータ基盤の構築やデータ分析による事業の意思決定の支援に従事。
▍発表内容
サミーネットワークスは一昨年データ基盤の再構築を行い、業務の効率化やデータの活用拡大には成功したものの、データ品質管理プロセスの構築や属人化の解消といった課題が残っていました。本発表では、そうした課題を解決するためにどのようにデータカタログを用いたのか、導入して上手くいったことや今後取り組んでいかなければならないことなどを具体例を交えてお話をさせていただきます。この発表がデータカタログの価値と実践的な活用を考えるにあたって何らかの参考になれば幸いです。
タイムスケジュール(目安)
時間 | 内容 |
---|---|
19:00 | オープニング(5分) |
19:05 | 基調講演(40分) 川口 氏「データカタログに求められる機能とOpenMetadataでどのように実現されているかのご紹介」 |
19:45 | 質疑応答(10分) |
19:55 | 共催LT1(5分)Forkwell |
20:00 | 休憩(5分) |
20:05 | 事例講演①(20分) 山口 歩夢 氏「Streamlitのデータカタログが社内にもたらした変化」 |
20:25 | 質疑応答(10分) |
20:35 | 共催LT2(5分)primeNumber |
20:40 | 休憩(5分) |
20:45 | ゲスト講演②(20分) 森 和也 氏「COMETAを用いたデータ品質管理と業務標準化への取り組み」 |
21:05 | 質疑応答(10分) |
21:15 | アフタートーク&クロージング(15分) |
21:30 | 終了予定 |
※ タイムスケジュールは目安です。完全終了21:30までの間で、より参加者にご満足いただける形で各コンテンツ時間が調整される場合がございます。
※ プログラムは変更となる可能性があります。随時こちらで更新いたします。
開催背景
Forkwell からのコメント
本イベントは、Infra Study Meetup に注目していただいた primeNumber さまからのお声がけで実現したイベントです。Infra Study Meetup とは主催する団体、扱うテーマが異なることから、別シリーズとして立ち上げました。Infra Study 参加者と共に得たイベントノウハウを継承し、データ分析領域でも学びの場を作ります。
本家 Infra Study にご参加いただいた方はもちろん、データ分析に関心のある方ならどなたでも参加可能です。エンジニアリングと密接に関わるデータ分析領域について楽しく学んでいただけましたら幸いです。
primeNumber からのコメント
弊社はデータ基盤の総合支援サービス「TROCCO®️」を運営しているのですが、その中で「どういう分析基盤を作っていけばいいのか?」というご質問をよく伺います。そのような方向けに何か有益な情報をご提供できる場はないかと考えた時に、本イベントの開催を思いつきました。
そんなタイミングで、「Infra Study Meetup」という反響が大きいイベントがあるのを見つけ、「データ分析基盤」版を作りませんかとお声がけした所から開催に至りました。
これから分析基盤を作ろうとされている方や、現在運用中の基盤の改善アイデアを探している方に、有益な場に出来ればと思っております。
これまでの勉強会で扱ったテーマとアーカイブ動画
- 2020/07/15(水)|第1回「モダンなDWH/BIツールの選び方と、実際の運用事例」
- 2020/08/19(水)|第2回「データ収集基盤とデータ整備のこれまでとこれから」
- 2020/09/16(水)|第3回「分析基盤をうまく組織に浸透させる方法」
- 2020/11/04(水)|第4回「データ分析基盤の障害対応事例LT祭り」
- 2020/12/02(水)|第5回「噂のSnowflake Deep Dive / 国内事例・他DWHとの比較」
- 2021/02/03(水)|第6回「改めて学ぶ、BigQuery徹底入門」
- 2021/04/06(火)|第7回「Redshift最新アップデートと活用事例」
- 2021/06/02(水)|第8回「BIツール特集-OSS・商用の上手い使い分け」
- 2021/08/03(火)|第9回「企業規模別データエンジニア組織の作り方」
- 2021/10/06(水)|第10回「王道BIツール特集 Tableau / PowerBI / Googleデータポータル」
- 2021/12/13(月)|第11回「6社のデータエンジニアが振り返る2021」
- 2022/02/09(水)|第12回「エンジニアのための「データ可視化」入門」
- 2022/04/06(水)|第13回「ELT・データモデリングツール特集回」
- 2022/06/08(水)|第14回「Modern Data Stack特集」
- 2022/08/03(水)|第15回「Reverse ETL 特集回」
- 2022/10/19(水)|第16回「データカタログ入門」
- 2022/12/14(水)|第17回「6社のデータエンジニアが振り返る2022」
- 2023/02/15(水)|第18回「データ指向アプリケーションデザイン」
- 2023/04/20(木)|第19回「データエンジニアのキャリアを考える」
- 2023/06/30(金)|第20回「10年戦えるデータ分析入門」
- 2023/08/30(金)|第21回「Azureのデータ分析サービスの現在と未来」
- 2023/12/12(金)|第22回「5社のデータエンジニアが振り返る2023」
- 2024/03/05(火)|第23回「Data orchestration 特集」
- 2024/06/27(木)|第24回「データドリブン組織を支える技術」
留意事項
- Data Engineering Study コミュニティガイドライン を事前にご確認ください。
- イベント参加時にご入力いただいた情報は、次のプライバシーポリシーに基づき、primeNumber のみで適切に扱います。 https://primenumber.co.jp/privacy/
主催・協力
主催/コミュニティ支援協賛
ITエンジニアのキャリアに本気で向き合う転職サイト Forkwell(フォークウェル)
データ基盤の総合支援サービス「TROCCO®️」の開発・運営を行う primeNumber
注意事項
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
新規会員登録
このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。
※ ソーシャルアカウントで登録するとログインが簡単に行えます。
※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。