【safie/LayerX/LINE】注目のAIプロダクトを支える非構造化データ処理、バックエンド技術の苦悩 ー画像解析などに必要なデータをどう安定、高速、精緻に取得処理するかー
2021年12月17日に開催されたオンラインイベントのアーカイブ動画となります。
【イベント詳細ページ】https://techplay.jp/event/838626
▼イベント概要▼
世の中には様々な種類の膨大なデータが存在し
人々の生活をより便利にするために、それらのデータと日々向き合っている人たちがいます。
今回は『クラウド防犯カメラ』『国立国会図書館のデジタルシフト化』『経済活動のデジタル化』の領域で
注目されている3社が集まり"AIプロダクトを支えるバックエンド技術"にフォーカスをあて
どのようなチャレンジがあったのか、各社の裏側を深掘っていきます。
データと一言にいっても
・防犯カメラからリアルタイムで取得され続ける映像データ(safie)
・国立国会図書館が保有する昭和初期以前の247万点、2億2300万枚を超える資料(LINE)
・特定期間(月末)に大量に提出され、複雑な情報を含む請求書の画像データ(LayerX)
など、各社が向き合っているデータの種類/特性はさまざま。
プロダクトの性質によって、その膨大なデータに対する負荷分散の考え方やアーキテクチャは異なってきます。
システムの負担を分散しながら、スケーラビリティや可用性をどう確保するのか。
すべてをリアルタイムで処理をすることは必要なのか?
処理するデータ量が多いからこそバックエンドエンジニアは多数のイシューを抱えているようです。
本イベントでは注目のAIプロダクトを開発する3社が集まり
それぞれのプロダクトの性質に応じたデータとの向き合い方を
バックエンドの観点から明らかにしていきます!
<Chapter>
00:00:00 オープニング
00:02:05 セーフィーにおけるAI応用プロダクト開発
00:00:00 2.2億枚の画像を効率的にOCR処理するための分散処理アーキテクチャ
00:00:00 バクラク請求書のAI-OCRを支える非同期処理アーキテクチャ
00:58:37 Q&A
01:21:06 クロージング
#safie#セーフィー#サーバーサイド#インフラ#AWS#Meetup#機械学習#TECHPLAY