「機械学習のためのデータ処理基盤入門」

2019/10/24(木)14:30 〜 16:30 開催
ブックマーク

イベント内容

「機械学習のためのデータ処理基盤入門」

~オープンソースで構築できる並列分散処理環境~

本セミナーは、並列分散処理の主要なOSSである、Spark、hadoop、Cassandraの概要をご紹介する無料セミナーです。
近年、膨大な量のデータが日々生み出されており、さらに今後日本でも5Gなどの導入により入手できるデータ量がさらに増大します。 しかしながら、pythonで処理を行うようなことは、計算時間やリソースなどが大幅にネックとなります。
本セミナーでは、初学者を対象に機械学習のためのデータ処理基盤として、並列分散処理の基礎的な説明から、Spark、hadoop、Cassandraのそれぞれの特徴、処理の動き、導入事例などをご紹介します。

INTHEFOREST(インザフォレスト)社は、上記OSS以外にもKafka、NoSQL、k8sなどを組み合わせて超大規模データ基盤の構築・運用を得意としております。


日 時:10月24日(木) 14:30~16:30 (開場14:15)
費 用:本セミナーは無償です。
対 象:「機械学習」「データ処理基盤」「並列分散処理」などに携わる方やこれから携わる予定の技術者向に
     最適な内容でございます。
     また、プロポーザルやコンサルティングを担当されておられる方にも有益な内容となっております。


セッション タイトル
セッション1 イントロダクション
・データサイズ:ペタバイトの時代(※1 Peta Byte = 1024 Tera Byte)
・並列処理と分散処理
・(参考)Pythonライブラリ(Numpy・Pandasなど)を利用することの問題点
セッション2 並列分散処理入門
・Apache Sparkとは?
・Sparkを用いた分散処理(hadoop+Spark)
・分散データベース(Cassandra)
・ユーザ事例:サーバ100台規模の商品レコメンデーションエンジン基盤の構築
Q&A
講演者 株式会社INTHEFOREST 代表取締役社長 冨田和孝
日本Cassandraコミュニティーメンバー
データベースエンジニア・システムアーキテクト
ぐるなび、外国為替、ISPなど、DB中心としたシステム構築・運用・保守を担当。
高負荷・大容量・大規模なデータ処理・データ解析基盤作りに強み。
また、学生時代は社会言語学を専攻し、「認知意味論」をベースとしたNLPも研究中。

詳細ページ: http://www.konekto.jp/news/info20191024.html

セミナー受付時にお名刺1枚の準備をお願いいたします。
 ※競合他社様からのお申し込みはお断りする可能性がございます。予めご了承ください。
  お申込みが振るわない場合に事前の中止する場合がございます。合わせてご了承ください。
セッション内容の資料は後日PDFにて配布予定です。また、録音・録画はお断りしております。
名刺情報は、コネクト株式会社およびINTHEFOREST株式会社のプライバシーポリシーに則り適切に取扱致します。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

関連するイベント