


| 参加枠 | 申込形式 | 参加費 | 参加者 |
|---|---|---|---|
一般 | 先着順 | 無料 | 満席 / 定員140人 |
データサイエンティストの間で人気が高まっているSpark。データをインメモリで高速に処理できるSparkを使うと、大規模なデータを扱う際にもストレスなく分析できます。
今回の第6回 Big Data University-Tokyo Meetupでは、6/16のDatapalooza Tokyoで発表されたコンテスト「人工知能は名刺をどこまで解読できるのか」の概要や応募方法について紹介します。 Python/PySpark ベースのハンズオンを通して、このコンテストで使う画像解析や機械学習について具体的に学びます。また、Sparkを使った機械学習の基本についても解説します。
クラウド名刺管理サービスを展開するSansan社主催の、名刺レイアウトの解析を行う分析コンペについて説明をします。
Jupyter NotebookでPython/PySpark を使ったデータ分析の始め方をハンズオンを通して学びます。
名刺レイアウトの解析を行う分析コンペに必要な画像処理について、Python/Scikit-learn でどのようにできるのか?の説明をします。
Sparkの最新情報とSparkを使った機械学習の基本をお伝えします。



