Apache Arrow東京ミートアップ2018

イベント内容

概要

Apache Arrowの開発者およびApache Arrowを活用するとうれしくなりそうなプロダクトの開発者を増やすための集まりです。開発者を増やすための集まりです!ユーザーを増やすための集まりではありません。どーん。

Apache ArrowについてはApache Arrowの最新情報(2018年9月版)を参考にしてください。

参加枠

2018-12-07追記:

現時点での登録状況を考慮して(開発に参加する意欲がある人ばかりが登録してくれている)、参加枠は次の通りとします。connpassのシステム上、「ただの情報収集枠」を定員0人にはできませんので、登録しても管理者がキャンセル扱いにします。ご了承ください。

  • 開発に参加したい気持ちがある枠: 定員40名
  • 開発に参加したい気持ちがなくはない枠: 定員30名
  • ただの情報収集枠: 定員0名

以下は当初の内容:

開発者を増やすための集まりなので、参加枠は次の通りとなっています。

  • 開発に参加したい気持ちがある枠: 定員70名
  • 開発に参加したい気持ちがなくはない枠: 定員30名
  • ただの情報収集枠: 定員1名

これは開発に参加したい気持ちがある人ほど優先したいためです。

「ただの情報収集枠」は他の枠が定員割れしていなかった場合だけ定員を増やします。もし、開発に参加した気持ちがある人が100人以上いた場合は定員は増えません。70人しかいなかった場合は定員は30名になります。

開発に参加するなんてハードルが高い…

「開発に参加するなんてハードルが高い…」と思う人がそれなりにいるはずなのでそのあたりを説明します。

開発に参加したい人を集めるだけ集めてあとはガンバレ!とするつもりはありません。開発に参加したい人が実際に参加できるようになるためにできるだけフォローします。安心してください。

この会の前半では次のことを説明します。

  • Apache Arrow本体のこと
  • Apache Arrowを活用している・活用しそうなプロダクトのこと

説明の中では現状ですでにできることおよび今後できるようになるとうれしいことにも触れます。会の中で、知らなかったことを知ったり、どのあたりの開発に参加したいかを考える情報を得ることができるということです。事前になにを開発したいかを考えなければいけない、ということはありません。開発に参加したいという気持ちがあれば十分です。

なお、これは、事前調査をやめろという話ではありません。事前調査をした方がスムーズに開発に参加できる人もいるはずです。そのような人のために事前調査のためのヒントを後述します。

この会の後半にはすでに開発に参加している人たちと一緒に「どこから開発を始めるのがよさそうか」相談する時間があります。前半で聞いた説明をもとにどのプロジェクトに参加したいかの目星をつけ、後半で実際にどうやって進めるかを既存開発者と相談することで開発に参加したい気持ちがある人をサポートします。

また、この会終了後からそれほど期間をおかずに開発をフォローするイベントも開催します。このときはすでに少し開発に参加しはじめているはずですが、はじめてから悩むこともあるはずです。そのようなことをこのイベントでフォローします。どのようなイベントを予定しているかは後述します。

これなら開発に参加できそうな気がしてきましたか?気がしてきたらぜひ参加登録してください!一緒に開発に参加しましょう!

当日持ってくるもの

開発に参加するときに使えるノートパソコンを持ってきてください。会の後半で「どこから開発を始めるのがよさそうか」相談するときに実際のソースコードを確認したり、参考URLを参照したりするのに使います。具体的にこんなノートパソコンというものはありませんが、たとえば次のようなノートパソコンだとよいでしょう。なお、会場にはWiFiがあるので足りないソフトウェアを当日インストールすることはできます。

  • バージョン管理システム(Git)をインストール済み
  • GitHubにログインできる状態になっている
  • 開発に使うプログラミング言語の処理系(RubyインタプリターやC++コンパイラーなど)をインストール済み
  • 開発に使うエディターをインストール済み
  • などなど

内容

タイムテーブルは次の通りです。「コード懇親会」は後述します。

時間 内容 発表者
13:00 - 13:30 開場 -
13:30 - 13:40 イントロダクション 須藤功平/@ktou/株式会社クリアコード
13:40 - 14:20 発表:Apache Arrow 須藤功平/@ktou/株式会社クリアコード/Apache Arrow PMCメンバー
14:20 - 14:30 休憩 -
14:30 - 14:55 発表:Apache SparkとApache Arrow 上新卓也/@ueshin/Databricks/Apache Sparkコミッター
14:55 - 15:20 発表:Multiple-Dimension-SpreadとApache Arrow 井島洸二/Yahoo! Japan/Multiple-Dimension-Spread開発者
15:20 - 15:30 休憩 -
15:30 - 15:55 発表:RとApache Arrow 湯谷啓明/@yutannihilation
15:55 - 16:20 発表:RubyとApache Arrow 畑中悠作/@hatappi/株式会社Speee/Red Data Toolsメンバー
橋立友宏/@joker1007/Repro株式会社/Asakusa.rbメンバー
16:20 - 16:30 休憩 -
16:30 - 16:55 発表:PythonとApache Arrow 堀越真映/@sinhrks/株式会社ARISE analytics
16:55 - 17:20 発表:TensorとApache Arrow 村田賢太/@mrkn/株式会社Speee/Red Data Toolsメンバー
17:30 - 20:00 コード懇親会 -
20:00 終了

コード懇親会

コード懇親会とはコードを読み書きしながら懇親する懇親会です。ミートアップ内で「開発に参加したいプロダクト」に目星をつけ、最初の一歩を踏み出すことを後押しします。ミートアップ内で最初の一歩を踏み出すことでミートアップ後も継続して開発に参加しやすくなることを期待しています。

コード懇親会の詳細はspeee/code-party内にまとめてあります。

会場詳細

  • 日程:2018年12月8日(土)
  • 時間:13:00開場
  • 場所:株式会社Speee(東京都港区六本木4-1-4黒崎ビル4階)
  • アクセス:大江戸線・日比谷線六本木駅(徒歩6分)、南北線六本木一丁目駅(徒歩6分)

4階受付にお越しください。

事前調査のヒント

プロダクト毎にどう事前調査するのがよさそうかいくつかヒントをまとめます。追加で情報が必要なときは https://github.com/speee/code-party/issues で相談してください。

Apache Arrow

Apache Arrowの全体像はApache Arrowの最新情報(2018年9月版)を読むとよいです。

パッチを送る方法はContributing to Apache Arrowにまとまっています。

2018-12-04(火)開催のApache Arrow - データ処理ツールの次世代プラットフォームでもApache Arrowの包括的な説明を聞くことができます。こちらはこれから開発に参加しよう!という人向けの話ではなく情報収集したい人向けの話になります。

Apache Spark

上新さんの発表ではPythonからSparkを利用するための機能、PySparkについて、またその中でもApache Arrowを利用しているPandas UDFの概要とその実装について紹介します。

コード懇親会ではPandas UDFに限らず、Spark周りの開発全般について上新さん他Apache Sparkコミッターのみなさんとお話できます。

2018-12-15(土)にはSpark Developers Meetupがあるので、このイベントでApache Sparkの開発に興味がでた人はぜひこちらにも参加してください。

このイベントでもSpark Developers Meetupでも上新さんを含むApache Sparkコミッターのみなさんとオフラインで相談できる機会なのでぜひこの機会を活かしてください。

関連リンク:

Multiple-Dimension-Spread

Multiple-Dimension-Spread(以下MDS)についてはGitHubにあるリポジトリーをご覧ください。MDSの概要についてはSlideShareにある資料をご覧ください。

当日に紹介する内容はApache Arrowを利用しているコードの範囲を予定しております。

R

...

Ruby

Ruby用のデータ処理ツールの開発をしているRed Data Toolsプロジェクトがあります。チャットでRed Data Toolsメンバーに質問できます。

Red Data Toolsが開発しているプロダクトはGitHubのred-data-toolsを参照してください。

Red Data Toolsがこういうことをしたいというアイディアはred-data-tools/want-to-doにあります。

Red Data Tools以外にもSciRubyRuby/Numoというプロジェクトがあります。

2018-11-17(土)開催のRubyData Tokyo MeetupではRuby用のデータ処理ツールを開発している人たちから最新情報を聞くことができます。

2018-11-20(火)開催のOSS Gate東京ミートアップ for Red Data Tools in SpeeeではRed Data Toolsメンバーがオフラインで集まって開発しています。ここに参加することでRed Data Toolsメンバーとオフラインで相談できます。

Python

...

...

...

フォローアップイベント

発表者向け情報

  • スライドのアスペクト比は16:9がオススメ
  • 接続端子はだいたいなんでも大丈夫
  • 発表時間25分の内訳はトーク20分+質疑応答5分想定

ライセンス情報

イベント画像の中のApache Arrowのロゴの著作者はApache Software Foundationで、ライセンスはApache License 2.0です。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

類似しているイベント