

トレジャーデータ株式会社
新着動画

AI時代、私たちはどう働くか?~テクノロジーの最前線から見える、仕事・キャ...
新着マガジン


| 参加枠 | 申込形式 | 参加費 | 参加者 |
|---|---|---|---|
一般 | 先着順 | 無料 | 61人 / 定員150人 |
| 時間 | 講演内容 |
|---|---|
| 18:30 - | 受付/開場 |
| 19:00 - 20:00 | LT
HDP2 & YARNの運用で抑えておくべきポイント (@ryu_kobayashi) |
| 20:00 - 20:30 | Treasure Dataのデータベースアーキテクチャ 〜 毎秒45万レコードでスケールし続けるスキーマレス・データベース 〜
FURUHASHI Sadayuki (@frsyuki)Treasure Dataのストレージシステム『Plazma』は、データ解析用途に特化した分散型データベースです。 カラム指向・スキーマレス・冪等(べきとう)な操作などの特徴を備え、毎秒平均45万レコードという速度で、いまこの瞬間もスケールし続けています。 FluentdからのストリーミングインポートやINSERT INTO句では、データの重複や欠損を防ぎ、高い信頼性と高速な動作を維持し続けるために様々なメカニズムが導入されています。 ここではPlazmaのインポートアーキテクチャとHadoop、Prestoとの結合に焦点を置き、そのアーキテクチャを解説します。 |
| 20:30 - 21:00 | Internals of Presto Service
Taro L. Saito (@taroleo)Treasure Dataでは分散SQLクエリエンジンである『Presto』をサービスとして提供しています。 その内部では、S3やRiakCS上にある列志向データへの並列アクセス、MessagePackを用いた高速データ読み取り、クエリプランの書き換えなど、Treasure Data独自の最適化を行っており、ここではそれらの高速化技法について紹介します。 また、過去の膨大なSQLヒストリからPrestoがどのように利用されているかの分析、そこから導かれるさらなる高速化へのアプローチについて紹介します。 |
| 21:00 - 22:00 | 懇親会(無料) |







