「Embulk」に関連する技術ブログ

全 47 件中 31 - 45 件目

2019年07月03日

Ruby on Lambdaを使ってRubyKaigi用のデモアプリを作った話

こんにちは、開発部の塩崎です。最近はCloudFormation・Embulk・Digdagを使った仕事をすることが多く、一番使う言語がYAMLになりました。今年福岡で開催されたRubyKaigi 2019ではZOZOテクノロジーズはRubyスポンサーとして協賛させていただきました。カンファレンス中のスポンサーブースの出し物として、DroidKaigi 2019と同様にファッションチェックアプリの展示を行いました。 DroidKaigiの展示と全く同じでは芸がないと考え、今回のRubyKaigiのた

AWS, CSS, JavaScript, Ruby, WordPress, Embulk, API, Serverless

アバター

株式会社ZOZO

2019年06月06日

Cloud DLPをGolangで叩いて見せられないデータを抽出し秘匿化してみる

今週末から北海道オフィスに出張でワクワクしている瀧川です。私はデータ分析基盤の構築をする機会がよくあり、FluentdやEmbulk、Digdag、BigQueryを好んで使っています。構築する際に気をつけることというと、冪等性やログ欠損(リカバリ)などいろいろあるかと思いますが、その中でも重要になるのが個人情報などの見せられないデータ(機密情報) の扱いかな思っています。構造化されたデータの個人情報であれば、そもそも分析基盤に転送しないことや、マスキングして送るなど対策は容易 *1 ですが、例

Go, Google Cloud, Java, Python, Google BigQuery, Embulk, データ分析, API

アバター

スマートキャンプ株式会社

2019年03月19日

TalendをDigdagとEmbulkに移行した

はじめまして！ ZOZOテクノロジーズ開発部の平田（ @TrsNium ）と申します。業務ではデータ基盤の開発・運用を行っています。よろしくお願いいたします。今回複数のツールが混在していたデータ基盤を「Digdag・Embulk」に統一したので、その取り組みを紹介します。概要弊社のデータ基盤は注文情報や顧客情報などをSQL Serverから取得しBigQueryに転送しています。以前のデータ基盤では「Talend」と「Embulk・Digdag」でデータの収集と転送をしていました。 Talen

AWS, Docker, Git, Java, MySQL, SQL, SQLServer, Google BigQuery, Embulk, データベース

アバター

株式会社ZOZO

2019年03月15日

<![CDATA[ 改めて BigQuery の Partitioned tables と戯れた話 ]]>

こんにちは、開発本部の宍戸です。先日のメドレー社内勉強会「TechLunch」で、BigQuery の Partitioned table について発表しましたので、その話について書きたいと思います。なぜ今 Partitioned table? ある案件でユーザーの操作ログを扱う必要があり、データ保管先に BigQuery を利用しようと考えていました。その際に、「以前は β 版だった分割テーブル、そういえば今使えるよね」という話になり色々調べてみた、というのが今回このテーマを選んだ背景です。なぜ分割

SQL, Google BigQuery, Embulk, データベース, NoSQL

アバター

株式会社メドレー

2019年03月15日

<![CDATA[ 改めて BigQuery の Partitioned tables と戯れた話 ]]>

こんにちは、開発本部の宍戸です。先日のメドレー社内勉強会「TechLunch」で、BigQuery の Partitioned table について発表しましたので、その話について書きたいと思います。なぜ今 Partitioned table? ある案件でユーザーの操作ログを扱う必要があり、データ保管先に BigQuery を利用しようと考えていました。その際に、「以前は β 版だった分割テーブル、そういえば今使えるよね」という話になり色々調べてみた、というのが今回このテーマを選んだ背景です。なぜ分割

SQL, Google BigQuery, Embulk, データベース, NoSQL

アバター

株式会社メドレー

2019年03月15日

<![CDATA[ 改めて BigQuery の Partitioned tables と戯れた話 ]]>

こんにちは、開発本部の宍戸です。先日のメドレー社内勉強会「TechLunch」で、BigQuery の Partitioned table について発表しましたので、その話について書きたいと思います。なぜ今 Partitioned table? ある案件でユーザーの操作ログを扱う必要があり、データ保管先に BigQuery を利用しようと考えていました。その際に、「以前は β 版だった分割テーブル、そういえば今使えるよね」という話になり色々調べてみた、というのが今回このテーマを選んだ背景です。なぜ分割

SQL, Google BigQuery, Embulk, データベース, NoSQL

アバター

株式会社メドレー

2019年03月15日

<![CDATA[ 改めて BigQuery の Partitioned tables と戯れた話 ]]>

こんにちは、開発本部の宍戸です。先日のメドレー社内勉強会「TechLunch」で、BigQuery の Partitioned table について発表しましたので、その話について書きたいと思います。なぜ今 Partitioned table? ある案件でユーザーの操作ログを扱う必要があり、データ保管先に BigQuery を利用しようと考えていました。その際に、「以前は β 版だった分割テーブル、そういえば今使えるよね」という話になり色々調べてみた、というのが今回このテーマを選んだ背景です。なぜ分割

SQL, Google BigQuery, Embulk, データベース, NoSQL

アバター

株式会社メドレー

2019年03月15日

<![CDATA[ 改めて BigQuery の Partitioned tables と戯れた話 ]]>

こんにちは、開発本部の宍戸です。先日のメドレー社内勉強会「TechLunch」で、BigQuery の Partitioned table について発表しましたので、その話について書きたいと思います。なぜ今 Partitioned table? ある案件でユーザーの操作ログを扱う必要があり、データ保管先に BigQuery を利用しようと考えていました。その際に、「以前は β 版だった分割テーブル、そういえば今使えるよね」という話になり色々調べてみた、というのが今回このテーマを選んだ背景です。なぜ分割

SQL, Google BigQuery, Embulk, データベース, NoSQL

アバター

株式会社メドレー

2019年03月15日

<![CDATA[ 改めて BigQuery の Partitioned tables と戯れた話 ]]>

こんにちは、開発本部の宍戸です。先日のメドレー社内勉強会「TechLunch」で、BigQuery の Partitioned table について発表しましたので、その話について書きたいと思います。なぜ今 Partitioned table? ある案件でユーザーの操作ログを扱う必要があり、データ保管先に BigQuery を利用しようと考えていました。その際に、「以前は β 版だった分割テーブル、そういえば今使えるよね」という話になり色々調べてみた、というのが今回このテーマを選んだ背景です。なぜ分割

SQL, Google BigQuery, Embulk, データベース, NoSQL

アバター

株式会社メドレー

2019年03月15日

<![CDATA[ 改めて BigQuery の Partitioned tables と戯れた話 ]]>

こんにちは、開発本部の宍戸です。先日のメドレー社内勉強会「TechLunch」で、BigQuery の Partitioned table について発表しましたので、その話について書きたいと思います。なぜ今 Partitioned table? ある案件でユーザーの操作ログを扱う必要があり、データ保管先に BigQuery を利用しようと考えていました。その際に、「以前は β 版だった分割テーブル、そういえば今使えるよね」という話になり色々調べてみた、というのが今回このテーマを選んだ背景です。なぜ分割

SQL, Google BigQuery, Embulk, データベース, NoSQL

アバター

株式会社メドレー

2019年03月15日

<![CDATA[ 改めて BigQuery の Partitioned tables と戯れた話 ]]>

こんにちは、開発本部の宍戸です。先日のメドレー社内勉強会「TechLunch」で、BigQuery の Partitioned table について発表しましたので、その話について書きたいと思います。なぜ今 Partitioned table? ある案件でユーザーの操作ログを扱う必要があり、データ保管先に BigQuery を利用しようと考えていました。その際に、「以前は β 版だった分割テーブル、そういえば今使えるよね」という話になり色々調べてみた、というのが今回このテーマを選んだ背景です。なぜ分割

SQL, Google BigQuery, Embulk, API, データベース

アバター

株式会社メドレー

2017年12月14日

データの民主化とオープンソースソフトウェアと SQL Server

この記事は一休.com アドベントカレンダー 2017 の 14 日目です。昨日に引き続き、一休データサイエンス部の id:kitsuyui です。 13 日目のエントリでは Embulk, Redash, DatabaseMEMO の導入の経緯について解説しました。とても素晴らしいツールを導入できましたが、実はそのままでは一休に導入することができない箇所がいくつもありました。 GitHub 上でどんなアクションをしたかを振り返りたいとおもいます。その後、自分なりに見出したコントリビューションのコ

GitHub, Python, Windows, Linux, SQL, SQLServer, Google BigQuery, Embulk, データ分析, macOS

アバター

株式会社一休

2017年12月13日

データエンジニアとデータの民主化〜脱・神 Excel 〜

この記事は一休.com アドベントカレンダー 2017 の 13 日目です。一休データサイエンス部の id:kitsuyui です。データエンジニア兼データサイエンティストをやっています。この記事はもともとアドベントカレンダー上では「脱・神 Excel (仮)」という名前で枠で取っていたのですが、少し主語が大きすぎたかな？と反省しています。書いているうちに全く主旨が変わってきましたので、副題とさせていただきました。今回は一休社内でのデータエンジニアリングにまつわる負担、それらを解決する Red

Git, GitHub, SQL, Tableau, Google BigQuery, Embulk, データ分析, データベース, データサイエンス

アバター

株式会社一休

2017年07月18日

DigdagとEmbulkを利用してBigQueryにRDS（Aurora、MySQL）のマスタデータを同期する

こんにちは、バックエンドエンジニアの塩崎です。先日、会社の広報のためのインターン生紹介記事にメンターとして掲載していただきました。大学四年生のインターン生と一緒に写真撮影を行ったのですが、見た目だけではどちらが年上かわからなかったので、「メンターの塩崎（右）」という表記をされてしまいました（笑）インターンでも実際のサービスに触れ、課題を解決！〜VASILY DEVELOPERS BLOGが公開されました〜さて、VASILYではData WarehouseとしてGoogle BigQuery（Big

AWS, GitHub, Google Cloud, Jenkins, MySQL, Node.js, PostgreSQL, Google BigQuery, Treasure Data, Embulk

アバター

株式会社ZOZO

2017年06月30日

Embulkを利用したデータ転送基盤の構築

こんにちは。バックエンドエンジニアインターンの田島です。 VASILYでは分析にBigQueryを使用しており、MySQLのデータを毎日BigQueryに同期しています。この同期処理を行うシステムは、約2年前にRubyで書かれたもので、プロダクトの成長に伴うデータ量の増加に耐えることができなくなり始めていました。そのため、同期処理を行うシステムを一から作り直しましたので、その詳細についてご紹介します。弊社DEVELOPERS BLOGでは以前、『インターン生がデータ転送基盤を一から設計する、VASIL

Go, Google Cloud, MySQL, Ruby, プログラミング, SQL, Google BigQuery, Embulk, データ分析, データベース

アバター

株式会社ZOZO

ブログランキング

1

画面仕様書と画面遷移図の重要性

アバター

Ｓｋｙ株式会社

2

Claude Code更新脆弱性を自動検知・スキル自動ロード【5/24〜30】

アバター

サーバーワークス

3

インフラ勉強会を構成する文化としての「インフラ」と、それを支えるさくらのクラウド

アバター

さくらインターネット

4

Claude Codeのメモリ要件公式仕様とヘビーユーザーに必要なPCスペック

アバター

サーバーワークス

5

意識をもってシステムを使う【新人エンジニアに役立ちそうなTips】

アバター

インターネットイニシアティブ

集計期間: 2026年5月29日〜 2026年6月4日

タグからブログをさがす

ソフトウェア開発

Remix Docker Sublime Text Xcode

プログラミング

Ruby on Rails Django アセンブラ Babel

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか？

無料でイベントをはじめる

ブログを絞り込む

ブログランキング

1

画面仕様書と画面遷移図の重要性

アバター

Ｓｋｙ株式会社

2

Claude Code更新脆弱性を自動検知・スキル自動ロード【5/24〜30】

アバター

サーバーワークス

3

インフラ勉強会を構成する文化としての「インフラ」と、それを支えるさくらのクラウド

アバター

さくらインターネット

4

Claude Codeのメモリ要件公式仕様とヘビーユーザーに必要なPCスペック

アバター

サーバーワークス

5

意識をもってシステムを使う【新人エンジニアに役立ちそうなTips】

アバター

インターネットイニシアティブ

集計期間: 2026年5月29日〜 2026年6月4日

タグからブログをさがす

ソフトウェア開発

Remix Docker Sublime Text Xcode

プログラミング

Ruby on Rails Django アセンブラ Babel

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか？

無料でイベントをはじめる