「Embulk」に関連する技術ブログ

全 45 件中 1 - 15 件目

2026年06月02日

ベクトル検索対応に向けたWEAR検索インデクサー刷新 ── OpenSearch Ingestionでの試行錯誤

はじめにこんにちは。WEARバックエンド部SREブロックの春日です。普段は WEAR というサービスのSREとして開発・運用に携わっています。本記事では、WEARのハイブリッド検索のリリースに伴い刷新した検索インデクシングシステム（以下、インデクサー）について、 OpenSearch Ingestion を採用しようとした際にハマったポイントや、ベクトル検索のためのインデクサーを設計する上で工夫した点を中心に紹介します。目次はじめに目次背景既存のインデクサーと刷新の動機ベクトルデータの

AWS, Elasticsearch, SQL, Google BigQuery, Embulk, インフラ, SRE, 設計, 統計, 組み込み

株式会社ZOZO

2026年04月02日

WEARの検索基盤をElasticsearch 7.10.2からOpenSearch 2.19.0へ無停止で移行する ── ダブルライトとカナリアリリースによる段階的アプローチ

はじめにこんにちは、WEAR開発部バックエンドブロックの小山です。普段は弊社サービスである WEAR のバックエンド開発を担当しています。 WEARではハイブリッド検索などの新たな検索体験の実現を目指しています。その実現に必要なハイブリッド検索はOpenSearch 2.11で導入された機能です。Elasticsearch 7.10.2では利用できないため、Amazon OpenSearch Service上のエンジンをOpenSearch 2.11.0以上へ移行する必要がありました。今回はOpen

AWS, Elasticsearch, Ruby, Ruby on Rails, Google BigQuery, Embulk, テスト, API, OSS, アーキテクチャ

株式会社ZOZO

2026年03月31日

オンプレミスSQL ServerからAurora MySQLへの無停止移行 ── 数十億レコードのお気に入りDBで実践した初期移行と差分同期

はじめにこんにちは、商品基盤部の杉浦、小原、寺嶋です。普段はZOZOTOWNのお気に入り基盤・商品レビュー基盤といった商品サブドメインを担当しています。私たちのチームでは運用コスト削減を目的として、お気に入りデータベースをオンプレミスのSQL ServerからAWS Aurora MySQLへの移行に取り組んでいます。お気に入りデータは数十億レコードに及び、移行中もデータが増え続けるためデータの静止点が作れないという課題がありました。本記事では、この大規模データ移行における初期移行の取り組みと、Emb

AWS, SQLServer, Embulk, データベース, Microservices, 設計, オンプレミス, 組み込み

株式会社ZOZO

2025年12月24日

DuckDB as a Pipeline: Findyデータ基盤におけるDuckDBの活用事例

この記事は「ファインディエンジニア #1 Advent Calendar 2025 」の24日目の記事です。沢山のアドベントカレンダー記事が執筆されていますので、年末のお供に是非読んでみてください。 adventar.org はじめにソフトウェアエンジニアの土屋(@shunsock) です。私の所属するデータソリューションチームでは、ファインディ全体のデータ活用を推進するためのデータ基盤を構築しています。今回、我々はデータ基盤のRDSとBigQueryのテーブル同期システム (EL Pipeli

AWS, GitHub, Google Cloud, Apache Spark, Google BigQuery, Embulk, フロントエンド, テスト, OSS, UIデザイン

Findy/ファインディ

2025年09月29日

数十億レコードをゼロダウンタイム移行 ── SQL ServerからAurora MySQLへのデュアルデータベース戦略

はじめにこんにちは。商品基盤部・商品基盤2ブロックの小原です。私が所属するブロックではお気に入り機能のマイクロサービスを担当しています。 ZOZOTOWNではさらなる成長に向けて、さまざまなリプレイスプロジェクトが進行中です。本記事では、その中でもお気に入り機能のリプレイスについて紹介します。SQL ServerからAurora MySQLへ数十億レコードをゼロダウンタイムで移行するために設計したデュアルデータベース戦略を解説します。こんな方に読んでもらいたい段階的なマイクロサービス移行戦略

Android, AWS, iOS, Java, MySQL, SQLServer, Embulk, テスト, Microservices, オンプレミス

株式会社ZOZO

2024年12月18日

INFORMATION_SCHEMAを用いたBigQueryデータ監視

はじめにこんにちは！Data Strategy teamでデータエンジニアをしているshota.imazekiです。今回はBigQueryでのINFORMATION_SCHEMAを用いたBigQueryデータ監視というテーマでブログを書いていこうと思います。 BigQueryを利用していく上で「クエリが実行できなくなった」「データが古いまま更新されていない」「使われていないデータがある」などの様々な運用上の課題があるかと思います。それをINFORMATION_SCHEMAで使って簡単に解決していこうと

Google Cloud, Google BigQuery, Embulk, Looker

BASE株式会社

2024年12月16日

レポートシステムの安定稼働に向けた取り組み

この記事は BASE アドベントカレンダー 16日目の記事です。はじめにこんにちは、CSE Group ※1 で社内の業務効率化の開発をしている上野です。アドベントカレンダー15日目は @miyachin_87 さんの記事でした、みなさんもうお読みでしょうか？私は特に業務効率化の開発をしているので Notion での自動タスク生成の話はとても参考になりました。まだの方はぜひお読みください！ devblog.thebase.in さて、アドベントカレンダー16日目の本日は、レポートシステムの安定稼働を

AWS, GitHub, Embulk, アーキテクチャ

BASE株式会社

2024年08月30日

Software Design 2024年8月号連載「レガシーシステム攻略のプロセス」第4回 ZOZOTOWNリプレイスにおけるマスタDBの移行

はじめに技術評論社様より発刊されている Software Design の2024年5月号より「レガシーシステム攻略のプロセス」と題した全8回の連載が始まりました。 ZOZOTOWNリプレイスプロジェクトで採用したマイクロサービス化のアプローチでは、安全かつ整合性のとれたデータ移行が必須となりました。第4回では、このマスタDBの移行について紹介します。目次はじめに目次はじめにマスタDB移行マスタDB移行について要件と課題テーブル構成を再設計したうえでデータ移行を実施するダウンタイムなし

MySQL, SQL, SQLServer, Embulk, OSS, データベース, Microservices, CS, 設計, オンプレミス

株式会社ZOZO

2024年05月23日

ニフティのデータ基盤を紹介します

はじめにはじめまして。ニフティ株式会社の鹿野です。この記事ではニフティのデータ基盤をご紹介いたします。データ基盤とはデータ基盤は、部署を横断して複数のデータを集約する場所です。サービスやプロダクトを横断してデータを活用することで、顧客体験やビジネス価値を向上させることを目的として活動しています。データ基盤の構成採用している技術スタックを以下に示します。 Data integration Embulk Data transformation, catalog dbt Data lake Ama

キャリア, Tableau, Embulk

ニフティ株式会社

2024年03月25日

Findyデータ基盤のアーキテクチャと技術スタック

1. はじめに Findyでデータエンジニアとして働いているひらき（ hiracky16 ）です。この記事ではFindyで取り組んでいるデータ基盤について紹介します。 Findyでは2023年からデータエンジニアを採用し本格的にデータ基盤構築に着手しています。これまではBigQuery（Google Cloud）を中心としたデータ蓄積・利活用をしていました。今後もっとデータ分析、機械学習などのデータ利用を加速するためにデータマネジメントが不可欠だと考えており、データエンジニアを採用しています。ま

Google Cloud, 機械学習, SQL, Google BigQuery, Embulk, データ分析, IaC, アーキテクチャ, Terraform, 設計

Findy/ファインディ

2023年12月12日

請求書発行のためにEmbulkを使って爆速でデータを集約した話

こんにちは。宿泊開発チームの菊地です！このエントリは一休.com Advent Calendar 2023 12日目の記事です。昨日は id:rotom による Slack Enterprise Grid における情報バリアの設計でした。その他の素敵なエントリも以下のリンクからご覧ください。 qiita.com 私はEmbulkを使って、各プロダクトの請求データを集約する機能を担当しました。今回は、Embulkの紹介とふりかえりをしていきたいと思います！背景課題解決策 Embulkとは？今回

SQL, SQLServer, Embulk

株式会社一休

2023年10月25日

おい、誰も騒いでないから騒ぐけどExternal Network AccessっていうSnowflakeから外部へアクセスできる機能、データサイロ完全にぶっ壊せるぞ。

NHK関連の話ではないですこんにちは harry( @gappy50 )です〜。これまでクラシルでデータエンジニアをしておりましたが、最近クラシルリワードという別プロダクトでデータエンジニアをしております。クラシルリワードのデータ基盤は以下に詳細がありますので、ご興味あればどうぞ！ tech.dely.jp 本記事のタイトルは私がTwitter改めXにポストした投稿から抜粋しました（恥おい、誰も騒いでないから騒ぐけどExternal Network AccessっていうSnowflakeから外部へ

AWS, Google Cloud, Google BigQuery, Embulk, ネットワーク, API, データベース, OAuth, Snowflake

dely株式会社

2023年09月20日

Cloud Data FusionをIaCで構築し、データパイプラインのマイグレーションを行いました

はじめまして。CADDiでバックエンドエンジニアとして働いている中野です。この記事では、Cloud Data Fusionを利用して作成したデータパイプラインについてご紹介します。 TL;DR Salesforce とBigQuery間のデータ連携にHeroku Connectをこれまで利用していたのですが、Cloud Data Fusionに乗り換えることでダウンタイムなしで約1/8までコストダウンができました。モチベーション弊社では、 Salesforce に溜まったデータをBigQueryに連

Google Cloud, Heroku, Salesforce, Linux, Google BigQuery, Embulk, IaC, ネットワーク, OSS, Terraform

キャディ株式会社

2023年06月02日

RubyKaigi 2023参加レポート〜エンジニアによるセッション紹介〜

こんにちは、バックエンドエンジニアの近です！ 2023/5/11〜13に長野県にて開催されたRubyKaigi 2023でプラチナスポンサーとして協賛し、スポンサーブースを出展しました。また、今年は我々が運営しているファッションコーディネートアプリ「WEAR」のサービス紹介CMを作成し、RubyKaigiの会場にて放映させていただきました。 technote.zozo.com technote.zozo.com 実際に放映されたCMは以下になります！ www.youtube.com 我々が運営・開発

JavaScript, Meetup, PostgreSQL, Ruby, Ruby on Rails, SQL, Embulk, ワークスタイル, IDE

株式会社ZOZO

2022年12月02日

アジリティを保ってデータ基盤を作る取り組み

はじめにこの記事は BASE Advent Calendar 2022 と Looker Advent Calender 2022 2日目の記事です。こんにちは。BASE 株式会社 New Division BASE BANK Section にて、Engineering Program Manager (以下EPM) 1 をしている永野( @glassmonekey ) です。私達のBASE BANK Section チーム (以下 BANK チーム) はBASEの中でも、新規事業の金融系のプロダ

Python, Google BigQuery, Embulk, データ分析, Looker

BASE株式会社