「Datadog」に関連する技術ブログ

企業やコミュニティが発信する「Datadog」に関連する技術ブログの一覧です。

「LuupにおけるSLOの物語」という題でSLOconf Tokyo 2023に登壇しました

はじめまして、株式会社Luup SREチームに所属しています、ぐりもお(@gr1m0h)です。 Nobl9社が主催する SLOconf というSLO(サービスレベル目標)にフォーカスしたカンファレンスのローカルなコミュニティーイベント、SLOconf Tokyo 2023 に登壇しました。このイベントは、Googleの渋谷オフィスで 5/16 に開催されました。 発表資料は以下になります。 はじめてのオフライン登壇で

IoT関連のログをDatadogのLog Pipelineを利用して可視化してみた

こんにちは、Luup SREチームのにわです。 経緯 LuupではAWS IoT CoreのログをDatadogに入れて分析をしようと取り組んでいます。その中で、AWS IoT CoreのログはAWSIotLogsV2として送信されます。Luupでは、このAWSIotLogsV2に含まれるログには、 イベントごとにPublish-In, RuleExecution, Publish-Out, Disconnectなどのログが含まれています。 現時点では公式のLog PipelineはPipeline Libraryにないため、Datadog

IoT関連のログをDatadogのLog Pipelineを利用して可視化してみた

こんにちは、Luup SREチームのにわです。 経緯 LuupではAWS IoT CoreのログをDatadogに入れて分析をしようと取り組んでいます。その中で、AWS IoT CoreのログはAWSIotLogsV2として送信されます。Luupでは、このAWSIotLogsV2に含まれるログには、 イベントごとにPublish-In, RuleExecution, Publish-Out, Disconnectなどのログが含まれています。 現時点では公式のLog PipelineはPipeline Libraryにないため、Datadog

Splunkと Datadog Database Monitoringを用いたDBパフォーマンスの可視化

はじめに こんにちは、SRE部カート決済SREブロックの伊藤です。普段はZOZOTOWNのカート決済機能のリプレイス・運用・保守に携わっています。また、チームを跨いだ横断活動としてデータベース(以下DB)周りの運用・保守・構築に関わっています。 ZOZOTOWNではSQL Serverを中心とした各種DBMSが稼働しています。本記事はSQL Serverのパフォーマンスを調査する上で進めた可視化に

PipeCDがCNCF Sandboxに参加することが決まりました

オープンソースの開発者として、とても嬉しい日です 😄 私たちのチームがはじめた継続的デリバリーツール ...

APIが遅いと思っていたら、GCPのCloudNATでパケロスしていた話

導入 問題の発覚 動的ポート割り当ての落とし穴 監視とアラート 導入 こんにちは、Product Team SREのkterui9019です。 今回はGCPのCloudNATについての調査結果を共有したいと思います。CloudNATを利用している中で気づかないうちに実はパケットロスが発生していたので、詳細をご紹介します。 問題の発覚 私たちはお客様からの問い合わせを受けて、GKEにデプロイされている特定の

分散トレーシングの活用による次世代のテストを考える

こんにちは、QAエンジニアのカンパチロックです。 今回は、テストフェーズにおいてQAの価値を向上させる方法の1つとして、分散トレーシングおよびその標準規格であるOpenTelemetryについて説明します。これにより、システム内で発生する問題をより迅速かつ正確に特定し、開発プロセスをより迅速かつ効率的に進めることができます。 分散トレーシングとは まず、分散

Solr Operatorを利用したKubernetes上での検索システムの構築について

エンジニアの竹田です。 BUYMA の検索システムやMLOps基盤の開発・運用を担当しております。 今回はSolr Operatorによる検索システム構築を行いましたので、その実施内容と得られた知見についてご紹介したいと思います。 はじめに 昨期から今期にかけて、オンプレミスのシステムからの脱却、およびマイクロサービス化を目指し、商品検索システムのリプレイスを進めてい

CDK for Terraformは実用可能か? DatadogのMonitorを構成管理してみる

概要 未だ0系でありながら、22年8月に 一般提供が開始 された CDK for Terraform の実用性を検討し、DatadogのMonitor(およびDowntime)の構成管理をコード化しました。 背景 弊社では主要な監視ツールの一つとして Datadog を活用しており、弊チームでも Datadog の Monitor という機能を利用して、インフラリソースの各種メトリクスが異常値を示した時のSlack通知やオンコール設定などを

AWS Compute Optimizer に Datadog のメトリクスを取り込んで精度を向上させる

マネージドサービス部 佐竹です。今回のブログでは re:Invent 2022 で発表されたアップデートに関連して、実際に AWS Compute Optimizer で Datadog のメトリクスを取り込んで精度を向上させることができたことを証跡としてブログに記載しまとめました。またそのために必要な設定についても、Datadog の公式ドキュメントに記載がない点も含め、注意事項を踏まえて記載しています

ココナラ的ベストTerraformディレクトリ構造を考える

こんにちは。 株式会社ココナラのシステムプラットフォーム部でインフラ・SREチームのチームマネージャーをしているよしたくと申します。 前回はインフラ・SREチームの主に組織的な部分を紹介しましたが、今回はより技術的な取り組みを一部紹介します。 https://zenn.dev/coconala/articles/da8787cbade8d0 ココナラではクラウドリソースの管理にTerraformを利用しています。今回この

WEARにおけるプッシュ通知システムのリプレイスを全て完了した話

こんにちは、WEARバックエンドブロックの天春です。バックエンドの運用・開発に携わっています。本記事では、以前公開した WEARにおけるプッシュ通知システムのリプレイス のフェーズ2を終え、旧環境のプッシュ通知システムのリプレイスを完了したのでシステム構成や移行手順をご紹介します。 目次 目次 1:Nのプッシュ通知システム リプレイス前の1:Nのプッシュ通知

ZOZOFIT 認証フローにおけるJVM言語実装のLambda関数のパフォーマンス改善

はじめに こんにちは。計測プラットフォーム開発本部バックエンドチームの岡山です。普段はZOZOMATやZOZOGLASSなどの計測技術に関わるシステムの開発、運用に携わっています。去年の夏にZOZOFITというサービスを北米向けにローンチし、そのシステムも同様に開発、運用に携わっています。 本記事では、ZOZOFITの認証フローで実行されるScala実装のAWS Lambda関数が抱えていたパ

Fargate移行再挑戦の記録

SREチームのクラシマです。(2022年4月にSREチームが発足、バックエンドエンジニアからSREになりました) PHPのパッチバージョンを上げたらひどい目にあった話 - TORANA TECH BLOG こちらで、Fargate移行にチャレンジして失敗、1年以上が過ぎました。 その間にToysub!のマイページもリリースされ、
技術ブログを絞り込む

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか?