「Datadog」に関連する技術ブログ
企業やコミュニティが発信する「Datadog」に関連する技術ブログの一覧です。
全220件中 166 - 180件目
WindowsにDatadog Agent導入
2021/06/28
ブックマーク
こんにちは、SWX3人目の熊谷(悠)です。 本稿ではGUIでのインストールを取り扱います。 導入はとても簡単です。 環境 ・AWSで公式のクイックスタートAMIを使用しました。 Microsoft Windows Server 2019 Base - ami-0f3651a900e33262f Microsoft Windows 2019 Datacenter edition. [English] ・インスタンスはPublic Subnetに作成しました。 ※private subnetからNATゲートウェイやHTTPSプロキシ経由でもDatadog Agentのデ
Datadog APMで実現するサーバーレスアーキテクチャの分散トレーシング
2021/06/23
ブックマーク
はじめに こんにちは。ブランドソリューション開発部 プロダクト開発チームの杉田です。 Fulfillment by ZOZO (以下、FBZ)が提供するAPIシステムの開発・運用を担当しています。 本記事では、サーバーレスアーキテクチャを採用しているFBZのAPIを例に、Datadog APMを使った分散トレーシングの導入手順と運用する際のポイントを紹介します。 「サーバーレスアーキテクチャを
DELISH KITCHEN のデータベースの現状と Aurora を導入した話
2021/06/15
ブックマーク
はじめに DELISH KITCHEN のデータベースについて紹介します。 サービスやバックエンドシステムの全体像については DELISH KITCHEN のサービスとバックエンドシステムのお話 - every Engineering Blog で紹介しています。よろしければご覧ください。 概観 DELISH KITCHEN ではサービスの大半のデータの保存に Amazon RDS を使用しており、データベースエンジンとしては主に MySQL を使用してい
【毎日AWS #211】AWS Lambda Extensions が東京・大阪リージョンでも一般提供開始 他6件 #サバワ
2021/06/07
ブックマーク
はじめに 今回は、 6/4のアップデートについて紹介していきます。 こちらの内容については、YoutubeやPodcastでもアップロードしているので、気になる方はぜひチェックしてください。 ■ YouTube での配信 youtu.be ではさっそくアップデートの方を見ていきましょう! アップデート内容 ①AWS Lambda Extensions が東京・大阪リージョンでも一般提供開始 Lambdaレイヤーを使って、Lambda
DatadogでAWS Lambdaの拡張メトリクスを取得する
2021/06/07
ブックマーク
はじめに DatadogでLambdaの監視を検討する際、以下のような情報の管理を考えると思います。 (番号は本記事のために便宜的に付与したもの) 標準的なメトリクスの収集 拡張Lambdaメトリクスの収集 ログの収集 カスタムメトリクスの収集 トレースの収集 本記事では、「2. 拡張Lambdaメトリクスの収集」と「3. ログの収集」の方法を紹介したいと思います。 拡張Lambdaメトリク
KubernetesのDatadogAgentインストール手順
2021/06/04
ブックマーク
こんにちは、SWX3人目の熊谷(悠)です。 セルフマネージド型ノード(EC2)のKubernetesをDatadogで監視する際に必要なAgentのインストール手順を記します。 kubectlの概要と使い方、Kubernetesのコンポーネントが各々どんな役割を持つかざっくり理解できている程度の人向けです。 インストールするサービス Datadog Agent(Datadog Node Agent) 必須です。DaemonSetとして全てのノードで稼
Fastlyのパスベースルーティングで実現するWEARのゆるやかなクラウド移行
2021/05/31
ブックマーク
はじめに こんにちは。メディアプラットフォーム本部 WEAR部 WEAR-SREの長尾です。 WEAR は2013年にリリースされ、現在8年目のサービスです。そして、2004年にリリースされた当時のZOZOTOWNと同じアーキテクチャを採用しているため、比較的古いシステム構成で稼働しています。本記事では、そのWEARのWebアプリケーション刷新とクラウド移行で実践している、Fastlyを活用したパ
Istioによるサービスメッシュをどのようにプロダクションレディにするか
2021/05/28
ブックマーク
はじめに SRE部 ECプラットフォームSREチームの小林 ( @akitok_ ) です。 ZOZOTOWNでは、マイクロサービス間通信におけるトラフィック制御のために、 Istio によるサービスメッシュを導入しています。本記事ではZOZOTOWNのマイクロサービスプラットフォーム基盤(以下、プラットフォーム基盤)において、Istioをいかにプロダクションレディな状態で本番に投入していったか、その
【Python2】AWS Secrets Manager 経由で Datadog のシークレット値を取得してみる
2021/05/19
ブックマーク
はじめに Datadog で Mysql の接続監視をする際、 設定ファイルに DB パスワードを直書きしたくないなーと思っていたところ、どうやら以下の「Secrets Management」機能でシークレット値を取得できるとのことなのでやってみました。 公式ドキュメントはこちら 記事目安...15分 はじめに 「Secrets Management」機能 スクリプトについて 概要 動作環境 使い方 シークレットキーの登録 AW
API Serverの新規開発時に導入してみて良かった事
2021/05/18
ブックマーク
はじめに 前提技術スタック pre-commit、CIでのLintチェック、パッケージをクリーンアーキテクチャ構成にする pre-commit 良かった事 CIでのLintチェック 良かった事 パッケージをクリーンアーキテクチャ構成にする 良かった事 まとめ はじめに DELISH KITCHEN開発部の福山です。 社内向けシステムとしてAPI Serverを新規に構築する機会がありました。新規開発にあたり導入してみて良
ZOZOTOWNリニューアルで実施したCache Stampede対策
2021/05/18
ブックマーク
はじめに こんにちは。マイグレーションチームの藤本です。 この記事では、 先日のリニューアル に伴って導入したBackends For Frontends(以下、BFF)で、Redisを使ったキャッシュの事例をご紹介します。キャッシュを導入する際に起きる問題とその回避策について、サーバーサイドのアプリケーションで行った対策をもとに紹介していきます。 ZOZOTOWNリニューアルとBFF ZOZOTOWN
Laravel と swoole で安全にコルーチンを使用するには
2021/05/17
ブックマーク
みなさん、こんにちは!めもりー( @m3m0r7 ) です。 今回は弊社の技術スタックの一つである Laravel と swoole, そして laravel-swoole で安全にコルーチンを使う方法を弊社プロダクトを開発する上で得た知見をもとに解説していこうと思います。 そもそも swoole とは? swoole とは Swoole is an event-driven asynchronous & coroutine-based concurrency networking communication engine with high performance written in
ZOZOTOWNマイクロサービスの段階的移行を支えるカナリアリリースとサービス間通信における信頼性向上の取り組み
2021/04/02
ブックマーク
はじめに SRE部プラットフォームSREチームの川崎 @yokawasa です。 ZOZOTOWNではモノリシックなアーキテクチャーから、優先度と効果が高い機能から段階的にマイクロサービス化を進めています。本記事では、そのZOZOTOWNの段階的なマイクロサービス移行で実践しているカナリアリリースとサービス間通信の信頼性向上の取り組みについてご紹介します。 なお、ZOZOTOWNのリプレイ
LighthouseでLIFULL HOME'Sを計測し可視化した話
2021/03/10
ブックマーク
はじめまして テクノロジー本部 基盤運用ユニット 基盤グループの久保田です。 より良いサービスを提供していくために必要なことは色々あり、また答えがあるものではないと思っていますが どういったアプローチを行うにせよ、それを検討していくためにはまずは 「自分たちが置かれている状況を把握すること」 が必要と考えています。 そこで以前、自社サービスで
FBZにおけるサーバーレス監視で実施したアラート通知の最適化
2021/03/03
ブックマーク
はじめに こんにちは。BtoB開発チームの中島です。 Fulfillment by ZOZO (以下、FBZ)で提供しているAPIシステムの開発・運用を担当しています。 FBZの運用では、エラーログ発生時にアラートを通知させ、エラー内容をチェックして対応要否を判断しています。しかし、アラート通知が多すぎると運用負荷が高くなったり、重要なアラートを見落とすリスクもあるため、適切な