「Datadog」に関連する技術ブログ

企業やコミュニティが発信する「Datadog」に関連する技術ブログの一覧です。

ZOZOMAT/ZOZOGLASSにおけるSLOの立て直しについて

はじめに こんにちは、計測プラットフォーム開発本部SREブロックの近藤です。普段はZOZOMATやZOZOGLASS、ZOZOFITなどの計測技術に関わるプロダクトの開発、運用に携わっています。計測プラットフォーム開発本部では、以前プロダクト単位でSLO(Service Level Objective) 1 を定めましたが、うまく活用できず、再度SLOについて運用方法を考え直すことになりました。本記事では、SLOの

EKS周りの監視構成の概要

こんにちは。 インフラグループ Kubernetes チームの福田です。 みなさん、システムの監視はどうしているでしょうか? 弊社では幾らかのサービスをEKS上で動かしており、その監視にはDatadogとPrometheus Stackを使っています。 この記事では特にPrometheus Stackを使ったEKS周りの監視構成について、その概要を紹介したいと思います。 クラスタ 毎の構成 まず、我々は以下の Kubernete

MiiTel AccountのSLO: 測定と継続的な最適化の方法

Photo by Luke Chesser on Unsplash はじめに RevCommの宇佐美です。 RevCommでは、音声解析AI電話「MiiTel(ミーテル)」やAI搭載オンライン会議解析ツール「MiiTel Meetings」を開発・提供しています。 私はMiiTelの認証基盤 (MiiTel Account) 開発チームで、Project Manager兼Sortware Engineerとして活動しています。 過去記事: Cognito user pool で OpenID Connect を利用した外部 ID Pr

Methods for Measuring and Continuously Optimizing MiiTel Account's SLO

Photo by Luke Chesser on Unsplash Introduction (This article is a translation of the Japanese article titled "MiiTel AccountのSLO: 測定と継続的な最適化の方法") I'm Kei Usami from RevComm. We develop and provide an AI-powered phone system "MiiTel" and an AI-powered online meeting analysis tool "MiiTel Meetings." I work in the MiiTel authentication platform (MiiTel Account) team, serving as a Project Manager and Software Engineer. Previous Articles: Cognito user pool で OpenID

DynalystのML監視の取り組み事例

AI事業本部Dynalystのデータサイエンティスト長江(@nsakki55)です。今回はDynal ...

【開催報告 & 資料公開】AWS 秋の Observability 祭り

こんにちは。ソリューションアーキテクト (以下 SA) の高野です。 2023 年 9 月 22 日に「 AWS 秋の Observability 祭り 」と題したイベントを開催しました。昨今システムを運用する上で重要となってきている Observability をテーマにしたイベントです。ご参加いただきました皆様には、改めて御礼申し上げます。 当日の様子と実施内容 AWS から Amazon CloudWatch をはじめとする Observabil

一休.comサイトパフォーマンス改善 - 2023年 夏の振り返り

ヤフー株式会社より出向しております、卯田と申します。 主務で、 一休.com および Yahoo!トラベル のフロントエンド開発を担当しています。 兼務で、ヤフー株式会社の全社横断組織で Webパフォーマンス改善の推進 を行っております。 本稿では、直近半年弱(2023年2月〜8月)で、断続的に行っていた一休.comのパフォーマンス改善について振り返ります。 開始が2023年2月とな

Go言語のElasticsearchクライアントに触れての知見共有

はじめに 検索基盤部の内田です。検索基盤部はZOZOTOWNの商品検索ロジックや検索動線上の各機能の改善に取り組んでいます。検索機能に関連したバックエンド実装にはJavaを使うことが多かったのですが、近年ではGo言語を採用することも増えてきました。 この記事は、Go言語で実装したWeb APIからElasticsearchへの検索処理を実装した際に調べたことをまとめたものです。Go言

DatadogでダミーのAWS Healthイベントを発行する

概要 Datadogで、 AWS Health Integration がイベント発行したかのようなダミーのイベントを発行する方法についてまとめます。 背景 任意のAWS Healthイベントが発行された際に、期待通りにDatadogのモニターでアラートが発生するのか試したいモチベがあったため。 やり方についてざっくり解説 Datadogのカスタムイベント発行によって実現できます。 Datadogには複数のやり方で、カス

ワークフロー実行基盤をFargateからEC2へ変更したらコストもパフォーマンスも改善できて幸せになった話

はじめに こんにちは、ブランドソリューション開発本部バックエンド部SREブロックの小林( @mirai_kobaaaaaa )です。普段は WEAR や FAANS というサービスのSREとして開発、運用に携わっています。 WEARではAmazon Elastic Kubernetes Service(以下、EKSと呼ぶ)を用いて複数システムのインフラ基盤を構築・運用しています。その中の1つとして、ワークフロー処理の実行基盤が存在してい

WEARにおけるKubernetesネイティブな負荷試験基盤の導入とその効果

はじめに こんにちは。ブランドソリューション開発本部バックエンド部SREの山岡( @ymktmk )です。普段はファッションコーディネートアプリ「 WEAR 」のSREとしてクラウドの運用やリプレイスをおこなっています。 昨年から、私たちのチームでは分散した技術スタックをKubernetesへ統一するリプレイスプロジェクトを開始し、先月ついにKubernetesへの移行が完了しました。 tec

GitHub Actions料金 Datadogによる可視化と削減のヒント

開発コストのうちGitHub Actions料金が占める割合は小さい傾向にありますが、組織規模によっては削減の必要があるでしょう。 この記事では、主にDatadogを利用した可視化による特定方法と、一般的なコスト削減のヒントを述べます。 前提:パフォーマンスを改善する 従量課金のアプリケーションではパフォーマンス ≒ コストです。まずは実行時間から改善しましょう。

社内で挑むモブシステムデザインインタビュー

はじめに みなさんこんにちは! ワンキャリアでDevRelチームを担当しています中西( @nana_nigiiro )です! 今回は2023年3月から実施している「モブシステムデザインインタビュー」についてお伝えします。 システムデザインインタビューに興味のある方にとっても、参考になる内容になっていますので、もしよければご一読ください。

droidcon San Francisco 2023レポート 〜行ってきました編〜

はじめに こんにちは、 Android エンジニアのはる( @ haru2036 )とシャム( @arus4869 )です! 私たちは2023年6月8~9日に アメリカ合衆国 サンフランシスコで開催された droidcon San Francisco 2023 に参加してきました。 タイミーでは KaigiPass というカンファレンス参加補助制度があり、その海外参加第一号として私たちが参加してきた形になります。 私たちが開発・運営している タイミ

DD_ENV、DD_SERVICE、DD_VERSIONを統一した話

SREのクラシマです。 今回はDatadog用の設定を変更した話です。 トラーナでは、frontend用にDatadog RUM、backend用に APM 、更にCloudwatch LogsをDatadogに連携して、エラー時はPagerDutyおよびSlackに通知しています。 ここで、RUMででたエラーからbackendのエラーログに繋がったら便利ですよね? Datadogの設定を誤っていなければ、できます。 そして、弊社は誤った設定のままずっと運用し
技術ブログを絞り込む

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか?