「Datadog」に関連する技術ブログ
企業やコミュニティが発信する「Datadog」に関連する技術ブログの一覧です。
全166件中 1 - 15件目
OSSでオブザーバビリティを実現する (Grafana Stack x OpenTelemetry on Kubernetes)
2024/09/26
ブックマーク
はじめに こんにちは。SREの gumamon です! NewRelic、Datadog、モダンな監視ツール(オブザーバビリティ)って良いですよね。弊社も Kubernetes ( k8s )等を利用した環境が増えてきた折、そろそろ必要になってきたのですが、NewRelic、Datadog等の クラウド サービスは ランニングコスト が高くなりがちです。 では内製できないかやってみよう!・・・というようなことを昨年度から取
Argo Workflowsで構築したMLパイプラインの監視事例
2024/09/20
ブックマーク
こんにちは。AIチームの干飯( @hosimesi11_ )です。今回はAI Shiftの新規サービスであるAI Messanger SummaryのMLパイプラインの監視についてまとめたいと思います。 具体的にはExitHandlerで外部ツールとの連携をしつつ、詳細なメトリクスの監視は Google Cloud Managed Service for Prometheus + Cloud Monitoring で構成しました。 事前情報 AI Messenger Summaryとは AI Messenger Summaryはコールセンターにおけ
Luupの開発組織におけるインシデントマネジメントの変遷
2024/09/17
ブックマーク
はじめに LuupのSREチームに所属している、ぐりもお(@gr1m0h)です。 6月に「Waroom Meetup #1」にスピーカーとして招待いただきました。また、この勉強会はオンライン配信がなくオフラインのみの開催だったため、7月に広島で行われた「Road to SRE NEXT@広島」でも内容を少しアップデートして登壇しました。 https://topotal.connpass.com/event/317285/ https://sre-lounge.connpass.com/event/320488/ 資
プロダクト開発のモニタリングにおいて大事な4つの段階とベストプラクティス
2024/09/13
ブックマーク
カケハシで Musubi Insight のバックエンドエンジニアをしている末松です。今回はプロダクトのモニタリングをどう進めていくべきかについて、4つの大事な段階とそのベストプラクティスを紹介したいと思います。 この記事は 秋の技術特集 2024 の 10 記事目です。 想定読者 モニタリングの悩みあるある モニタリングを始めるためには モニタリングにおいて大事な4つの段階
Flaggerでも手動カナリアリリースがしたい!
2024/08/29
ブックマーク
はじめに こんにちは。株式会社ZOZOのSRE部プラットフォームSREチームに所属している はっちー と申します。 本記事では、Kubernetesクラスター上で自動カナリアリリース機能を提供するFlaggerが導入済みのマイクロサービスにおいて、手動カナリアリリースを実施する方法について紹介します。一見、矛盾するように思えるかもしれません。しかし、時にはそのような要件も
WEARアプリリニューアルにおける負荷試験事例(計画編)
2024/08/23
ブックマーク
はじめに こんにちは! WEARバックエンド部バックエンドブロックの高久です。普段は弊社サービスであるWEARのバックエンド開発・保守を担当しています。 10周年を迎えた WEAR は2024年5月9日に大規模な アプリリニューアル を行いました。アプリリニューアルに伴い負荷試験を行ったので、本記事ではどのように負荷試験を計画したか事例をご紹介します。 記事は計画編
AWS Summit Tokyo 2024 1日目に参加してきました!
2024/08/08
ブックマーク
はじめに Hello everyone! ワンキャリアでSREをしている渡邉(X: @PwatanabeMiki )です! 現在私はONE CAREER CLOUDの採用管理ツール(ATS)開発チームのSREを主に担当しています。6月20〜21日に開催されたAWS Summit Tokyo 2024の1日目(20日)に参加したので学びや感想についてまとめました。
SRE NEXT 2024でクライアントサイドへのSLI/SLOの導入についてお話しました
2024/08/08
ブックマーク
はじめに LuupのSREチームに所属している、ぐりもお(@gr1m0h)です。 日本最大のSREカンファレンス SRE NEXT 2024 に登壇しました。このカンファレンスはSRE Loungeの運営メンバーが主体となって運営しており、今回で4回目の開催です。 私の登壇の題は「Enabling Client-side SLO」です。これまでの「Enabling SLO」の活動の一環として、クライアントサイド(iOS・Android)のSLOのを計測し始
障害への不安をぶっ壊す!カオスエンジニアリングを運用しシステムとチームの耐障害性を高める
2024/08/08
ブックマーク
はじめに こんにちは、計測プラットフォーム開発本部SREブロックの 山本 です。普段はZOZOMATやZOZOGLASSなどの計測技術に関わるシステムの開発、運用に携わっています。 我々のチームは、複数サービスを運用する中で障害対応の経験不足や知見共有の難しさといった課題に直面していました。そこで、半年ほど前にカオスエンジニアリングの導入を開始しました。 本記事
Opsの私が Ruby on Rails チュートリアルをやってみた感想
2024/08/05
ブックマーク
こんにちはマネージドサービス部 大城です。 飛行機で時間があったので、最近勉強したRuby on Rails チュートリアルの感想を書きます。 私はOpsの仕事をしていて、AWS環境でインフラ屋さんをしながらNew Relic、Datadog、Zabbixとたわむれています。 普段コードを書くことはあまりないのですがRuby on Rails(以下Rails)チュートリアルをやってみました。 Railsとは Railsチュートリア
Software Design 2024年7月号 連載「レガシーシステム攻略のプロセス」第3回 API Gatewayとサービスメッシュによるリクエスト制御
2024/07/31
ブックマーク
はじめに 技術評論社様より発刊されている Software Design の2024年5月号より「レガシーシステム攻略のプロセス」と題した全8回の連載が始まりました。 ZOZOTOWNリプレイスでは、段階的にシステムを置き換えるというアプローチによってマイクロサービス化を進めています。第3回は、マイクロサービス化の要となったAPI Gatewayの自社開発の話を中心に紹介します。 目次 はじめ
NATゲートウェイの通信内容を調査して対策し、コストを約60%削減した話
2024/07/26
ブックマーク
はじめに こんにちは。WEARバックエンド部SREブロックの 春日 です。普段は WEAR というサービスのSREとして開発・運用に携わっています。本記事では、約60%のコスト削減に成功した NATゲートウェイ の通信内容の調査方法と通信量の削減方法についてご紹介します。 目次 はじめに 目次 背景 コストの把握 NATゲートウェイの通信内容の把握 CloudWatchメトリクスでの確認 VPCフ
普段WEB開発している学生がゲームのバックエンド開発に挑戦した話
2024/07/01
ブックマーク
はじめに はじめまして、2024年3月下旬から1ヶ月間、JOB生としてインターンをしていた小池雄大で ...
大規模サービスのローンチに向け、パフォーマンスチューニングした話
2024/06/20
ブックマーク
背景 こんにちは!Hanoi Dev Centerでバックエンドエンジニアをしているminhquan ...
mamadays.tv から tomonite.com へドメインを変更しました
2024/06/14
ブックマーク
はじめに この記事は、 every Tech Blog Advent Calendar 2024(夏) の14日目の記事です。 株式会社エブリーでソフトウェアエンジニアをしている桝村です。 子育てメディア「MAMADAYS」は、2023年に「トモニテ」に名称変更しつつ、ロゴやアプリアイコンのデザインを刷新しました。 tomonite.com トモニテのサービス名称変更については、以下の記事でも詳しく紹介しています。 tech.every.tv