「Datadog」に関連する技術ブログ

企業やコミュニティが発信する「Datadog」に関連する技術ブログの一覧です。

Fargate移行再挑戦の記録

SREチームのクラシマです。(2022年4月にSREチームが発足、バックエンドエンジニアからSREになりました) PHPのパッチバージョンを上げたらひどい目にあった話 - TORANA TECH BLOG こちらで、Fargate移行にチャレンジして失敗、1年以上が過ぎました。 その間にToysub!のマイページもリリースされ、

カイポケリニューアルでの SREチームの活動の一部の紹介:認証基盤選定と OpenTelemetry周辺ツール調査

こんにちは、SREをやっている @okazu_dm です。 経歴としては、サーバサイドエンジニアからセキュリティエンジニアを経て、エス・エム・エスではサービス横断で技術的な課題を解決しています。 基本的には組織に必要なことと自分ができることや、やりたいことが交わるポイントで仕事をしており、現在はSREとして働いています。 今回は、 過去の記事 とは違い、既存SRE

Google Cloud社にSRE Jumpstartを開催いただきました

はじめまして。 株式会社ココナラのシステムプラットフォーム部インフラ・SREチームに所属しているぐっさんです。 本記事では2023年1月にGoogle Cloud社にSRE JumpstartのWorkshopを開催していただきましたので、このWorkshopで学んだことを紹介したいと思います。 SRE Jumpstartについて SRE(Site Reliability Engineering)とはシンプルに表現すると、Google Cloud社が提唱しているサービス運用

Lambdaを助けるのに理由がいるかい?(スロットリングの話)

こちらの記事は カケハシ Advent Calendar 2022 の19日目の記事になります。 あっという間に2022年も終わりますね⛄️ プラットフォームチームの石黒です。 今年は遅ればせながらFF9をプレイしまして、トロフィーをゲットするためにフィールド上でモーグリのモグオをたてぶえで呼びつけ、「なんでもない」を繰り返して怒られてしまったときに、ふとLambdaのことを思い出しま

DatadogのモニターをTerraformerでインポートして感じたことなど

この記事は Enigmo Advent Calendar 2022 の13日目の記事となります。 お疲れさまです。インフラチームの山口です。 弊社では一部イン フラリ ソースのモニタリングにDatadogを利用しています。 その中で、今回はDatadogの利用開始当初に GUI で作成されたモニターをTerraformerとTerraformを使用して構成管理した際の事例について報告します。 同様の技術スタックを使用したインポート

AWS IoTに対するSLOアラート設定のためのDatadog導入検証

※この記事は、Luup Advent Calendar の11日目の記事です。 最初に こんにちは、Luup SREチームの峯岸です。 今回はLuupのSREチームにて行っている「SLI/SLOの導入」への取り組みについて記載したいと思います。 LuupのSREチーム紹介で記載しているように、SREチームはインフラ品質や信頼性を高めることを目的に動いております。 その中のミッションの1つに「組織全体へのSLI/SLOの導

Prometheus + Grafana + X-Rayで始めるO11y

はじめに こんにちは。プラットフォームGでDevOpsエンジニアをしている島村です。 KINTOテクノロジーズのプラットフォームGのDevOpsサポートチーム(とSREチーム)では、CI/CD以外にも、監視ツールの整備やモニタリングツールの改善を実施しています。 プラットフォームGは他にもSystemAdministratorチーム、CCOE、DBREなどがあり、AWSを中心としたインフラの設計・構築運用の他にも

【テスト自動化】APIテストの自動化ツールを調査してみた

勤怠サービスの開発チームに所属しているkarabishです。 テストに関するある課題を解決するために API テストの自動化ツールを調査しました。まだチーム内に展開していないのですが、調査結果のうちツールの選定に関する部分を備忘録として残しておこうと思います。 なぜAPIテストを自動化するのか ツールの選定方針 調査したツールたち 調査方法 調査結果 Tavern テス

Argo Rolloutsを導入してカナリアリリースを実現する

はじめに こんにちは。計測プラットフォーム開発本部SREブロックの纐纈です。今年の4月に入社し、ZOZOMATやZOZOGLASSの運用改善に取り組んでいます。また、今年の夏US向けにZOZOFITをリリースしましたが、そちらの機能追加にも今後関わっていく予定です。 計測システムでは最近Argo Rolloutsを導入してカナリアリリース、自動ロールバックを実現しました。本記事では、その具

S3 Object Lambda を使って処方箋プレビューに透かしを入れる

こんにちは。医療プラットフォーム本部プロダクト開発室エンジニアの中畑です。主にオンライン診療・服薬指導アプリ CLINICS の開発を担当しています。 今回は CLINICS アプリ内で扱う処方箋プレビューに透かし(watermark)を入れた話を紹介したいと思います。なぜ実施したのか、実装方法、パフォーマンスチューニングの 3 本立てでお送りしたいと思います。 課題と解決方

カナリアリリースを自動化!Flaggerでプログレッシブデリバリーを実現した話

はじめに こんにちは。SRE部ECプラットフォーム基盤SREブロックの大澤と立花です。 本記事ではマイクロサービスのカナリアリリースに関して私達が抱えていた課題と、それをFlaggerによるプログレッシブデリバリー導入でどのように改善したのかを紹介します。 ZOZOTOWNのマイクロサービス基盤におけるカナリアリリース手段の変遷については以下のテックブログで紹介して

ZOZOTOWNのGo言語におけるマイクロサービス開発の共通規約を守るための取り組み

はじめに こんにちは。ECプラットフォーム部の北原です。普段はZOZOTOWNのバックエンドの開発、運用に携わっており、現在は会員機能を司るマイクロサービスの開発を進めています。 今回はZOZOTOWNのGo言語におけるマイクロサービス開発の共通規約を守るための取り組みを紹介します。 マイクロサービス開発の課題 ZOZOTOWNでは複数のマイクロサービスでGo言語を使っていま

Rails+Next.jsでGraphQLを導入する時に考えたこと

こんにちは、タイミー開発プラットフォームチームで業務委託として働いている 宮城 です。 タイミーはリリースから4年が経過したプロダクトで、2022年の前半から一部領域でGraphQLを利用し始め現在導入を進めています。 本記事では、GraphQLをプロダクトに導入する上で判断に迷った箇所や課題に対して、タイミーでの意思決定とその理由を紹介します。参考にしていただ

WEARにおけるSLOを用いた信頼性改善の取り組み

こんにちは、WEAR部バックエンドブロックの小山とSREブロックの繁谷です。 WEAR では日々システムの信頼性を向上させるため改善に取り組んでいます。今回はその中でもSLOに基づいた改善について紹介いたします。 WEARリプレイスの歩み WEARでは2019年から本格的にリプレイスを開始しましたが、当初は専属のSREはおらずインフラ構築など緊急度の高いものをバックエンドの

【Airflow】夜間バッチが心配で夜も眠れない...なら夕方にも動かせるバッチ処理のE2Eテスト環境を作ってしまおう!

こんにちは、カケハシで Musubi Insight のバックエンドエンジニアをしている末松です。 夜間などに動くバッチ処理を開発・メンテしているエンジニアの方ならきっと共感していただけると思うのですが、夜間バッチって心配になりますよね。 朝早起きして結果を確認したり、夜更かししてリアルタイムで張り込みをしたり... 数名いる Musubi Insight のバックエンドエンジニア
技術ブログを絞り込む

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか?