TECH PLAY

Datadog」に関連する技術ブログ

338 件中 91 - 105 件目
みなさん、こんにちは!最近 Kubernetes に触る時間が取れず、枕を涙で濡らしている杉山です! そんな私ですが、去る4月1日〜4日にロンドンで開催された KubeCon + CloudNativeCon Europe 2025 に参加してきました!ので、参加レポートを書きたいと思います!💪 ロンドンまでの直行便はとても長かったですが、素敵な街でした🇬🇧 KubeCon + CloudNativeCon とは? 公式ページは以下となります。 events.linuxfoundation.org The
はじめにこんにちは。Enablement EngineeringチームでSRE(site reliability engineer)業務を担当しているDahee Eoです。私たちのチームは、LINEサ...
はじめに こんにちは!タイミーでPlatform Engineerをしている @MoneyForest です。 本記事では、タイミーで実施したProduction Readiness Checkの取り組みを紹介します。 Production Readiness Checkとは プロダクションレディネスチェック(Production Readiness Check)とは、 「サービスが本番環境で安定して運用できる状態にあるかどうかを評価」 するプロセスのことです。 UberのSREの知見から書かれた書籍 プ
こんにちは! タイミーでPlatform Engineerをしている @MoneyForest です。 ObservabilityCON on the Road Tokyo 2025に参加してきました。 参加した感想や気づきなどをお届けします。 はじめに 普段は Datadog をメインに利用している弊社ですが、他のツールなどを知ることで深まる知見もあると考え、先日開催された Grafana Labs 主催の「ObservabilityCON on the Road Tokyo」に参加してきました。本記事
はじめに Redis ログについて slow ログ engine ログ 設定方針 構成 Datadog Logs 向けに slow ログを修正する インフラ構成 Datadog Logs の風景 おわりに 参考 はじめに 弊社では Web アプリケーションや非同期処理用ジョブの一時データなどを取り扱う際に ElastiCache Redis をインメモリデータベースとして利用しています。 これまで ElastiCache Redis 自体の稼動状況の把握には CloudWatch メトリクスを中心とした数
みなさんこんにちは! ワンキャリアのデータチームでテックリードをしている高根沢 (X: @p0x0q_jp ) です! 今回は、Gemini の安定性を継続的に監視するために導入した「ヘルスチェックエンドポイント」と「DataDog Synthetic Test による外形監視」の仕組みについてご紹介したいと思います。 最近データチームでは、 Google の Gemini を活用した開発を進めているのですが、時折レスポンスが不安定になるという課題に直面していました。 具体的には、以下のような 429 R
はじめに こんにちは、データシステム部MLOpsブロックの 木村 です。MLOpsブロックでは、継続的にGoogle Cloudのコスト削減に取り組んでいます。その一環として、夜間や休日といった利用されていない時間帯にも稼働し続けることで発生していた、開発・検証・テスト環境の余分なコストに着目しました。 この課題を解決するために、MLOpsブロックでは Kubernetes Event-driven Autoscaling (以下KEDA)を導入しました。KEDAは、Kubernetes環境でイベントドリ
みなさんこんにちは! ワンキャリアでエンジニアリングマネージャーをしている宇田川(X: @Ryoheiengineer )です。以下の記事を投稿した当時はSREとして活動していましたが、3ヶ月の育休を経て、現在はプロダクトチームのエンジニアリングマネージャーとして復帰しています。
入社してから経験してきたことについて こんにちは!2023年にニフティへ中途入社しました、好田(よしだ)と申します。 入社してから2年目に突入しております。現在はインフラグループとして主にカスタマーサポートで使用している環境の運用を行っています。 前職からもカスタマーサポートで利用している環境の運用を行っていたため、インフラ業務に配属させていただきました。まずは前職で行ってきたことについて書いていこうかと思います。 前職で行っていたこと 前職ではオペレーター業務・ニフティのシステムの監視・運用業務を行って
こんにちは、Timee でバックエンドエンジニアとして働いている id:ryopeko です。 今回は Timee で使っている API サーバーの Ruby を最新の 3.4.2 (+YJIT) にアップデートしたことについての記事をお届けします。 1. 概要 今回の記事では、Ruby 3.3.6 から 3.4.2 へのバージョンアップについて、パフォーマンスへの影響、Devin を使った実作業、 rubocop.yml の対応など、具体的な取り組みをご紹介します。安定性を重視した今回のアップデートの背
はじめに こんにちは。NALYSYS開発部の部長を務めている山下と申します。 本記事では、私たちが開発している NALYSYS (ナリシス)というプロダクトと、それを支える開発部の様子や魅力をお伝えします。 はじめに 対象読者 この記事を読むとわかること NALYSYSとは? 日本が抱える社会問題 NALYSYS(ナリシス)とは NALYSYSのプロダクトラインナップと今後の展望 NALYSYS開発チームに迫る 技術スタック 開発手法 チーム構成・開発体制 製販一体の開発 ワークスタイル・雰囲気 キャリア
はじめに こんにちは!ABEMAの広告配信システムの開発チームでバックエンドエンジニアとしてバイトを ...
kymmt です。 先日2月10日に、一休のフロントエンド技術にフォーカスしたイベント「一休 Frontend Meetup」を開催しました。 ikyu.connpass.com 一休 Frontend Meetupとしては2年半ぶりの開催となりました。 このイベントでは一休開発チームのメンバーが登壇し、各サービスのフロントエンドについて工夫や知見を紹介しました。この記事ではイベントの様子を紹介します! 当日のハッシュタグは #ikyu_dev でご覧になれます。 発表 『一休.com のログイン体験を支
はじめに こんにちは! タイミーでPlatform Engineerをしている @MoneyForest です。 今回は、弊社のDatadogにおけるAWSメトリクス収集を、従来のCloudWatch GetMetric APIからCloudWatch Metric Streams方式に移行することで高速化した取り組みについて紹介します。 背景 タイミーのワーカー様向けアプリケーションは、ピーク時に1分あたり十数万リクエストを処理するような規模で運用されています。そのため、システムの異常を素早く検知し、対