TECH PLAY

SRE」に関連する技術ブログ

967 件中 1 - 15 件目
みなさん、こんにちは。ソリューションアーキテクトの古屋です。今週も 週刊AWS をお届けします。 ゴールデンウィークも終わり、今週から本格始動という方も多いのではないでしょうか。みなさんはどんな連休を過ごされましたか。私は家の中でのんびり過ごしていました。 さて、5月26日(火) 14:00〜17:30 には、日本では 2 回目の開催となる「Amazon EKS でスケーリングする生成 AI 環境を構築するハンズオンワークショップ」をオンラインで開催します。NVIDIA GPU を活用した本番環境レベルの
はじめに Observabilityの文脈でAI活用への期待が高まっています。ログ・メトリクス・トレースが揃っていても、障害発生時に「どこから見ればよいか」「どの仮説を先に当たるべきか」で時間を使ってしまうことは、現場では珍しくありません。 今回、AIを活用したObservability高度化をテーマに、DatadogのAI機能(Bits AI SRE)を用いた障害解析検証を実施しました。本記事では、その検証結果をもとに、AIが実際にどこまで役立つのか、そして何が限界なのかを紹介します。 ! この記事は2
はじめに こんにちは。 電子薬歴 Musubi の基盤開発チームで SRE を担当している大山です。 今回は、Claude Code で増えていく git worktree を PR 情報つきの一覧・選択・起動・後片付け までまとめて扱える個人 OSS の CLI ccw を紹介します。claude --worktree と git worktree を薄くラップしているだけのツールです。 普段の開発では Claude Code をメインに使っているのですが、単一のリポジトリで複数の作業を並行して進める
こんにちは。SRE課のtaku_76です! 今回はKubernetesマニフェスト内の非推奨API / 削除済みAPIを継続的に検知する仕組みについて紹介します。 PlutoとGitHub Actionsを使い、定期実行から検出結果の更新まで自動で行うようにしました。 他チームにも使ってもらうことを想定していたため、Plutoを実行するだけでなく導入方法や検知結果の確認方法まで含めて運用に乗せる形にしています。 はじめに 仕組みを作成した目的 全体像 利用者の負担を減らすために工夫したこと Issueを作
はじめに こんにちは、2026年1月入社のI.Kobayashiです! 本記事では、2026年1月入社のみなさまに入社直後の感想をお伺いし、まとめてみました。 KINTOテクノロジーズ(以下、KTC)に興味のある方、そして、今回参加下さったメンバーへの振り返りとして有益なコンテンツになればいいなと思います! YY ![YYさんのプロフィール画像](/assets/blog/authors/i.kobayashi/2026-04-30-newcomer-202601/yy.webp =300x) 自己紹介
こんにちは、タイミーでSRE業務を担当している徳富(@yannKazu1)です。 先日、函館で開催されたRubyKaigi 2026に参加してきました。Ruby本体やパーサ、GC、JITといった「言語の中身」を深掘りするカンファレンスなので、普段アプリケーションコードよりインフラ寄りの仕事をしている自分が行って楽しめるのか、という気持ちも少しありました。ですが、結果としてとても楽しめたので、感想を書いておきます。 SREが行っても普通に楽しめた 普段の仕事はRailsアプリケーションを安定して動かしたり、
G-gen の山崎です。当記事は、Google Cloud Next '26 in Las Vegas の2日目に行われたライトニングトークセッション「 8 Tips to Agentic Security Operations in 18 Minutes 」のレポートです。 G-gen Tech Blog では、現地でイベントに参加したメンバーや、日本から情報をウォッチするメンバーが、Google Cloud Next '26 に関連する記事を発信します。 blog.g-gen.co.jp セッションの
Elastic Stackの可視化を担うKibana。 普段、ブラウザ上のGUIからダッシュボードを作成したり、ログを検索したりするのに使っている方が多いはずです。 しかし、Kibanaの真のポテンシャルは、その裏側に用意されたREST APIにあります。 今回は、Kibana APIを活用して、開発者やSREが運用を「手作業」から「コードによる管理」へとシフトさせるための主要なAPIとその活用シーンについて解説します。 目次 なぜKibana APIを使うのか? 押さえておきたい3つの主要APIカテゴリ
はじめに はじめまして!技術基盤グループ SRE/QAチーム所属の鈴木です。 現在はニフティが提供するさまざまなサービスの品質保証業務を担当しています。 今回は、なぜ私がニフティへの転職を決めたのか、そして実際に入社してみて感じた「リアルな空気感」についてお話ししたいと思います。 これまでのキャリア 前職では客先常駐(SES)のQAエンジニアとして、さまざまなプロジェクトのテスト業務に携わっていました。 テスト計画から実行まで一貫して経験する中で、「第三者の視点」から品質を担保するためのスキルを磨いてきま
みなさん、こんにちは。AWS ソリューションアーキテクトの三厨です。 今週のトップニュースは AWS Agent Registry と Claude Mythos の Amazon Bedrock 上での Gated Research Preview でしょう。AWS の CISO である Amy が、AWSのセキュリティアプローチがどのように Anthropic のようなパートナーとお客様のイノベーションを加速しているのかを解説しているブログも今週号で取り上げていますので、ぜひご一読ください。 また今週
はじめにこんにちは。SRE(Site Reliability Engineer)として働いているDahee Eoです。私たちのチームは、Media Platform SREをはじめ、グローバルトラフィ...
はじめに JANOG57 NOC Backboneチームでスクラムマスター的な動きをしていたhokkai7goです。 JANOGとはJApan Network Operators' Groupを意味し、インターネットに於 […]
PART1:ドキュメント指向データベースの活用と Amazon DocumentDB の選択 -検討編- AWA 株式会社は、1 億 8,000 万曲以上の楽曲を提供する音楽ストリーミングサービス「 AWA 」を運営しています。 独自のライブ配信機能「 AWA ラウンジ 」やフラワーチャット / フラワースタンプ(投げ銭)機能を備え、幅広いデバイスに対応しています。 2015 年のサービス開始当初から AWS 上でシステムを構築してきた同社は、2025 年にサービス基盤のデータベースを MongoDB o
はじめに 分散ワークロードを運用するチームは、根深い運用上の課題に直面しています。障害が発生した際、解決に必要な情報はログ、デプロイパイプライン、設定変更履歴、サードパーティの監視ツールなど、あちこちに散在しています。深夜2時にアラートで呼び出された Site Reliability Engineer (SRE) は、複数のソースからテレメトリを手動で突き合わせ、サービス間の依存関係をトレースし、仮説を立てなければなりません。この作業には通常、数時間を要します。システムの複雑さが増すにつれ、AI を活用し
本記事は 2026 年 4 月 2 日 に公開された「 Agentic AI for observability and troubleshooting with Amazon OpenSearch Service 」を翻訳したものです。 Amazon OpenSearch Service は、組織のオブザーバビリティワークフローを支えるサービスです。Site Reliability Engineering (SRE) チームや DevOps チームは、テレメトリデータを集約・分析する統合ビューとして活用