TECH PLAY

SRE」に関連する技術ブログ

959 件中 181 - 195 件目
生成AI時代における「ガバナンス×SRE」の新しい責務 SREチームの乙二です。 生成AIが業務に浸透する今、医療データを扱うカケハシの全社SREとして、可用性とレイテンシを守る従来の活動ではリスクを吸収しきれないと感じました。 そこで私たちが取り組んだのが、SREの強みを「セキュリティ/プライバシー/法令遵守」へまで拡張し、情報漏えい・規制違反のリスクを管理するSRE組織への変革です。 カケハシでは生成AIサービスを利用する場合は、SRE、DRE(Data Reliability Engineering
こんにちは。メルペイ Credit & Payment Service / Engineering Headの @fivestar です。 この記事は、 Merpay & Mercoin Tech Openness Month 2025 の20日目の記事です。 今回はメルペイで主にBFF向けに採用しているgRPC Federationという仕組みを使って、3rd party向けのAPIを実装する取り組みの事例紹介になります。 BFF(Backends For Frontends)開発に導入
こんにちは。メルペイSREの @foostan です。 この記事は、 Merpay & Mercoin Tech Openness Month 2025 の14日目の記事です。 皆さんはインシデント対応は好きですか。多くの方はこの答えにNoと答えるかもしれません。ただこの業界にいるとYesと答える方もいてなかなか楽しい気分になることがあります。ちなみに私はインシデントの非日常感に少し高揚するタイプではありますが、同僚がたくさんいる昼間に限ります。夜はできる限り携帯電話をスリープ状態にしたいものです
はじめに まずPFEや開発者との関わりを整理 背景:DevOpsと認知負荷の増大 そこでPFE 開発者との関わり方 我々PFEチームの現状・課題 PFE1Gの立ち位置と現状 懸念とは? 提供サービスの整理 AWS周りを分解 現状は問題ない? XaaSやEnablingへの移行が鍵ではあるが Embeddedでチームが劣化してしまうかも 今までのお話をまとめると AI Coding Agent x PFEの青写真 AI Coding Agent技術の現状と可能性 理想のかたち:AI Enablingの実現
はじめに SREの大橋です。Assuredでは、開発プロセスの効率化を目的としてPull Requestごとに利用できるPreview環境を導入しました。そのインフラ選定にあたり、既に利用しているGKEを拡張する案と、サーバーレスのCloud Runを採用する案が挙がり、最終的にCloud Runを選択しました。 そもそもPreview環境とは? Preview環境とは、Pull Requestごとに動的に生成される独立したアプリケーションの実行環境で、コード変更を即座に確認できるため開発スピードの向上に
小ネタです。そして掲題が全てを語っています。 以下、ECS on EC2 構成の ECS サービスにおいて ECS タスクを動作させるプラットフォームとなる EC2 インスタンス を ECS コンテナ インスタンス と呼称します。これは Launching an Amazon ECS Linux container instance へ微妙に倣っての呼び方になります。 3行で ECS on EC2 構成の ECS サービスで GuardDuty ECS Runtime Monitoring を有効化する場
こんにちは。Fintech SREの佐藤隆広(@T)です。 この記事は、 Merpay & Mercoin Tech Openness Month 2025 の11日目の記事です。 Google社が提唱し、 Site Reliability Engineering Book によって広く知られるようになったSREの信頼性マネジメントは、開発と運用の関係性を再定義し、SLI/SLOとエラーバジェットに始まり、Availability・Latency・エラーレート・トラフィック・リソース飽和度・耐久性
30年以上にわたり金融IT基盤に携わる中で得た経験と知識をもとに、「やらかしがちな」技術的課題について、IPA[1]の非機能要求グレード[2]に沿って解説します。 ※筆者は非機能要求グレード初版の執筆に関わった経験があり、行間を含めて解説します。 全体構成 「非機能要求グレードの歩き方」シリーズ全体の構成は、「非機能要求グレードの歩き方 Index」を参照ください。 本記事(vol.7)では、Vol.8と併せて「C.2 保守運用」に焦点を当てて解説します。 C.2 保守運用 中項目「C.2 保守運用」では
はじめに LuupのInfra/SREチームに所属している、ぐりもお(@gr1m0h)です。 この記事は、2022年に公開したLuup Infra/SREチームを紹介した記事をアップデート版です。現在の私たちのチームがどのようなフェーズにあり、どのようなミッションを掲げ、どの機能領域を担い、そして日々どのような動き方で業務に取り組んでいるのかを中心に紹介します。 https://zenn.dev/luup_developers/articles/sre-horiuchi-20220829 なお、本記事では
こんにちは。デマンド開発部の岩井と申します。 以前、2024年7月に新卒研修(bootcamp)の感想記事を投稿しました。 https://zenn.dev/geniee/articles/6952e13cf5c5d7 2025年の1月末、私がいたDOOH開発チームでMySQLのバージョンアップを行いました。DOOHとはDegital Out Of Homeの略で、屋外ビルボードやサイネージを利用した広告です。開発チームでは、スクリーン情報管理や広告登録、配信管理システムを提供しています。 背景 MySQ
こんにちは、椎葉です。2025年3月にVPoT(VP of Technology)に就任しました。しなやかな医療体験の実現に向けて、カケハシの技術全体を見ながら取り組んでいきます。今回は、どうしてVPoTという役割が生まれたのか、実際に何をやっているかについてお話しします。 先週、CTOの湯前とチーフアーキテクトの木村とのインタビュー記事が公開されましたので、こちらも合わせてご覧ください。 なぜVPoTという役割が生まれたのか カケハシにはCTOがいるのに、なぜVPoTという役割を新たに作ったのでしょうか
こんにちは、ファインディでソフトウェアエンジニアをしている nipe0324 です。 先日、AWSさんの Coding Agent at Loft #2 〜 AI コーディング活用事例 Night - 効果的な組織導入と実践〜 (第2回目) で登壇させていただき、登壇内容を記事として書き起こしました。 この記事では、Devinと協働して 「個人のアウトプットを1.5倍にした実践3ステップ」 をご紹介します。 Devinと協働して個人のアウトプットは1.5倍に増加 2025年5月末時点では、Copilot
はじめに AWS Organizations にて複数の AWS アカウントを管理する場合において、各アカウントへどのようにアクセスするかは色々と検討の余地があると思います。 弊社では長らくこれを以下のような手法で運用していました。 踏み台的用途の AWS アカウントを1つ用意し、そこに作業者が使う IAM ユーザ及びスイッチ用 IAM ロールを用意 各 AWS アカウントにもスイッチ先 IAM ロールを用意 踏み台 AWS アカウント上の IAM ユーザから、作業対象 AWS アカウント上の IAM ロ