「SRE」に関連する技術ブログ

企業やコミュニティが発信する「SRE」に関連する技術ブログの一覧です。

Datadogの活用ノウハウを一挙に公開・それを支える全社管理者の工夫とは #datadog_japan_meetup

こんにちは。ECプラットフォーム基盤SREブロックの高塚と巣立( @tmrekk_ )です。 ZOZOTOWN はクラウド化・マイクロサービス化を進める中で、監視SaaSの Datadog を採用しました。この数年で多くの知見が蓄積され、今では様々なシーンでDatadogを活用しています。この記事ではそのノウハウを惜しみなく公開します。 ※本記事は、先日開催された Datadog Japan Meetup 2022 Summer にて発

NIFTY Tech Talk #2 SRE 登壇しました!

はじめに こんにちは!新卒入社3年目の塩田です。社内システムの開発・運用を担当しています。 先日「 NIFTY Tech Talk #2 SRE【ポストモーテム・品質向上】 」に登壇しましたので、 その様子を紹介していきます! イベント概要 NIFTY Tech Talk は、ニフティ株式会社の社員が主催するトークイベントです。 本イベントではニフティ社員が業務を通じて学んだことを発信していま

突撃!隣の開発環境!! MNTSQ エディタ・ターミナルエミュレータ編

こんにちは、MNTSQ( モンテスキュー )でSREをやっている中原です。 前回(?)、 突撃!隣のPCデスク!! MNTSQ キーボード・マウス編 というタイトルでブログを書かかせてもらいました。社内外から(特にエンターキーについて)大変反響をいただきうれしいなぁという気持ちでいっぱいです。 開発者がこだわるものというのは、そのこだわりの強さ故に争いを生むこと

Azureで実現できるDevOps環境を調べてみた【SREの登竜門】

はじめに 皆さん、こんにちは。tomo37kunです。 突然ですが、 Google が提唱している「class SRE implements DevOps」の考えを御存知でしょうか? 「class SRE implements DevOps」は「SREはDevOpsというinterfaceの実装である」という意味を表します。 つまり、「DevOps = 思想」という定義に対し、それを具体化し実装したものがSREであるという考えになります。 昨今、注目が集まるSREの考え方を

WEARにおけるKubernetes導入と改善の歩み

はじめに こんにちは。ブランドソリューション開発本部 WEAR部 SREの和田( @wadason )です。普段は 「ファッションコーディネートアプリ WEAR」 のSREとしてクラウドの運用やリプレイスをおこなっています。 WEARはサービス開始から10年が経ち、クラウドやオンプレミスを含む大小様々なシステムが稼働しています。アプリケーションを動かすための基盤にはAmazon ECSのよ

指定のファイル数がS3バケットに到達したらGlueジョブを実行させる方法

こんにちは!SRE2課 入倉です。 今回はEventBridgeを使ってS3バケットに指定した数のファイルがアップロードされたら、 Glueワークフローを起動させて、その中で指定したGlueジョブを実行する設定を試してみました。 構成 前提 設定 Glueワークフローの作成 S3バケットの作成 S3イベント通知有効化 EventBridgeルールの作成 Glueワークフローの設定 Glueトリガーの確認 動作確認 ま
AWS, SRE

コードレビューを通じたチームパフォーマンス向上のための取り組み

こんにちは。ECプラットフォームサービスSREチームリーダーの川崎( @yokawasa )です。本記事では、コードレビューを通じたチームのパフォーマンス向上のための取り組みについてご紹介します。なお、コードレビューそのもののテクニックに関する話はしないので、あらかじめご了承ください。 目次 目次 はじめに コードレビューはチーム全体のパフォーマンス向上のた

EKS環境へArgo CD Image Updaterを導入し、デプロイ時間と管理コストを削減した話

はじめに こんにちは、計測プラットフォーム開発本部SREブロックの渡辺です。普段はZOZOMATやZOZOGLASSなどの計測技術に関わるシステムの開発、運用に携わっています。 先日私達のチームでは、Argo CDと拡張ツールArgo CD Image Updaterを導入した開発環境のCDリアーキテクトを行いました。本記事では、開発環境のCI/CDリアーキテクト設計とArgo CD Image Updaterの導入手順について紹介

Google + Cognitoでユーザーグループ単位の認証認可

こんにちは、あるいはこんばんは(アーニャ声)。 突然ですが認証認可周りの設計・実装は毎回全然違った要件に沿って違った感じでやっていく感じになるのでおもしろいですよね。 この記事では、先日Musubi Insightチームが社内向けに作成したコンソールの設計・実装について認証認可周りに絞ってまとめたいと思います。 認証認可はCognito User Groupベースで実装したのです

AWS CloudShellで「/bin/sh^M: bad interpreter: No such file or directory」となった時の対処法

CI部SRE1課の古川(智)です。 Windows端末でシェルスクリプトを編集したら「/bin/sh^M: bad interpreter: No such file or directory」というエラーが出てきました。 今回はそんなときの対処法について書いていきます。 状況 解決方法 現在のファイルフォーマットを確認してみる ファイルフォーマットをunixに変更する おわりに 状況 Windows端末でAWS CloudShellを開き、そのままシェルスクリプ

Elasticsearchのバージョンアップと検索基盤の改善

はじめに こんにちは、検索基盤部 検索基盤ブロックの可児( @KanixT )とSRE部 ECプラットフォーム基盤SREブロックの大澤です。 本記事では、ZOZOTOWNの商品検索で利用しているElasticsearchをバージョンアップした知見と、その際に実施した検索基盤の改善についてご紹介します。 目次 はじめに 目次 背景 バージョンアップの流れ 主な作業 変更箇所の調査 新バージョンのMappin

SRE とは? 【まとめ】

初めに 初めまして、sakekobaです。 普段インフラのお仕事をさせて頂いておりますが、ここ数年の間に「SRE」という言葉を聞くようになったように感じます。 SREについて知りたいけど難しいな…。と思っていたので、SREについて、出来るだけ分かりやすくまとめる事にチャレンジしました。 「SRE」とは分かりやすく言うと何なのか? SREの取り組みは、具体的に何をすれば

ZOZOTOWNにおけるセッションストアのリプレイス完了までの道のり

こんにちは。技術本部SRE部ZOZO-SREブロックに所属している杉山です。SRE部のテックリードとして、オンプレ/クラウドのインフラを担当しています。 ZOZOTOWNでは、既存システムのリプレイスプロジェクトを進めています。各サービスのマイクロサービス化は進んでいますが、バックエンドでは「WindowsServer + IIS」で稼働しているシステムがまだ多く残っています。そのリプレ

Professional Cloud DevOps Engineer試験対策マニュアル

G-gen の杉村です。 Google Cloud (旧称 GCP) の認定資格の一つである Professional Cloud DevOps Engineer 試験の対策や出題傾向について解説します。合格の助けになれば幸いです。 Professional Cloud DevOps Engineer 基本的な情報 Professional Cloud DevOps Engineer とは Professional Cloud DevOps Engineer の難易度 試験対策方法 試験対策の流れ 「SRE 本」について 出題範囲・出題傾向 Site Reliability Engineering(SRE)

7年で売上40億のSREチーム結成〜運営

7年で売り上げ40億に成長したサービスのSRE結成から運営までということで発表させていただきます。ミイダスの磯崎です。 自己紹介とサービスについて
技術ブログを絞り込む

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか?