「SRE」に関連する技術ブログ
企業やコミュニティが発信する「SRE」に関連する技術ブログの一覧です。
全609件中 406 - 420件目
InfluxDB v2 のインストールや v1 からの移行について
2022/03/04
ブックマーク
はじめまして。 SRE チームの細谷です。 弊社製品 intdash のサーバーサイドでは、 intdash Server と呼ばれるミドルウェアが動作しており、intdash の多様なデータパイプラインの構築を実現しています。 intdash Server の構成要素の 1 つに時系列データベースがあり、弊社では InfluxDB OSS を採用しております。 InfluxDB OSS は、v1( 1.X )と v2( 2.X )のバージョンがリリースされており
CircleCIを利用したカナリアデプロイの紹介
2022/02/28
ブックマーク
こんにちは。サーバーワークスでCloud AutomatorのSREチームで開発・運用を担当している尾崎です。 この記事は、SREチームが主体となって取り組んだCI/CD改善の後編になります。 前回はCDを別リポジトリに切り出すなどの工夫でCI/CDのメンテナンス性を改善した内容をお届けしました。 blog.serverworks.co.jp 今回の記事ではCI/CDのメンテナンス性を改善したことで達成できた、CircleC
AWS Systems Manager Run CommandでWindowsOSにユーザーを作成しよう
2022/02/28
ブックマーク
こんにちは、SRE2課の松井(紀)です。 最近オライリー・ジャパンのSREを読んでいまして、重要なタスクに注力するためにトイルを撲滅せよ、という記述を読みました。 「トイルとは、手作業、繰り返される、自動化が可能、戦術的、長期的な価値がない、サービスの成長に比例して増加する、といった特徴を持つ作業です。」 トイルの洗い出し、測定、削減によって運用
CI/CDをリポジトリ分割し、CircleCIの設定ファイルのメンテナンス性を向上させた話
2022/02/25
ブックマーク
こんにちは。サーバーワークスでCloud AutomatorのSREチームで開発・運用を担当している尾崎です。 2回に渡って、Cloud AutomatorのSREチームが中心となって取り組んだアプリケーションのCI/CD改善について紹介します。 まずはCircleCIの設定ファイルのメンテナンス向上について紹介をして、別の記事でCircleCIを利用したカナリアデプロイについて紹介します。 なお、記事中で「CI
WEARにおける画像配信のリプレイス戦略とAkamai Image & Video Managerの導入
2022/02/24
ブックマーク
こんにちは、WEAR部の繁谷です。SREとして WEAR の運用・保守・開発をしています。 WEARでは、 以前の記事 で説明した通り、画像配信のリプレイスを行ってきました。本記事ではSRE観点で画像配信のリプレイスや Akamai Image & Video Manager (以下、Image Manager)を利用した画像リサイズの導入の事例を説明します。 techblog.zozo.com WEARにおける画像配信の課題 前述の記事でも紹介
【ラクス】インフラ運用チームが障害対応時間削減に向けて取り組んだこと
2022/02/18
ブックマーク
はじめに こんにちは。cappy_potterです。 MailDealer と ChatDeaeler という弊社サービスのインフラ運用チームのリーダを担当しています。 現状、これら2サービスで稼働しているサーバの数は、合計で1,000台近くありますが、 これだけサーバがあると、様々な障害も発生します。 中でも、仮想基盤機器やネットワーク機器で障害が発生した場合は、影響範囲が大きくなりやすいで
AWS Transit Gatewayを構築して分かったこと・ベストプラクティスを紐解く
2022/02/08
ブックマーク
CI部SRE2課の松井(紀)です。 AWS Transit Gateway(以下TGW)を構築する際に行った検証や注意点、ベストプラクティスに記載されている内容の深堀りをします。 はじめに 結論 Transit Gateway VPC attachment は専用のサブネットで作る ネットワーク ACLはフルオープンにする 技術検証 許可するプレフィックスの制限に注意 TGW越しでセキュリティグループの参照は出来ない まとめ はじ
ZOZOTOWN カート投入の分散キューイングシステム 〜 プロダクションレディまでの歩み
2022/02/04
ブックマーク
はじめに こんにちは。家系らーめん好きが高じて鶏油を自分で取得するようになり、金色に輝く液体を見るだけで パブロフの犬 的に涎が止まらない、SRE部の横田です。普段はSREとしてZOZOTOWNのリプレイスや運用に携わっています。 先日、弊社の高橋が執筆したZOZOTOWNカート機能リプレイスに関する記事が公開されました。 techblog.zozo.com 本記事では、上記記事で紹介した
セーフィーにはどんな種類のエンジニアがいるの?職種別にエンジニアを紹介!
2022/01/27
ブックマーク
初めまして。セーフィーの柏木です。 AI/画像処理エンジニアで、テックブログ運営チームにも所属しています。 今回は、セーフィーにおけるメイン事業であるクラウド録画サービスと各職種のエンジニアの業務について紹介します。 クラウド録画サービスシステムの全体像と、それぞれのエンジニアが一体何をやっているのか、わかりやすくお伝えできればと思います
【Meetup】大規模SaaSを支えるインフラ組織の取り組み/自動化、障害対応マニュアル、CI/CD、SRE
2022/01/14
ブックマーク
技術広報の yayawowo です。 いつも ラク スのエンジニアブログをお読みいただき、ありがとうございます! 今回は、12月に開催した 【ラクスMeetup】大規模SaaSを支えるインフラ組織の取り組み/自動化、障害対応マニュアル、CI/CD、SRE の発表内容について紹介させていただきます! Meetupのテーマは、『インフラ』です! 以下10プロダクトを支え、最前線で活躍している3名の
Googleのクラウド導入フレームワークを翻訳して紹介
2022/01/11
ブックマーク
G-gen の杉村です。 Google は The Google Cloud Adoption Framework というフレームワーク (考え方や施策の枠組み) を公表しています。 このフレームワークでは、組織がクラウドを導入するときにどのように考え、施策に取り組むべきかについての指針を示しています。 技術的な視点にとどまらず、 組織づくりや経営層の関わり方も含めた、包括的なフレームワーク となっています。
激白!GROWI.cloudの 可用性向上の取り組み
2022/01/07
ブックマーク
この記事は、2021/12/23 に行った WESEEK Tech Conference #16 の内容をまとめたものです。 第16回目のテーマは「激白!GROWI.cloudの可用性向上の取り組み」 顧客に何らかのサービスを提供する上で、日常的なサービス可用性の維持・向上に関する業務は必須課題となります。 本発表では、可用性維持・向上に必要な項目を挙げつつ、弊社が実際に提供しているサービスである GROWI.clo
エンジニア不足を解消するアウトソーシングを有効活用した適材適所爆速開発
2021/12/23
ブックマーク
こんにちは。TRILL開発部でバックエンドエンジニアをしている安尾です。 この記事はdely Advent Calendar 2021 22日目の記事です。 昨日はクラシル開発部SREチームの松嶋さんの「 クラシルのSREをチーム化するときに意識した3つのことと半年間の実績 」という記事でした。SREに興味がある人、開発チームの立ち上げに興味がある人、是非参考にしてみてください! 今日は僕が所
AWS Backup へのバックアップシステムの移行
2021/12/21
ブックマーク
aptpod Advent Calendar 2021 の21日目を担当します、SREチームの金澤です。 私が所属する SRE チームでは、担当業務の一つに、弊社の製品である intdash のインフラストラクチャをメインとしたクラウドシステムのインフラ設計・構築、監視・バックアップなどの運用業務があります。 バックアップについては、約1年半前、Amazon Web Service(AWS) のマネージドサービスである AWS Backup へ
SREチームに転職してみて
2021/12/08
ブックマーク
この記事はBASE Advent Calendar 2021の8日目の記事です。 こんにちは Slackの好きなショートカットは Shift + Esc の横山です。 SRE Groupに加わって4ヶ月が経ちました。 こちらの記事が書かれてからも4ヶ月が経ちました。 devblog.thebase.in ↑を未読の方がいましたらぜひぜひ読んでください。 同じ4ヶ月という事で振り返ってみたいと思います。 ちなみにこの記事を読む前に入社を決め