TECH PLAY

SRE」に関連する技術ブログ

911 件中 361 - 375 件目
はじめに はじめまして、さくらインターネット SRE室のアルビです。 先日、さくらのクラウドでRed Hat Enterprise Linux(RHEL)が使えるようになったという発表がありましたので、早速Terrafo […]
こんにちは、SRE部カート決済SREブロックの飯島です。普段はZOZOTOWNのカート決済機能のリプレイス・運用・保守に携わっています。またSplunkの管理者としても活動しています。 本記事ではSplunk CloudにおけるInfrastructure as Code(IaC)についてご紹介します。 背景 Splunkに対して感じていた課題 Splunk CloudのIaC化検討 Splunk Appを使ったIaC App API IaC対象のSplunkリソース 既存のリソースのエクスポート IaC
こんにちは、技術本部 SRE部 基幹プラットフォームSREチームの斉藤です。普段はZOZOの持っている倉庫システムやブランド様が触る管理ページなどのサービスのオンプレミスとクラウドの構築・運用に携わっています。またDBREとしてZOZOTOWNのデータベース全般の運用・保守も兼務しております。 7月11日、12日に行われた「 db tech showcase 2024 」に、DBREから5名のエンジニアが参加しました。この記事では会場の様子と印象に残ったセッションについてご紹介します! db tech s
SREチームのあおしょん(本名:青木)です。 突然ですが皆様は従量課金性の クラウド リソースの寝かしつけ、してますでしょうか? もちろん上記の寝かしつけというのは比喩なので歯磨きをして、布団に誘導して、絵本を読んで、灯りを消してから始まり自身が寝落ちしないように耐え忍びながら行う…という様な子供に対することではなく利用していない時間帯のリソース停止のことです。 その日のコンディションや過ごし方にもよりますが、子供が寝ること自体は目を閉じて大人しくしてくれさえすれば(してくれさえすれば)割とすぐにぐっすり
はじめに こんにちは。WEARバックエンド部SREブロックの 春日 です。普段は WEAR というサービスのSREとして開発・運用に携わっています。本記事では、約60%のコスト削減に成功した NATゲートウェイ の通信内容の調査方法と通信量の削減方法についてご紹介します。 目次 はじめに 目次 背景 コストの把握 NATゲートウェイの通信内容の把握 CloudWatchメトリクスでの確認 VPCフローログでの確認 リゾルバーでのクエリログでの確認 調査結果をもとにNATゲートウェイ経由での通信量を削減する
株式会社Luup SREチームに所属しています、ぐりもお(@gr1m0h)です。 この記事は、2024/08/03 - 04 に開催されるSRE NEXT 2024 での登壇内容の紹介です。 私は「Enabling Client-side SLO」という題で、8/4 14:10 からTrack B で発表します。興味があればぜひ参加ください。 https://sre-next.dev/2024/schedule/ 内容 SRE NEXT 2024のオフィシャルサイトに書いてある通りです。 Luupでは、電
SRE課の飯野です。 去る2024/7/9(火)、『 Platform Engineering Kaigi 2024 』(以下PEK)が開催されました。 弊社からは7名(SRE課6名+インフラ部長)が現地参加し、登壇企業の皆さまの熱量あふれるセッションを肌で体感してきました。 本ブログでは、PEK参加後にSRE課メンバーで実施した社内でのふりかえりの内容をお届けします。 目次 PEKとは? 当日の様子 ふりかえりやってみよう 総括 PEKとは? 『Platform Engineering Kaigi 20
この記事は、2024年6月24日(月)に行われた社内IaC勉強会における発表を、さくナレ編集部にて記事化したものです。 はじめに さくらインターネット SRE室の久保です。 今日は「terraform (plan|app […]
システムやサービスを提供する上で、障害はつきものです。障害を迅速に分析し対処することがユーザビリティやサービス信頼性を向上し、結果顧客満足度につながります。一方で近年システムは複雑さを増しており、障害特定が従来に比べて難しくなっています。したがって障害分析の効率化や高度化が重要になっています。 従来の手動による障害分析では、膨大なログデータの中から問題の根本原因を特定するのに多大な時間と労力を要し、ダウンタイムの長期化やサービス品質の低下につながる可能性がありました。そこで注目されているのが、人工知能 (
OGP 2024/07/09 に Platform Engineering Kaigi 2024(PEK2024) が docomo R&D OPENLAB ODAIBA で開催されました。 www.cnia.io タイミーは Platinum スポンサーとして協賛させていただき、プラットフォームエンジニアリンググループ グループマネージャーの恩田が 「タイミーを支えるプラットフォームエンジニアリング・成果指標設計から考える組織作り事例の紹介」 を発表しました。 タイミーには世界中で開催されるすべ
参加登録はこちらから (connpass)7月 30 AWS GameDay入賞者が語るAWS Summit JapanとGameDayでの学びとは? イベント概要 NIFTY Tech Talkは、ニフティ株式会社の社員が主催するトークイベントです。 本イベントでは、ニフティグループの社員が業務を通じて学んだことを発信しています! テーマ 2024年6月20日、21日にAWS社の大規模イベント AWS Summit Japan 2024 が開催されました。AWS Summit Japan(以前はToky
こんにちは!夏ですね。 @kimukei です。 今回は、弊プロジェクトの カイポケリニューアル で ADR を導入しましたというお話です。 ADRとは、「Architecture Decision Record」または、「Architectural Decision Records」の略でアーキテクチャ上で重要な決定を記録するドキュメントです。 詳しくは「 DOCUMENTING ARCHITECTURE DECISIONS 」 や「 Architectural Decision Records 」をご
こんにちは、プロダクト推進本部人事のふかしろ( @fkc_hr )です。今年のSRE NEXTでGOLDスポンサーをし、当日はブースも出す予定です。 sre-next.dev エス・エム・エスには複数のSREチームがあり、様々な方とお話をできればと楽しみにしています。 今回は事前に一部メンバーから気になるセッションの紹介とブースでプレゼントできる缶バッジのご案内をいたします。 気になるセッション共有 大きな組織にSLOを導入し運用するということ、その難しさ カイポケSREチームの 加我 です。 サービスの
こんにちは。ソーシャル経済メディア「NewsPicks」のSREチームの飯野です。 SREでは2023年から円安に負けないコスト削減を継続して行なっていますが、最近は圧倒的な円安におされ気味です。 2024年1月-6月の間に141→161円の変動はちょっと厳しすぎますよね。 今回は2024年1月から3月にかけて行なったNewsPicksの共通バックエンドAPIサーバーのARM対応プロジェクトについて話したいと思います。 ARM対応はコスト削減を目的とした施策です。適用範囲の見誤りがあり、当初の想定ほど大き
はじめまして!myTOKYOGASフロントエンドエンジニアの宗像と申します。 2024年の4月1日にジョインしてからブログに登場するのは初になります! 入社から約3ヶ月が経ちました。私は以前は ベンチャー企業 にて少人数のチームの中で開発を行なってきたのですが、弊社に入社してからプロダクト規模の大きさと取り巻く人の数、そしてプロダクトの与える インパク トの大きさに感動しながら(たまに圧倒されながら)日々プロダクトをより良くできるように開発を行なっております! 技術スタックもこれまでに経験してこなかったモ