TECH PLAY

SRE」に関連する技術ブログ

848 件中 631 - 645 件目
はじめに こんにちは、データシステム部データ基盤ブロックSREの纐纈です。 本記事では、過去に遡ってBigQueryのデータを参照する方法(以下、タイムトラベルと呼びます)をご紹介します。また、この機能はBigQueryが提供している、変更または削除されたデータにアクセスする タイムトラベル とは異なることをご了承ください。 開発背景 この機能は過去データを日次スナップショットより細かい粒度で見たい、また障害対応時に障害発生前などピンポイントで時間指定して参照したいという要望を受け、開発することになりまし
ニューズピックス SREユニットリーダーの武藤です。私はここ数年は開発環境を近代化するために働いているのですが、最近では新しいメンバーから技術スタックについて「モダンですね」と言っていただけることが増えてきました。技術スタックの更新は最近ニューズピックスが会社として力を入れているところなので色々な分野でたくさんのエンジニアが関わっているのですが、SREに直接関係する範囲では特にChatOpsによるリリース作業について良い反応が多いので、ここで紹介します。 かつてどんな問題があったか 何をしたか 誰でも安全
こんにちは。 電通国際情報サービス (ISID) グループ経営ソリューション事業部の高崎です。 私が担当しているプロダクトの開発・運用中に発生した各種インシデントについて、解決後に再発防止を目的とした振り返りを実施しています。振り返りの方法として、ポストモーテムを導入してみました。 導入して3ヵ月が経過し、導入してよかったと思うことや今後の課題などが見えてきたので、紹介したいと思います。 後述するポストモーテムの内容は下記の書籍を参考にしています。 SRE サイトリライアビリティエンジニアリング ―Goo
EKSのCoreDNSを安定させるための取り組み こんにちは。StanbyのProductPlatformグループでSREをやっている小林です。 今回はEKS環境のCoreDNSを安定稼働させるために取り組んだことを紹介します。 何が起きたのか まず前提として、当社サービスの多くはECS/Fargateで運用しており、現在EKS/FargateへFrontから段階的に移行しています。 移行についての経緯や方法については、 CloudNative Days Tokyo2021 での 登壇資料 をご覧ください
はじめに こんにちは。ブランドソリューション開発本部 WEAR部 SREの笹沢( @sasamuku )です。 FAANS はショップスタッフの効率的な販売をサポートするスタッフ専用ツールです。FAANSの一部機能は既にリリースされており全国の店舗で利用いただいております。正式リリースに向け、 WEAR と連携したコーディネート投稿機能やその成果をチェックできる機能などを開発中です。 FAANSのコンテナ基盤にはCloud Runを採用しており、昨年に SREとしての取り組み をテックブログでご紹介しまし
はじめまして。株式会社エス・エム・エスに、2022年1月1日からEM(Engineering Manager) として入社した @emfurupon777 です。 少し前からEMという呼称がプロダクト開発、エンジニアリングの話題の中で普通に使われるようになり、SNSやブログ上でもEM自身から、その成果の見えにくさや結果が出るまでの時間軸の長さなどに起因する難しさを意識した発信が多くされるようになってきたように感じています。 今回、私の入社エントリとして、エンジニアリングのトップが存在する組織にEMとしてJ
はじめに こんにちは。 takumma といいます。株式会社スタメンで一ヶ月半ほどインターンをさせていただいたので、そこで体験したことを文章として残そうと思います。 本当はインターンでお世話になった社内の方達に向けて社内ドキュメントに投げようと思っていたのですが、その旨を CTO の松谷さんに話したら、是非社外向けにも公開してほしいとのことだったので、スタメンに興味を持った人のことも意識して書こうと思います。 僕は短い間しか居なかったので、スタメンはこういう会社だ!というよりは、僕の体験ベースで素直に感じ
誰にだって作戦がある。最初にパンチを食らうまでは。 ヘビー級ボクサーとして名を馳せた、マイク・タイソン氏の言葉です。 障害における計画やマニュアルがあっても実際にできるか、衝撃を受けてもうまく動けるかどうかは試してみないとわかりません。さすがにパンチは辛いので、水かけぐらいで定期的に検証してみるのがカケハシにおける障害訓練です。 何を目的にするか 主目的としては障害対応フローの検証と学習と改善です。障害対応は数が少ないこともあり、記憶は急速に忘却され、6ヶ月もすれば対応方法を忘れてしまいます。定期的に訓練
はじめに こんにちは、技術本部SRE部ZOZOSREチームの堀口/柳田です。普段はZOZOTOWNのオンプレミスとクラウドの構築・運用に携わっています。 ZOZOTOWNではSQL Serverを中心とした各種DBMSが稼働しています。 その中で検索処理における参照に特化された役割を持つデータベース群をReadOnlyデータベース(以下、RODB)と呼んでいます。これらは日々増加するZOZOTOWNのトラフィックに耐えられるよう定期的にオンプレミスサーバを増台することでスケールしています。 これらのROD
2021年12月22日に「 TECH Street 」主催で開催された「”エンジニアのキャリア分岐点”その時どうする? マネジメントで見える世界とエンジニアとしての生存戦略」にて、ミイダスCTOの大谷が登壇しました。 本イベントでは、イベントのパネラーである株式会社LIGの久松さん、パーソルキャリア株式会社の岡本さん、吉次さんと一緒に弊社のCTO大谷が「キャリアの分岐点に立った時の話」や「中間管理職・マネジメント」をテーマにディスカッションしました。こちらの記事はその内容の一部を書き起こす形でご紹介してい
こんにちは、データエンジニアの多田です。 私は現在、データ利活用基盤「Knile(発音は “ナイル")」の開発をし
はじめまして。 SRE チームの細谷です。 弊社製品 intdash のサーバーサイドでは、 intdash Server と呼ばれるミドルウェアが動作しており、intdash の多様なデータパイプラインの構築を実現しています。 intdash Server の構成要素の 1 つに時系列データベースがあり、弊社では InfluxDB OSS を採用しております。 InfluxDB OSS は、v1( 1.X )と v2( 2.X )のバージョンがリリースされており、現在運用している intdash では
こんにちは。サーバーワークスでCloud AutomatorのSREチームで開発・運用を担当している尾崎です。 この記事は、SREチームが主体となって取り組んだCI/CD改善の後編になります。 前回はCDを別リポジトリに切り出すなどの工夫でCI/CDのメンテナンス性を改善した内容をお届けしました。 blog.serverworks.co.jp 今回の記事ではCI/CDのメンテナンス性を改善したことで達成できた、CircleCIを利用したカナリアデプロイについて紹介します。 従来の課題 CircleCIの手
こんにちは、SRE2課の松井(紀)です。 最近オライリー・ジャパンのSREを読んでいまして、重要なタスクに注力するためにトイルを撲滅せよ、という記述を読みました。 「トイルとは、手作業、繰り返される、自動化が可能、戦術的、長期的な価値がない、サービスの成長に比例して増加する、といった特徴を持つ作業です。」 トイルの洗い出し、測定、削減によって運用コストを削減でき、困難ながらも興味深いプロジェクトに専念する時間を確保できます。 https://cloud.google.com/blog/ja/product
こんにちは。サーバーワークスでCloud AutomatorのSREチームで開発・運用を担当している尾崎です。 2回に渡って、Cloud AutomatorのSREチームが中心となって取り組んだアプリケーションのCI/CD改善について紹介します。 まずはCircleCIの設定ファイルのメンテナンス向上について紹介をして、別の記事でCircleCIを利用したカナリアデプロイについて紹介します。 なお、記事中で「CI」は主にアプリケーションの自動テストやコンテナイメージのビルド、「CD」はアプリケーションコー