「SRE」に関連する技術ブログ
企業やコミュニティが発信する「SRE」に関連する技術ブログの一覧です。
全579件中 436 - 450件目
ZOZOTOWNマイクロサービスの段階的移行を支えるカナリアリリースとサービス間通信における信頼性向上の取り組み
2021/04/02
ブックマーク
はじめに SRE部プラットフォームSREチームの川崎 @yokawasa です。 ZOZOTOWNではモノリシックなアーキテクチャーから、優先度と効果が高い機能から段階的にマイクロサービス化を進めています。本記事では、そのZOZOTOWNの段階的なマイクロサービス移行で実践しているカナリアリリースとサービス間通信の信頼性向上の取り組みについてご紹介します。 なお、ZOZOTOWNのリプレイ
はじめてのNew Relic - 社内オンボーディングを開催いただきました
2021/03/31
ブックマーク
はじめに CTOの川口 ( id:dmnlk ) です。 BASEは現在140万ショップを超え、サービスの安定性・信頼性を維持することは非常に重要になっています。 その中で去年、New Relicを本格的に導入しました。 https://newrelic.com/jp/press-release/20201217 しかしNew Relicを導入しただけで安定性が獲得できるわけではありません。得られるのは可観測性のための武器であり、その使い方を適切に学ば
AWXを用いたZOZOTOWNオンプレミス環境における自動化の取り組み
2021/03/25
ブックマーク
こんにちは、SRE部ZOZO-SREチームに2020年新卒入社した秋田です。普段はZOZOTOWNのオンプレミスとクラウドの運用・保守・構築に携わっています。 ZOZOTOWNのオンプレミスは17年の歴史があり、BIG-IP、FortiGate、vSphereなどの様々なベンダーの製品が稼働しています。さらに、ZOZOTOWNのサービスが大きくなるにつれてオンプレミスでの拡張も続けていました。 そのようなZOZOTOWNですが
GCP Shared VPCを利用した全社共通ネットワークの運用におけるDedicated Interconnect利用設定の最適化手法
2021/03/24
ブックマーク
はじめに こんにちは。気がつけば4月でZOZOTOWNに関わって9年目を迎えるSRE部の横田です。普段はSREとしてZOZOTOWNのリプレイスや運用に携わっています。 本記事ではGoogle Cloud PlatformでShared VPCを採用し全社共通ネットワークを構築した背景とその運用方法について説明します。 ZOZOTOWNとパブリッククラウド専用線 まずはZOZOTOWNとパブリッククラウドを接続する専用線について
SREの求人票をGitHubを使ってチームで見直してみた
2021/03/24
ブックマーク
こんにちは!! BASE株式会社 SREチーム エンジニアリングマネージャの富塚( @tomy103rider )です。 2021年3月現在、SREチームは私含め3名で、最近私は成長するサービスを一緒に支えていって頂けるSREの仲間を求めて採用などをメインに業務を行っています。 はじめに 突然ですが、皆さんのチームの求人票は誰が作っていますか?そしてそれを読んだことはありますか? 思い出
Amazon S3 の PrivateLink が他のサービスと異なるたった1つの点
2021/03/01
ブックマーク
SRE部 佐竹です。 本ブログでは S3 の PrivateLink (Interface 型 VPC Endpoint) が他のサービスの PrivateLink と異なるたった1つの点について SSM を比較対象として記載しました。たった1つしか異なる点はないのですが、これにより他のサービスと異なり使い勝手がかなり変わってきます。
Volterraのサービスでintdashを動かしてみた
2021/02/26
ブックマーク
はじめに SRE チームの川又です。 Volterra はグローバルで優れたEdge-as-a-Service プラットフォームサービスを提供する事で注目を集めています。 先日、 F5, Inc. に買収された 事でも話題になりました。 一方、弊社 intdash の一部を構成する intdash Server は基本的にクラウド上で動作させます。 ですが、お客様の要件によってはEdge 環境で動作させる事もあります。 SRE チームの検
旧世代インスタンスでも gp3 EBS ボリュームが利用可能になりました
2021/02/24
ブックマーク
SRE部 佐竹です。 本日は地味に嬉しい修正を確認できましたので共有します。 はじめに 2月23日に検証を実施 AWS に確認を実施 まとめ はじめに blog.serverworks.co.jp 上記ブログでご紹介した通り、EBS ボリュームを gp2 から gp3 に変更することでコストが最大20%削減できると記載しました。 しかし、登場直後に判明した仕様として、旧世代(Previous generation instances)のインスタン
「AWS GameDay」から学んだ障害対応訓練の大切さとAWS主催の意義
2021/02/12
ブックマーク
こんにちは。SRE部BtoBチームの岩切です。普段はBtoB事業における自社ECサイトの運用保守・監視をしています。 今回2020年11月27日にオンラインで開催された AWS GameDay に参加しました。 本記事では、GameDayイベントで得た学びから実際の業務へどのような効果があったかを共有します。 AWS GameDayについて 今回のAWS GameDayでは、開催前の別日に事前勉強会が2時間、GameDay本番が5
「挑戦させすぎ?」マネジメント勉強会で分かった組織課題とその解決策
2021/02/04
ブックマーク
こんにちは、ZOZOテクノロジーズSREチームリーダー兼組織開発チーム所属の指原( @sashihara_jp )です。 この記事では2019年12月から全11回開催してきた「マネジメント勉強会」を通じて分かってきたZOZOテクノロジーズの組織課題と、これから取り組もうとしているその解決方法を紹介します。 ZOZOテクノロジーズの社員構成 マネジメント勉強会とは 立ち上げまでの道のり 運営
Direct Connect Gateway で通信が折り返され VPC 間で疎通が可能となる仕様について
2021/02/03
ブックマーク
SRE部 佐竹です。 今回のブログでは Direct Connect Gateway と Transit Gateway を併用するシーンにおいて、「Transit Gateway の Route Table の Direct Connect Gateway へ向かうルートに VPC のネットワークアドレス範囲が内包されている」場合に折り返しが起きる件を AWS 環境構成図を添えてご説明させて頂きます。
Amazon Lookout for Vision の運用を考える
2021/01/28
ブックマーク
SRE部 佐竹です。 今回のブログではGA後に本番環境で使うことを想定し Amazon Lookout for Vision の運用を深く考えてみました。AWS環境構成図を利用して、わかりやすく説明します。
Hardening 2020 H3DXから学ぶ「インシデント対応訓練」の重要性
2021/01/15
ブックマーク
こんにちは。SRE部の横田・秋田です。普段はZOZOTOWNのリプレイスや運用に携わっています。 私たちは2020年11月13日から14日にかけてフル・オンラインで開催された Hardening 2020 H3DX に参加しました。本記事では、過去にオフライン開催のHardening Projectに参加経験のある秋田と、今回が初のHardening Project参加となった横田の体験を振り返り、「サービスを守る訓練」の重要性を再
BigQueryの監査ログをリアルタイムに監視して使いすぎを防止してみる
2021/01/12
ブックマーク
こんにちは。SRE部の塩崎です。七味唐辛子の粉末を7種類に分類するという趣味を発展させて、おっとっとを新口動物と旧口動物に分類するという趣味を最近発明しました。 BigQueryは非常にパワフルなData WareHouse(DWH) SaaSであり、大容量のデータを一瞬で分析できます。しかし、課金額がスキャンしたデータ量に比例するという特徴があるため、意図せずに大量のデータをス
アドベントカレンダー 記事100本公開 - 年末恒例アウトプット強化月間
2020/12/29
ブックマーク
こんにちは、ZOZOテクノロジーズ CTO室の池田( @ikenyal )です。 エンジニアが12月に思い浮かべるキーワードは何でしょう。「アドベントカレンダー」ですね。 弊社も毎年アドベントカレンダーに参加しており、今年も記事100本の公開を完走しましたので、概要をお伝えします。 ZOZOテクノロジーズ Advent Calendar 2020 今年は合計4個のカレンダーを実施したため、12/1-25の期間