「Zabbix」に関連する技術ブログ(15件)
企業やコミュニティが発信する「Zabbix」に関連する技術ブログの一覧です。
【ラクス】インフラ運用チームが障害対応時間削減に向けて取り組んだ、その後について
2022/11/21
ブックマーク
はじめに こんにちわ。cappy_potterです。 MailDealer と ChatDeaeler という弊社サービスのインフラ運用チームのリーダを担当しています。 前回、 こちらの記事 で、 『チームとして障害対応時間削減に向けて取り組んだこと』 について 紹介させていただきました。 tech-blog.rakus.co.jp その際、記事の中で、取り組み実施後に同様の障害が発生したことについて触れ、取り組み実施
Zabbixアクションでサービスの自動復旧を実現!
2022/11/07
ブックマーク
はじめに こんにちは C2ZTAk6 です。 日々管理しているシステムで、サービス停止が発生した際、原因究明を行う前に、サービスの自動復旧が出来る仕組みはないかと考えたことはないでしょうか。 今回は、 Zabbixという オープンソース ・ソフトウェア( OSS )のアクションという設定を活用し、サービス停止が発生した際に自動で対象のサービスを復旧出来る仕組み につ
【Ansible Zabbixモジュール】監視設定の自動化
2022/06/27
ブックマーク
はじめに はじめまして、インフラ担当のfasahikoです。 今回のブログでは、 「Ansibleを利用してZabbixサーバの設定を行う」 をテーマに書きたいと思います。 Zabbixで監視を行っている且つ、Ansibleで設定を管理したい方(かなりピンポイントですが)を対象に、 AnsibleのインストールからZabbixモジュールを利用した設定までをご紹介したいと思います。 日々の運用を楽にする
AnsibleによるZabbixサーバー構築
2022/06/23
ブックマーク
初めまして、インフラソリューション部の"のなか"です。 今回はAnsibleという自動化ツールによるZabbixサーバーの構築についての話になります。 Ansibleを使えると10分程度でZabbixサーバーを構築できるようになります。 それではAnsibleを使えるようになるためにAnsibleとは何かやどうやって使うのかについて説明していきます。 Ansibleとは 開発環境 注意点 前提条件 構築 1. Ansib
Elasticsearchへのデータ投入と可視化【Kibana 基礎】
2022/06/09
ブックマーク
皆様こんにちは。インフラエンジニアのryuhei55225です! 前回の記事 は【Kibana 入門】という形で「Elastic Stack」(Kibana+Logstash+Elasticsearch)を Linux サーバにインストールして、簡単なデータのグラフ化を紹介させて頂きました。 こちらの記事では、MWのインストール等のサーバ構築がメインとなってしまい、具体的なElasticsearchへのデータ投入やデータ検索・グラフ化に関しては
新入社員が新しいSkyWayのサービス監視機能を構築した話
2022/03/28
ブックマーク
はじめに はじめまして。イノベーションセンター所属の @sublimer です。 2021年4月に新卒として入社し、現在はWebRTCプラットフォーム 「SkyWay」 の開発・運用の業務に取り組んでいます。 また、個人開発としてWebアプリケーションを作ったり、TURNサーバー(RFC5766)をC#で実装したりしています。 他にも、自宅サーバを運用したり、ネットワーク機器を触ってみたりもしていま
【ラクス】インフラ運用チームが障害対応時間削減に向けて取り組んだこと
2022/02/18
ブックマーク
はじめに こんにちは。cappy_potterです。 MailDealer と ChatDeaeler という弊社サービスのインフラ運用チームのリーダを担当しています。 現状、これら2サービスで稼働しているサーバの数は、合計で1,000台近くありますが、 これだけサーバがあると、様々な障害も発生します。 中でも、仮想基盤機器やネットワーク機器で障害が発生した場合は、影響範囲が大きくなりやすいで
脱レガシーシステム⑪(AWS Auto Scaling によるインスタンス管理に切り替えた話)
2021/12/10
ブックマーク
こんにちは。クルーズ株式会社CTOの鈴木です。 前回の投稿「 WebインスタンスのOS/PHPバージョンを最新安定版にあげた話 」の最後で少し触れましたが、今回Webおよびバッチ インスタンス については各セール開催の都度、いちいち手動でEC2 インスタンス を作成しなければならず、急にサーバを増やす際に、EC2のイメージを元に インスタンス を作成し、 ソースコード 同期
【Zabbix超・入門】明日の監視生活が【楽】になるZabbix API
2021/11/12
ブックマーク
はじめに 初めましてこんにちは。 ngerukatakataです。 営業上がりの未経験エンジニアとしてそこそこの期間を働いております。 担当する環境も当時の物からかなり様変わりしてしまい、 同じような仕事の仕方はできないものだなぁと感じている今日この頃です。 さて、今回は大きく変わったものの中でこの業界にかかせない 『監視』 について、 お話しさせていただけれ
次世代の監視技術 - Telemetry技術のご紹介
2021/09/02
ブックマーク
こんにちは、イノベーションセンターの三島です。 本記事では、次世代の監視技術として期待されるTelemetry技術についてご紹介します。 この記事について 本記事では下記の3点を共有します。 従来の監視技術が抱える課題とTelemetryの可能性 Telemetryの技術概要と、各社の実装状況 NTT Comのネットワーク上で検証し得られた知見と、期待されるユースケース 従来の監視技術
ちょっとうれしいZabbixLLDテクニックメモ
2021/01/29
ブックマーク
こんにちわ、インフラエンジニアをしている rakus-tatsu-kashi です。 今回は代理投稿です。同じ部署のインフラエンジニアが見つけてくれたテクニックをまとめてくれてました! この場を借りて、改めてお礼させていただきます! ありがとうございます!!! また、インフラエンジニアをやっていると、泥臭くなりやすい設定作業もあります。それを、 それを当たり前だ
「入門 監視」社内輪読会から1年経過して 〜参加メンバーの意識の変化と今後〜
2020/10/07
ブックマーク
はじめまして。 BASE株式会社 SRE Groupに所属している富塚( @tomy103rider )です。 先日、弊社CTOが 「もうさばき切れない」アクセスが激増したECプラットフォームにおける負荷対策 https://devblog.thebase.in/entry/bsucon という記事を公開しました。 社内ではこのアクセス激増をきっかけに「サービスの監視をどうしていくか」「サービス/システムのアラートに対してのアクションはど
アクセス限界値を知るための負荷試験のやり方について
2020/07/31
ブックマーク
はじめに はじめまして。 ラク スのインフラエンジニアのcappy_potterと申します。 弊社で提供している クラウド サービスを担うサーバに( クラスタ )ついて、どの程度のアクセスまでであれば 問題なくサービス提供できるのか、という限界値を知るための 負荷試験 を過去に実施しました。 Webシステムを構成するサーバ群に対し、どのようにして負荷をかけ、限界値を
ZOZOTOWNの冬セール負荷対策で実施したDBサーバーのCPUボトルネック調査手法
2020/03/12
ブックマーク
こんにちは。開発部基幹SREチームの廣瀬です。 弊社のサービスではDBMSとしてMicrosoft社のSQL Serverを使用している箇所があります。本記事では、2020年1月1日からスタートしたZOZOTOWN冬セールにおける負荷対策の一環で実施した、SQL ServerのCPUチューニングについてご紹介します。内容としては主に「どうやってプロダクション環境においてCPUボトルネックなクエリを見つけ出
Zabbix APIで監視データを取得して異常値分析をやってみる
2017/04/24
ブックマーク
はじめに 私の所属している部署では、主に法人のお客様のシステム監視・運用を24H365Dの体制で実施しています。 運用部隊にとっては、日々の運用業務を高度かつシンプルにしていくことが永遠の課題です。常にチームの業務を振り返り、どこか効率化できることはないかと模索しています。 数ある業務の中で今回は「監視データの異常分析」に注目します。 ある程度大