「SRE」に関連する技術ブログ

企業やコミュニティが発信する「SRE」に関連する技術ブログの一覧です。

MLflow を Vertex AI Experiments に置き換えられるってホント?

この記事では、 NTT Communications Advent Calendar 2024 16 日目の記事です。本記事では MLflow という実験管理 OSS を Google Cloud の Vertex AI Experiments に置き換えを検討してみた話について記載しています。 はじめに 結論 話題の中心となる実験管理機能 浮き彫りになった課題 パフォーマンス面 セキュリティ面 Vertex AI Experiments によるアプローチ 検討の中でぶち当たった壁 前提知識の整

Aurora MySQL 2から3へのアップグレード - 安全性とコストを考慮した移行プロセス

ソーシャル経済メディア「NewsPicks」SREチームの美濃部です。 NewsPicksでは複数のサービスでAurora MySQLをメインのデータベースとして利用しています。これまでAurora MySQL 2(MySQL 5.7互換)を使用してきましたが、2024年2月から順次クラスタのアップグレードを開始し、2024年11月にすべてのクラスタをAurora MySQL 3(MySQL 8.0互換)へのアップグレードを完了しました。この記事では

メルカリのエンジニアリングカルチャーについて

こんにちは。メルペイVPoEの@jorakuです。 この記事は、 Merpay & Mercoin Advent Calendar 2024 の記事です。 メルペイに入社して半年が経ちました。この期間で改めて個人的に実感した「メルカリらしさ」についてお話ししたいと思います。メルカリといえば、Go Bold / All for One / Be a ProといったValueが知られていますが、メルカリグループの魅力はそれだけにとどまりません。多様

複雑なものを複雑なまま扱う

この記事は株式会社ココナラ Advent Calendar 2024 13日目の記事です。 こんにちは。 株式会社ココナラに所属しているKです。 今日は「複雑なものを複雑なまま扱う」というテーマで書いてみたいと思います。 はじめに 私たちは日々の業務の中で、複雑な問題に頻繁に直面します。 この複雑さを単純化しようと試みることは、時に問題解決を遠ざける可能性があります。 今回

AWS re:Invent 2024で感じた “Go Global!”

この記事は株式会社エス・エム・エス Advent Calendar 2024の12月13日の記事です。 qiita.com こんにちは、介護/障害福祉事業者向け経営支援サービス「カイポケ」のリニューアルプロジェクトでSREを担当している加我 ( @TAKA_0411 ) です。SREチームの中では主にモニタリングとオブザーバビリティに関する全般を担当しています。 この度、AWS re:Invent 2024に参加してまいりました。私

2024年カンファレンス協賛の振り返り

こんにちは。 エス・エム・エスでプロダクト組織の人事をしているふかしろ( @fkc_hr )です。 株式会社エス・エム・エス Advent Calendar 2024 vol.2 と 技術広報 Advent Calendar 2024 シリーズ3 の12月12日の記事です。自社のAdvent Calendarは埋まるかな〜ワクワク、とSlackのtimesチャンネルで呟いたら、人事も書くんだよ!と煽ってもらって(?)ここに至りました。 エス・エム・エスは例年さ

レバレジーズの機械学習エンジニアの1年を振り返る

この記事を読んで分かること レバレジーズの機械学習エンジニアの今年1年の活動について分かります! レバレジーズの生成AIを活用した取り組み状況について分かります! この記事を読んで分かること はじめに 今年やったこと 生成AIへのリソース全振り 最初にぶつかった壁:そもそも社内で生成AIを使える状態にする CAIL(社内AIチャットツール)の開発 CAILの社内認知 社

これができればGitHub Actions上級者だ!

この記事は株式会社ココナラ Advent Calendar 2024 9日目の記事です。 SREチームマネージャーのよしたくです。 ココナラに入ってからGitHub Actionsをレビューする機会が多くなってきました。そこで今回は「わかってるな」と思わせるGitHub Actionsの書き方をいくつか紹介していきます。 比較的簡単に「わかっている風」にできるものから記載します。 サードパーティのアクション

GitHub RunnerとBuildJet Runnerを切り替えながら使う

SREのクラシマです。 トラーナの全 リポジトリ で GitHub Actionsを使用しており、さらにコスト削減のためにBuildJetを導入しています。 が、 GitHub Actionsには無償枠があり、これは使い切ったほうがお得です。 ということで、無償枠を使い切ったら単価のやすいBuildJetに切り替え、無償枠が復活したら GitHub に戻す、ということをしたいわけです。 しばらくは手動でやっていた

組織横断的なSRE活動を始めようとしています

この記事は株式会社エス・エム・エス Advent Calendar 2024 vol.1の12月9日の記事です。 エス・エム・エスで全社SREというロールで活動している Security Hub芸人 1 の山口( @yamaguchi_tk )です。 おすすめのAWSサービスは営業です(いつもお世話になっています)。 はじめに SRE(Site Reliability Engineering)は、運用の効率化とシステムの信頼性向上を目指すアプローチです。 私たち全社S

New RelicでSpring Frameworkを使ったアプリケーションのキャッシュヒット率を可視化する

この記事は New Relic Advent Calendar 2024 と NewsPicks Advent Calendar 2024 の7日目の記事です。 ソーシャル経済メディア「NewsPicks」SREチームの飯野です。 NewsPicksではサービスの状態を可視化するために New Relic APM(Application Performance Monitoring)を導入しています。ことあるごとにNew Relicのダッシュボードを確認することでサービスの状態の把握や、安定性向上、パフォーマンス改善のヒ

E2E Testを用いたマイクロサービスアーキテクチャでのUser Journey SLOの継続的最新化

こんにちは。メルカリのSite Reliability Engineer (SRE)の @yakenji です。 この記事は、 Mercari Advent Calendar 2024 の2日目の記事です。 私たちメルカリのSREは、コアプロダクトであるフリマアプリ「メルカリ」の信頼性を維持・向上させるために、プロダクトのAvailability(可用性)とLatency(性能)を測定しています。また、それらに対してService Level Objective(SLO)を設定した上で、SLOを

DatadogのMultiple-OrganizationでOrg構成を整備しました

SREチームのあおしょん(本名:青木)です。 本記事は Datadog Advent Calendar 2024 の12/6(金)投稿になります。 qiita.com 今回のテーマは当グループにおけるDatadogのMultiple-OrganizationとOrg (Organization) 構成についてです。 docs.datadoghq.com 上記公式ドキュメントの概要です。 1 つの親組織アカウントから複 数の子 組織を管理することができます。これは通常、お互いのデータにアクセ
技術ブログを絞り込む

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか?

エラータイトル

エラー本文