「GPU」に関連する技術ブログ
企業やコミュニティが発信する「GPU」に関連する技術ブログの一覧です。
全173件中 1 - 15件目
【開催報告】Neuron Community – Day One
2025/04/14
ブックマーク
Neuron Community – Day One 会場の様子 こんにちは、ソリューションアーキテクトの宇佐美です。2025年4月9日に開催された「Neuron Community – Day One」の様子をレポートします。このイベントは、2025年3月に立ち上げられた「Neuron Community」の協力のもと開催しました。記念すべきイベントの第1回目ということで、Day Oneと名付けられています。 Neuron Community とは AWS では、機械学習の
Next'25 速報 - GKE Multi-cluster Orchestrator 登場!フリート全体で効率的なワークロード配置を実現
2025/04/12
ブックマーク
はじめに 現在ラスベガスで開催されている Google Cloud の旗艦イベント「Google Cloud Next'25(以下、Next'25)」に現地参加中の kazz / 岸本 / Shanks / 小堀内です。 Google Cloud Next'25 で発表された 最新情報 を現地からお届けしています。 本記事では、Next'25 のセッション「Build an inferencing platform on GKE with Argo CD and fleets」で発表された、Multi-cluster Orchestrator の特徴や機能について紹介し
OpenSearch Magazine Vol. 1
2025/04/11
ブックマーク
みなさん、こんにちは。ソリューションアーキテクトの榎本です。OpenSearch Magazine の第 1 号をお届けいたします。本号では OpenSearch Service の最近のアップデート情報と、OpenSearch 最適化インスタンスタイプのご紹介、OpenSearch Project で現在開発が進められている OSS 版 OpenSearch 3.x 系のロードマップアイテムについてお話いたします。 OpenSearch Magazine は、 Amazon OpenSearch Service お
寄稿:JSR は産学連携研究拠点の HPC 環境に AWS ParallelCluster と AWS DataSync を導入することでデータセンターの CPU を 33% 、ストレージを 85% 削減しライフサイエンス研究効率を向上しました
2025/04/11
ブックマーク
はじめに JSR 株式会社 (以下、 JSR ) はライフサイエンス事業の研究開発における HPC 環境利用において、 AWS を活用することでオンプレミスデータセンターの CPU とストレージを削減し利用効率を高めるとともに、研究者のインフラ管理負荷を下げ研究効率を向上しました。このブログでは JSR株式会社 JSR・慶應義塾大学 医学化学イノベーションセンター (JKiC) 青戸 良賢
Next'25 速報 - What's new in Cloud Run
2025/04/11
ブックマーク
はじめに 現在ラスベガスで開催されている Google Cloud の旗艦イベント「Google Cloud Next'25(以下、Next'25)」に現地参加中の kazz / Shanks / 小堀内 / 岸本 です。 Next'25 で発表された 最新情報 を現地からお届けしています! この記事では、Next'25 のセッション「What's new in Cloud Run」で発表、解説された内容を速報としてお届けいたします。 ! この記事は米国時間の朝にホテルから
Next'25 速報 - GKE 10 周年!アップデート情報まとめ
2025/04/11
ブックマーク
はじめに 現在ラスベガスで開催されている Google Cloud の旗艦イベント「Google Cloud NEXT'25(以下、Next'25)」に現地参加中の kazz / 小堀内 / Shanks / 岸本 です。 Google Cloud NEXT'25 で発表された 最新情報 を現地からお届けしています。 GKE 10周年! 今年、Google Kubernetes Engine は誕生から 10 周年を迎えました! Next'25 のセッション「GKE turns 10 and looks to the future of Kubernetes」では、Google
Amazon EC2 と SageMaker AI による AI モデル構築のコスト最適化
2025/04/08
ブックマーク
AWS の生成 AI ワークロードのコスト最適化に関するシリーズの第 2 回目のブログへようこそ。 最初のブログ では、生成 AI を適用するためのさまざまな実装アプローチとクラウド財務管理の原則に関する概要を説明しました。今回は、Amazon Elastic Compute Cloud ( Amazon EC2 ) と Amazon SageMaker AI を使用し、カスタム AI モデルの構築とデプロイに関するコスト最適化戦略について詳し
Amazon EKS Hybrid Nodes を活用し、様々な環境にわたって生成 AI 推論を実行する
2025/04/03
ブックマーク
この記事は Run GenAI inference across environments with Amazon EKS Hybrid Nodes (記事公開日: 2024 年 3 月 19 日) を翻訳したものです。 この記事は、Principal Container Specialist SA である Robert Northard、EKS の Senior Product Manager である Eric Chapman、Senior Specialist Partner SA である Elamaran Shanmugam が執筆しました。 イントロダクション Amazon Elastic Kubernetes Service ( Amazon EKS ) Hybrid Nodes は、クラウドとオンプレ
AWS による生成 AI のコスト最適化
2025/04/01
ブックマーク
あなたや組織が生成 AI 技術を検討をしている最中であれば、これらの先進的なアプリケーションにどの程度の投資が必要か把握しておくことが重要です。運用効率の向上、生産性の向上、顧客満足度の向上など、生成 AI への投資によって期待される利益を目指す一方で、コスト最適化と効率向上を実現するための手段についても十分理解しておく必要があります。この刺
ディープラーニングモデル学習時のGPUメモリ節約方法
2025/04/01
ブックマーク
ディープラーニングモデルの学習時にGPUメモリ不足を解決するための手法「Gradient Checkpointing」について説明しています。この手法はメモリ消費量を抑えつつ、学習時間の増加を伴うが、バッチサイズを増やすことで高速化も可能です。
LINEヤフーのAIプラットフォームにおけるバッチスケジューリング戦略
2025/03/24
ブックマーク
こんにちは。LINEヤフーでAIプラットフォーム向けのKubernetesクラスタの設計や構築、運用を担当している大村です。 LINEヤフーでは、100を超えるサービス向けにAI/機械学習を活用したサ...
CUDA 12.8 における Checkpoint API の概要
2025/03/12
ブックマーク
こんにちは、イノベーションセンターの鈴ヶ嶺です。普段は AI/ML システムに関する業務に従事しています。 本記事では、CUDA 12.8 から追加された Checkpoint API の概要について解説します。 まず、Checkpoint のユースケースやこれまでの NVIDIA CUDA における Checkpoint の試みなどの背景を説明し、新たに追加された CUDA Checkpointing について解説します。 さらに実際に実装し、torchvisi
週刊AWS – 2025/3/3週
2025/03/10
ブックマーク
みなさん、こんにちは。ソリューションアーキテクトの戸塚です。今週も 週刊AWS をお届けします。 私は最近、データ分析系の課題を持たれるお客様のご支援に入ることが多いです。その中でも AWS とパートナー様が共同でワークショップを通して課題を解決していくことで、課題が非常にクリアになり、ダッシュボードの構築がうまくいっているのを感じます。この デ
高火力 VM版(仮)発表!Supercomputing Japan 2025レポート
2025/03/04
ブックマーク
こんにちは、さくらインターネットの大喜多です。本記事では2025/2/3-2025/2/4に行われたSupercomputing Japan 2025の中で、企業講演として事業開発部 開発マネージャーの小田島が発表した『 […]
Unity 6シェーダーWarmupガイド / CA.unity #9
2025/02/27
ブックマーク
CA.unityはサイバーエージェントが運営するUnityをテーマにした勉強会です。サイバーエージェ ...