TECH PLAY

GPU」に関連する技術ブログ

328 件中 1 - 15 件目
みなさんこんにちは。ソリューションアーキテクトの山田です。2026 年 6 月 25 日(木)、26 日(金)の 2 日間に渡って開催される AWS Summit Japan 2026 では今年も製造業に関する展示を数多く行なわれています。製造業に関連する全体的な展示やセッションに関しては こちらのブログ に全体がまとめられておりますので参照ください。 本ブログではその中でも製品設計開発に関するデモ展示について紹介します。 コンセプト : 生成 AI 時代の製品設計開発 CAE 解析や CAD 操作、過去
2026 年 6 月 1 日、アマゾン ウェブ サービス ジャパン合同会社(以下、AWS ジャパン)は、「フィジカル AI 開発支援プログラム by AWS ジャパン」の第 1 回コミュニティイベント「Community Meetup #1」を、 AWS ジャパン 麻布台オフィス にて開催しました。本プログラムは 2026 年 1 月 27 日に発表し 、 3 月 3 日にキックオフイベント を開催しました。今回の Community Meetup は、約 6 ヶ月間の開発支援期間のなかで、採択企業同士の
はじめに こんにちは、クラウドエースの梶尾です。 Google Cloud のコンピューティングサービスを検討するとき、必ずと言っていいほど選択肢として並ぶのが Compute Engine と Cloud Run です。 よく「クラウドは柔軟だから、まずは手軽な方で始めて、あとで変えればいい」という言葉を耳にします。 しかし、実務で言えば、開発途中のプラットフォーム変更は設計・運用・CI/CD パイプラインのすべてにおいて、手戻りを発生させます。 最初の一歩を間違えると、その後の開発効率やコストに大きな
こんにちは、クラウドエース株式会社のエンジニアの永井です。 0. はじめに 提案やアーキテクチャレビューの現場で、「この GCP 構成、月額いくらかかる?」と聞かれることは多いはずです。 一方で GCP の課金はサービス数が膨大で、構成図に書いてある名前と実際の SKU が一致しないことも珍しくありません。 本記事では、GCP の構成図(画像)やチャット入力から、Cloud Billing Catalog API の実単価に基づいた月額見積もりを出す Web アプリ「みつ森」 を開発した話を紹介します。
本ブログは “ Capacity-aware inference: Automatic instance fallback for SageMaker AI endpoints ” を翻訳したものです。 組織が本番環境で生成 AI ワークロードをスケールさせていく中で、信頼性の高い GPU コンピュートを確保することは、最も根強い運用上の課題の 1 つになっています。大規模言語モデル (LLM) やマルチモーダルアーキテクチャは特定のインスタンスタイプを必要とし、そのキャパシティが利用できない場合、エンド
はじめまして。エンタープライズ第二本部 プラットフォームエンジニアリング部 2年目の菊池祥汰です。業務ではAIサポートセンターとして 生成AI / LLM 活用案件やdJグループ内の生成AI利活用推進などを行っており、プライベートでも積極的にAI課金をして試しているAIフリークです。 この記事は、社内に幾多ある勉強会のひとつである『25卒技術会』での発表内容をもとに執筆されています。 『25卒技術会』では隔週火曜日に会議室に集まり、ブックリーディングと自由テーマ発表の2軸で各々の学びを共有し合っています。
はじめに 2026年5月14-15日(木金)に名古屋の中日ホール&カンファレンスにてクラウドネイティブ会議が開催されました。本記事では同イベントで行われた発表の中から、さくらインターネット研究所の小田知央さん(@ […]
みなさん、こんにちは。ソリューションアーキテクトの戸塚です。今週も 週刊AWS をお届けします。 新緑がまぶしく、汗ばむ日も増えてきた五月下旬。爽やかな初夏の風とともに、嬉しいアップデートが届きました!「オンプレミスの VMware 環境をクラウドに移行したいけど、規模が大きくて…」とお悩みの方、朗報です。Amazon Elastic VMware Service(Amazon EVS)が、1 クラスターあたり最大 32 ホストまでサポートするようになり、大規模な VMware ワークロードもよりスムーズ
おなかが痛くてもコーヒーは飲む、近藤恭平です。 前回は生成 AI の基礎(FM・LLM・トークン・埋め込み・推論パラメータ)を整理しました。今回は、基盤モデルを実際のアプリケーションに活用するための設計・実装・評価に関する知識を整理します。試験ガイドのドメイン3に対応した内容です。 基盤モデルを使ったアプリ設計の考慮事項 FM の特性:大規模・ブラックボックス 深層学習の過程と学習の結果得られる基盤モデル(FM)には、以下の固有の特徴があります。 特性 内容 大規模なコンピューティング要件 FM のトレー
AIの利用拡大に伴いGPUの効率的な共有が求められる中、NVIDIAのMIG(Multi-Instance GPU)技術が注目されています。MIGは1枚のGPUをハードウェアレベルで複数の独立した「小さなGPU」に分割し、メモリ衝突や性能のばらつきといった課題を解決します。本記事では、MIGの基本概念、リソース分割の仕組み、そして推論APIサーバーや研究開発環境での具体的な活用例を交えながら、そのメリットと注意点を解説します。
― マルチモーダル embedding の可能性と限界 ― サイオステクノロジー株式会社 Saman Elasticsearch のベクトル検索といえば、これまではテキストや画像が中心でした。 しかし最近は、テキスト・画像・動画・音声を同じ埋め込み空間で扱える「マルチモーダル embedding」が現実的な選択肢になってきています。 本記事は、Elastic Inference Service (以下 EIS) で利用できる .jina-embeddings-v5-omni-small を使い、音声ファイ
こんにちは。Amazon Web Services Japan のソリューションアーキテクト、田中 里絵 です。 本ブログは、2026 年 4 月〜5 月にかけて全国 5 拠点・計 8 回で開催した「 AWS Local Executive Roadshow 」シリーズの第 2 回レポートです。シリーズの背景や全体像については、 前回の大阪・初回レポート をご覧ください。 前日(4 月 13 日)の AI を自社の業務に活かしたい企業の皆様向けセッションに続き、2026 年 4 月 14 日は同じ大阪支社
はじめに チューリングでは毎日、データ収集車両による走行データと走行実験による実験結果データが蓄積されていきます。私たちはこれらを可視化するツールに非常に力を入れて開発しており、充実した可視化ツールはAIモデルを開発するエンジニアにとってもデータ収集を担うドライバーにとっても多くの洞察と気付きを提供します。 本記事では、それらのデータ可視化実装の中から、走行動画と各種メトリクスを同期再生する「走行データビューア」を取り上げ、その実装事例と、Next.jsやMPEG-DASH、Databricks Lake
NTTドコモビジネスが開発する日本語特化型AIガードレール「chakoshi」が、経済産業省・NEDO主催の懸賞金活用型プログラム「GENIAC-PRIZE」安全性領域で本審査2位を受賞しました。本記事では、chakoshiの概要と、単一構成から多層防御アーキテクチャへ進化させた技術的なポイント、そしてGENIAC-PRIZEでの取り組みについてお伝えします。 はじめに chakoshiとは GENIAC-PRIZEとは chakoshiの変遷 - 単一構成から多層構成への改善 - 単一構成の限界 リスク
はじめに こんにちは!NTTデータ テクノロジーコンサルティング事業部の松苗です。 2026年4月22日〜24日の3日間、米国ネバダ州ラスベガスのマンダレイ・ベイで開催されている Google Cloud Next 2026 に現地参加しています。 本記事では、Cloud Runの製品チームや最前線のパートナーが登壇したセッション「What's new in Cloud Run」の内容をレポートします。AI エージェントの開発から大規模運用まで、Cloud Run がどのように進化したのか、現場の熱量と共