「GPU」に関連する技術ブログ

企業やコミュニティが発信する「GPU」に関連する技術ブログの一覧です。

Vision-Language Modelを活用した「見た目が近い商品」レコメンド改善の取り組み

こんにちは、メルカリのAI/LLMチームで機械学習エンジニアをしている arr0w と sho です! 本テックブログでは、Vision-Language Modelの一つである SigLIP [1]を、メルカリの商品データ(Image-Text Pairs)でファインチューニングし、メルカリの商品画像Embeddingの性能を大幅に改善したプロジェクトについて紹介します。 今回作成したSigLIPの性能を評価するために、 商品詳細ページの

OpenShiftのGPU設定の方法について

はじめに こんにちはサイオステクノロジーの小野です。 前回 はOpenShiftにGPUを追加する方法について解説しました。今回はそのGPUをクラスタ内で利用する設定の方法を解説します。 また、GPUはいくつかの会社が作成していますが、多くのAI開発ライブラリが対応しているNVIDIA製のGPUの設定を行います。 OpenshiftでGPUを利用するためのオペレータ Node Feature Discovery (NFD) オペレ

OpenShift(AWS)へのノード追加

はじめに こんにちはサイオステクノロジーの小野です。 前回 はOpenShift AIの概要について簡単に説明しました。今回はOpenShiftのノードの追加方法について解説します。OpenShift AIを利用するためには、GPUノードを追加する必要があるのでしっかりと操作を覚えましょう。 OpenShift(AWS)について OpenShiftはAmazon Web Services、Google Cloud Platform、IBM Cloud、Microsoft Azure のクラウド、vSph

週刊AWS – 2024/10/14週

みなさん、こんにちは。ソリューションアーキテクトの根本です。 今週も 週刊AWS をお届けします。 一つイベントを宣伝させてください。 11月1日 10:00-12:00に コンテナ/サーバーレスによるモダン・プロジェクト実践 というイベントが開催されます。プロジェクトで実践されているユーザーの体験・声を直に感じる機会ですのでぜひご参加ください。 それでは、先週の主

Googleの作ったオープンモデルLLM「Gemma」をGoogle Colabで使ってみる

AIの世界では、ChatGPTをはじめとする生成系AIが広がり、テキスト生成モデルである大規模言語モデル(LLM)の仕事での利用も増えています。 今回紹介するオープンモデルLLMは、AI技術の発展において重要な役割を果たしています。ChatGPTのようなクローズドなLLMモデルは高性能ですが、LLMを活用したツール作成や検証などの研究目的での利用にはコスト面の課題があります

Cloud Run が GPU に対応! -Ollama サンプルアプリをデプロイしてみた-

はじめに こんにちは、クラウドエースの第二開発部に所属している村松です。 入社したての新人エンジニアですが、Google Cloud を使って日々開発に勤しんでいます。 さて、2024年の8月に、Cloud Run の NVIDIA L4 GPU のプレビュー版サポート が公開されました。 https://cloud.google.com/run/docs/configuring/services/gpu?hl=ja Cloud Run が GPU に対応することで、Google の Gemma や Meta の Llama などのオ

ファインチューニングとは 応用分野からプロセス、発展まで

ファインチューニングとは 応用分野からプロセス、発展まで 2024.10.1 構 成 株式会社Laboro.AI リードマーケター 熊谷勇一 概 要 既存のリソースを活用しつつAIモデルの効率と精度を向上させられる手法であるファインチューニングについて、その重要性や応用分野、実施のプロセスなどについて解説します。なお本コラムは、当社の代表取締役COO兼CTOの藤原弘将と、

Cloud Run で NVIDIA GPU 使うのめっちゃかんたん ...ん?

以前の記事 で、処理を実行している間だけ GPU を専有する (料金を支払う) ために、GKE Autopilot を使用する例を書きました。これにより、新しく job を実行するだけで自動で GPU が割り当てられ、処理が終われば開放される、スケーリングも柔軟… とよい点は多いものの、インフラの用意はじゃっかん手間であったり、cluster の維持費用 ($0.10/h = 月に一万円程度) がかかる

Amazon Q と Bedrock を使った SAP 生産性向上ユースケース

生成 AI の概要 生成人工知能 (生成 AI) は、会話、ストリー、画像、動画、音楽など新しいコンテンツやアイデアを生成できる AI の一種です。AI 技術は、画像認識、自然言語処理 (NLP)、翻訳などの従来とは異なるコンピューティングタスクで、人間の知能をまねようとしています。 生成 AI では、巨大なデータで事前に学習された大規模な機械学習 (ML) モデルがサポートさ

生成AI向け機械学習クラスタ構築のレシピ 北海道石狩編

こんにちは。さくらのナレッジ編集部の安永です。 2024年6月15日(土)、札幌コンベンションセンターにて「CloudNative Days Summer 2024 」が開催されました。このイベントで、株式会社Prefe […]

生成AI向けパブリッククラウドサービスをつくってみた話

こんにちは。さくらのナレッジ編集部です。7月に開催されたJANOG54 Meetingで「生成AI向けパブリッククラウドサービスをつくってみた話」について、さくらインターネット 高峯 誠さん、井上 喬視さん、平田 大祐さ […]

CUDAによる処理の高速化 実装編

この記事では、既存のCPUプログラムをGPUで高速化する方法を説明します。具体的には、行列の和を計算する部分をカーネル関数に変更し、メモリ確保やデータ転送、カーネル関数の実装と呼び出し、エラーチェック、チューニング方法について順を追って解説します。

CUDA による処理の高速化 基礎編

この記事では、業務でCUDAを用いた画像処理の高速化を行った際に学んだことを記載します。CUDAの基礎、GPUの高速化の理由、グリッド・ブロック・スレッドの構造、GPUメモリの種類、CUDAプログラムの構成と流れについて説明します。

【生成AIに触れてみよう】 高火力DOKことはじめ #2 ~SDXL(Stable Diffusion XL)による画像の生成~

はじめに こんにちは、にしだゆうきです。 前回の記事では、生成AIの開発が進んでいることから今後の生成AIアプリを稼働させるためにさくらから『高火力 DOK』というサービスをリリースしたこと、そしてそれを利用するための準 […]

【レポート】新卒が行く!AWSの世界 #AWS Summit Japan 2024

はじめに こんにちは!デジタルエンジニアリング部24卒新入社員(佐々木、髙波、佐藤、森澤、髙橋、西村、沈)です! 2024年6月20日、21日にAWS Summit Japanが幕張メッセで開催されました。 私たちは21日に現地に行き、様々なセッションに参加しました。 また、展示ブースや開発者向けライブステージもまわりました。 今回の記事では、AWS Summitを紹介するとともに、セッシ
技術ブログを絞り込む

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか?