プロトタイピング

イベント

注目のイベント

マガジン

技術ブログ

QCon SF 2024参加レポート

はじめに こんにちは、『ゼクシィ』・『カーセンサー』・『じゃらん』に従事するデータエンジニア・機械学習エンジニア組織のマネ

Google Cloud で機械学習モデルを使うときの方針

はじめに こんにちは、クラウドエース株式会社の技術本部に所属している池上有希乃です。 Google Cloud では様々な機械学習プロダクトが利用可能ですが、選択肢が多いので「どういった方針で、どのプロダクトを利用すればいいか」と迷ってしまうときがあります。そこで、この記事では Google Cloud で機械学習モデルを使う際のガイドをしていこうと思います。 ! 本記事は

vLLMで独自実装モデルを高速推論させる

はじめに チューリング生成AIチームの荒居です。 この記事は生成AIアドベントカレンダー2024の4日目の記事です。 この記事では、動画生成モデルを題材に、vLLMを用いて独自のマルチモーダルモデルを推論させる方法について解説します。vLLMはLLMの高速推論・サービングのライブラリで、LlamaやQwenなどの有名なモデルについてはサポートされているため非常に簡単に利用す

動画

書籍