TECH PLAY

Transformers」に関連する技術ブログ

4 件中 1 - 4 件目
視覚言語モデル 【連載】自然言語処理の研究動向 第9回 2026.3.25 株式会社Laboro.AI リードMLリサーチャー 趙 心怡 概 要 視覚言語モデル(VLM)の登場は、画像情報をベースとした言語生成を可能にし、視覚理解のあり方を劇的な変化へと導きました。かつては画像とテキストを対応付ける研究が中心でしたが、現在のモデルはゼロショット学習や自由度の高いマルチモーダル生成を実現するまでに至っています。本稿では、VLMのこれまでの進化を3段階に整理した上で、次なる「第4の波」として期待される視覚知能
この記事は、合併前の旧ブログに掲載していた記事(初出:2021年5月17日)を、現在のブログへ移管したものです。現時点の情報に合わせ、表記やリンクの調整を行っています。こんにちは、自然言語処理システム...
はじめに Turing CTO室に所属している東京科学大学(Institute of Science Tokyo)の藤井です。 本記事では、OpenAIから2025年8月にリリースされたgpt-ossをNVIDIA NeMoフレームワークにて学習するための方法について解説します。 2025年11月4日時点では、NVIDIA公式からは、LoRA finetunigを行う方法についてのみ解説されており、Long Context継続事前学習(Continual Pre-Training)など本格的な学習を行うに
Amazon CloudWatch の強化された自動ダッシュボードを活用することで、 Amazon CloudWatch Logs の使用パターン、コスト、潜在的な問題をより詳しく把握し、効率的な運用管理を実現できます。この記事では、使用状況を理解することの重要性、ダッシュボードの確認方法、そこから得られる知見について説明します。さらに、CloudWatch の使用状況とコストを把握するための他の便利なツールもご紹介します。 図1. CloudWatch Logs の新しい強化された自動ダッシュボードの一