3,520円 (税込)

Vision AI実装プログラミングキーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門

AI・自然言語処理

Python, プログラミング, 組み込み

書籍情報

発売日：2026年01月26日

著者／編集：チーム・カルポ

出版社：秀和システム新社

発行形態：単行本

書籍説明

内容紹介

画像認識の分野において、近年急速に発展しているTransformerベースの手法とその派生モデルに焦点を当て、キーポイント検出、物体セグメンテーション、画像キャプショニングの実装方法を詳細に解説したのが本書です。好評の既刊『Vision Transformer/最新CNNアーキテクチャ画像分類入門』、最新刊の『DETR最新・物体検出アーキテクチャ入門』に続く第3弾となります。本書の特徴を以下となります。・セグメンテーション実装を本格的に解説する入門書。 PyTorch×timmライブラリでデータ準備→学　習→推論→可視化までをコード中心に一気に学べます。・4大タスクを網羅。キーポイント検出・姿勢制御・セグメンテーション・キャプショニングにおける共通パターンとタスクごとの差分を整理して理解できます。姿勢制御、セグメンテーション、キャプショニングにおけるCOCOデータのフルセットを用いた学習は、実務エンジニア／研究者／学生などの読者層におすすめです。