TECH PLAY

Vision AI実装プログラミング キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門

3,520円 (税込)

Amazon楽天

Vision AI実装プログラミング キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門

書籍情報

発売日:

著者/編集:チーム・カルポ

出版社:秀和システム新社

発行形態:単行本

書籍説明

内容紹介

画像認識の分野において、近年急速に発展しているTransformerベースの手法とその派生モデルに焦点を当て、キーポイント検出、物体セグメンテーション、画像キャプショニングの実装方法を詳細に解説したのが本書です。好評の既刊『Vision Transformer/最新CNNアーキテクチャ画像分類入門』、最新刊の『DETR最新・物体検出アーキテクチャ入門』に続く第3弾となります。 本書の特徴を以下となります。 ・セグメンテーション実装を本格的に解説する入門書。 PyTorch×timmライブラリでデータ準備→学 習→推論→可視化までをコード中心に一気に学べます。 ・4大タスクを網羅。キーポイント検出・姿勢制御・セグメンテーション・キャプショニングにおける共通パターンとタスクごとの差分を整理して理解できます。 姿勢制御、セグメンテーション、キャプショニングにおけるCOCOデータのフルセットを用いた学習は、実務エンジニア/研究者/学生などの読者層におすすめです。

著者情報

チーム・カルポ

類似書籍