BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理 人工知能プログラミング実践入門

書籍情報

発売日 : 2021年09月06日

著者/編集 : 布留川 英一

出版社 : ボーンデジタル

発行形態 : 単行本

書籍説明

内容紹介

最先端のフレームワークの実力を試そう!Google Cloud Platform(GCP)の機械学習サービスの活用方法も紹介!

目次

1章 自然言語処理と深層学習
 1-1 自然言語処理の概要
 1-2 深層学習の概要
 1-3 自然言語処理の深層学習モデル

2章 Python開発環境の準備
 2-1 Pythonと開発環境の概要
 2-2 Google Colabの概要
 2-3 ローカルマシンのPython環境の準備
 2-4 Pythonの文法

3章 GiNZA
 3-1 GiNZAの概要
 3-2 形態素解析
 3-3 係り受け解析
 3-4 固有表現抽出
 3-5 ルールベースマッチング
 3-6 正規表現

4章 Huggingface Transformers
 4-1 Huggingface Transformersの概要
 4-2 トークナイザー
 4-3 テキスト分類
 4-4 質問応答
 4-5 要約
 4-6 テキスト生成
 4-7 言語モデル

5章 GPT-3・Vision Transformer・CLIP・Image GPT・DALL-E
 5-1 GPT-3によるプロンプトプログラミング
 5-2 Vision Transformerによる画像分類
 5-3 CLIPによる未学習カテゴリでの画像分類
 5-4 Image GPTによる半分画像からの画像生成
 5-5 DALL-Eによるテキストからの画像生成

6章 Tacotron2+WaveGlow・NEUTRINO・Jukebox
 6-1 Tacotron2+WaveGlowによる音声合成
 6-2 NEUTRINOによる歌声合成
 6-3 Jukeboxによる歌声付きの楽曲生成

7章 Google Cloud Platform
 7-1 Google Cloud Platformの概要
 7-2 Natural Language API
 7-3 Text-to-Speech API
 7-4 Speech-to-Text API
 7-5 Translation API

著者情報

布留川 英一
1999年、『JAVA PRESS』(技術評論社)にて、携帯アプリの開発方法の連載を開始。2001年、株式会社ドワンゴにて、世界初のJava搭載携帯電話「503i」のローンチタイトル『サムライロマネスク』の開発に携わる。以後、新端末の新機能を活用したアプリを作りつつ、技術書を書き続け、18年で40冊ほどに。現在はギリア株式会社にて、ヒトとAIの共生環境の実現を目指して、人工知能の研究開発に取り込んでいる。 主な著書に『AlphaZero 深層学習・強化学習・探索 人工知能プログラミング実践入門』『Unityではじめる機械学習・強化学習 Unity ML-Agents実践ゲームプログラミング v1.1対応版』(ボーンデジタル)など。共著として「Unityゲーム プログラミング・バイブル」「Unityゲーム プログラミング・バイブル 2nd Generation」(ボーンデジタル)がある。
布留川, 英一, 1975-