AWSの機械学習サービスと学習講座について解説

プログラミング
AWSが提供している機械学習サービスについて、説明をおこないます。さらに各々のサービス利用時、どれくらいの必要な料金が必要になるかを提示します。 また自分で機械学習の環境を作るとき、どのようなE2インスタンスを準備すれば良いか、説明を行います。 最後にAWSが提供している機械学習の講座を使うことで、勉強をスムーズに進めることができる点について話をします。
AWSの機械学習サービスと学習講座について解説

ここ数年でよく耳にするようになったITワードのひとつに、機械学習があります。Googleをはじめとした大手IT企業は、一般エンジニアでも比較的簡単に機械学習を利用できるクラウドサービスを提供しています。
AWSはもちろんのこと、IBMのWatson、MicrosoftのAzuruなどが有名です。クラウド型機械学習サービスやその料金体系はどのようなものかを、AWSが提供するサービスから見てみましょう。

AWSの機械学習サービスについて

  • Amazon Machine Learning
    最もベーシックな予想モデルである「ロジスティック回帰」「多項式ロジスティック回帰」「線形回帰」の3つを提供しています。またサービスを使う人は、機械学習用のアルゴリズムを自分で実装したり、パラメータを調整したりする必要が全くありません。やることはCSV形式のデータを用意して流し込むだけです。

  • Amazon SageMaker
    Amazon Machine Learningと比較すると、やや専門的な知識が求められます。組み込みのアルゴリズムがあらかじめ準備されていますが、Jupyter Notebookから必要なライブラリをインポートしたり、パラメータを調整したりする等、より柔軟性のあるチューニングが可能なサービスとなっています。

  • Amazon Rekognition
    画像認識に特化したサービスです。画像や動画といったものを認識・検出するために利用できます。

  • Amazon Lex
    最近LINEなどでよく見る「チャットボット」をかんたんに構築できるサービスで、言語処理特化のものになります。またテキストだけではなく、音声認識サービスも利用できます。

  • Amazon Polly
    テキストを音声に変換するサービスです。Pocketで提供されているテキスト読み上げサービスのようなことができます。

  • Amazon Comprehend
    自然言語処理を利用できるサービスです。提供している機能はいくつかあり、エンティティ・キーフレーズ・主要言語・感情の検出を行えます。ただ専門的な知識がないと、流し込んだデータをどう活用するかが難しく、SageMakerのようにやや専門的なサービスという印象を受けます。

  • Amazon Transcribe
    いわゆる「文字起こし」サービスです。入力データは音声からのみです。さらにカスタム語彙という、Amazon Transcribeへ固有名詞を学習させるための語彙リストを作成することで、認識精度を向上させられます。

  • Amazon Textract
    財務諸表、医療記録、税金計算書といった複雑なドキュメントからでも、特定のテキストの抽出ないし分析ができます。またテキストのみならず、表も抽出することが可能です。

  • Amazon Personalize
    Amazonが最も得意とする、それぞれのユーザーが持つ嗜好や行動をベースにしたレコメンデーションを提供する機械学習サービスです。こちらのサービスも、とくに使用する人が学習させる必要性がなく、データをAmazon S3へアップロードしてアルゴリズムを選択するだけです。

  • Amazon Forecast
    時系列データを基にした予測を行うサービスです。過去の時系列データをAmazon Forecastに提供することで、未来のデータを予想します。財務計画、生産計画、購買計画またはヘルスケアといった分野にも使える、応用の幅が広いサービスです。

  • AWS DeepRacer
    は自動運転AIを提供してくれるサービスです。ただ単に自動運転AIを学習させるだけではなく、Amazonが提供する1/18サイズのモデルカーに自作のAIを載せて走らせることができます。

機械学習サービスの料金体系


上で説明した機械学習サービスの料金を表形式にしてまとめました。 機械学習系サービスの料金体系は、ほとんどが使った分だけ清算となる仕組みです。

サービス名 価格
Amazon Machine Learning データ分析・モデル構築 1時間:0.42米ドル
バッチ予測 1,000件: 0.10米ドル
リアルタイム予測 1件: 0.0001米ドル
Amazon SageMaker ノートブックインスタンス ml.t2.medium 1時間:0.0464米ドル
トレーニングインスタンス Ml.m4.4xlarge 1時間:1.12米ドル
ホスティングインスタンス ml.t2.medium 1時間:0.065米ドル
Amazon Rekognition アーカイブ動画 1分:0.13米ドル
顔データのストレージ 1,000 件:0.013米ドル
Amazon Lex 音声リクエスト1回:0.004米ドル
テキストリクエスト1回:0.00075米ドル
Amazon Polly 100万文字:4.00米ドル
Amazon Comprehend キーフレーズ抽出:0.0001米ドル
感情分析:0.0001米ドル
エンティティ認識:0.0001米ドル
言語検出:0.0001米ドル
構文解析:0.00005米ドル
Amazon Transcribe 1秒:0.0004米ドル
Amazon Textract 初月の100万ページ: 0.0015米ドル
追加の100万ページ:0.0006米ドル
Amazon Personalize データ取り込み:0.05米ドル/GB
トレーニング:0.24米ドル/トレーニング時間 推論の料金:0.20米ドル/1TPS時間
Amazon Forecast 1,000予測あたり0.60米ドル
1GBあたり0.088米ドル
1時間あたり0.238米ドル
AWS DeepRacer AWS DeepRacer カー:399米ドル(Amazon USのみ)
Amazon SageMakerトレーニング:1時間あたり 0.24米ドル

※料金は2019年3月17日時点のものです

機械学習用のインスタンス

機械学習は自分でインスタンスを立てて、環境を作ることもできます。 上で挙げたサービスほど手軽ではありませんが、自分で環境を自由にカスタマイズできる利点があります。

Amazon EC2 P2 インスタンス

Amazon EC2 P2インスタンスを使うことで、機械学習に最適な環境を作成できます。EC2 P2はGPU ベースの並列コンピューティング機能が備わっているため、機械学習のようなビッグデータでも高速な計算処理が実現できます。
また、EC2インスタンスに備わっているオートスケーリング機能もあるため、機械学習用インフラのリソース不足に陥る心配がありません。
スペックの詳細については、以下の引用文が参考になります。

EC2+GPUでインスタンスを構築

EC2インスタンスをGPUオプションで立ち上げることでも、上で紹介したEC2 P2のようなインフラ環境を構築できます。EC2 P2があるため出番は少ないでしょうが、個人でAWSと機械学習をはじめて触るような人は勉強も兼ねて、EC2インスタンスを立ち上げるところからはじめるのも良いでしょう。

AWSが提供する機械学習講座

AWSには機械学習大学というものが存在します。これはAmazon社内にて教育するための動画を一般開放したものであり、わかりやすく品質が高いと評判です。

機械学習の概要および「Sikit Learn」「Keras」などのツールについて説明しているサイトはいくつかありますが、AWS機械学習サービスに特化したものは公式サイト以外、多くは存在しません。 そのため本家Amazonが提供する動画講座は、AWS機械学習を勉強するにあたって、とても有益なものです。公開している動画の数も30件、合計45時間以上にのぼり、ボリュームも十分です。

まとめ

AWSが提供する機械学習サービス11種類について、また各サービスを利用する際の料金についても解説しました。
さらには、機械学習サービスのためのGPUオプションを使ったインスタンスが便利な点、AWSが提供している機械学習大学を利用すると効率的に勉強できる点についても説明しました。

機械学習は高度な数学および専門的な知識が必要な分野ですが、AWS機械学習サービスを利用すれば、専門的な知識が少なくとも機械学習を利用できます。機械学習の知見を深めるには最適なサービスだと言えます。

この記事のキーワードに関する勉強会・イベントを探す

TECH PLAYでは、ITエンジニア向けの勉強会・イベント情報を提供しています。
興味のある方はぜひご参加ください。


おすすめのコラム