AWSの機械学習サービスと学習講座について解説
ここ数年でよく耳にするようになったITワードのひとつに、機械学習があります。Googleをはじめとした大手IT企業は、一般エンジニアでも比較的簡単に機械学習を利用できるクラウドサービスを提供しています。
AWSはもちろんのこと、IBMのWatson、MicrosoftのAzuruなどが有名です。クラウド型機械学習サービスやその料金体系はどのようなものかを、AWSが提供するサービスから見てみましょう。
AWSの機械学習サービスについて
Amazon Machine Learning
最もベーシックな予想モデルである「ロジスティック回帰」「多項式ロジスティック回帰」「線形回帰」の3つを提供しています。またサービスを使う人は、機械学習用のアルゴリズムを自分で実装したり、パラメータを調整したりする必要が全くありません。やることはCSV形式のデータを用意して流し込むだけです。Amazon SageMaker
Amazon Machine Learningと比較すると、やや専門的な知識が求められます。組み込みのアルゴリズムがあらかじめ準備されていますが、Jupyter Notebookから必要なライブラリをインポートしたり、パラメータを調整したりする等、より柔軟性のあるチューニングが可能なサービスとなっています。Amazon Rekognition
画像認識に特化したサービスです。画像や動画といったものを認識・検出するために利用できます。Amazon Lex
最近LINEなどでよく見る「チャットボット」をかんたんに構築できるサービスで、言語処理特化のものになります。またテキストだけではなく、音声認識サービスも利用できます。Amazon Polly
テキストを音声に変換するサービスです。Pocketで提供されているテキスト読み上げサービスのようなことができます。Amazon Comprehend
自然言語処理を利用できるサービスです。提供している機能はいくつかあり、エンティティ・キーフレーズ・主要言語・感情の検出を行えます。ただ専門的な知識がないと、流し込んだデータをどう活用するかが難しく、SageMakerのようにやや専門的なサービスという印象を受けます。Amazon Transcribe
いわゆる「文字起こし」サービスです。入力データは音声からのみです。さらにカスタム語彙という、Amazon Transcribeへ固有名詞を学習させるための語彙リストを作成することで、認識精度を向上させられます。Amazon Textract
財務諸表、医療記録、税金計算書といった複雑なドキュメントからでも、特定のテキストの抽出ないし分析ができます。またテキストのみならず、表も抽出することが可能です。Amazon Personalize
Amazonが最も得意とする、それぞれのユーザーが持つ嗜好や行動をベースにしたレコメンデーションを提供する機械学習サービスです。こちらのサービスも、とくに使用する人が学習させる必要性がなく、データをAmazon S3へアップロードしてアルゴリズムを選択するだけです。Amazon Forecast
時系列データを基にした予測を行うサービスです。過去の時系列データをAmazon Forecastに提供することで、未来のデータを予想します。財務計画、生産計画、購買計画またはヘルスケアといった分野にも使える、応用の幅が広いサービスです。AWS DeepRacer
は自動運転AIを提供してくれるサービスです。ただ単に自動運転AIを学習させるだけではなく、Amazonが提供する1/18サイズのモデルカーに自作のAIを載せて走らせることができます。
機械学習サービスの料金体系
上で説明した機械学習サービスの料金を表形式にしてまとめました。 機械学習系サービスの料金体系は、ほとんどが使った分だけ清算となる仕組みです。
サービス名 | 価格 |
---|---|
Amazon Machine Learning | データ分析・モデル構築 1時間:0.42米ドル バッチ予測 1,000件: 0.10米ドル リアルタイム予測 1件: 0.0001米ドル |
Amazon SageMaker | ノートブックインスタンス ml.t2.medium 1時間:0.0464米ドル トレーニングインスタンス Ml.m4.4xlarge 1時間:1.12米ドル ホスティングインスタンス ml.t2.medium 1時間:0.065米ドル |
Amazon Rekognition | アーカイブ動画 1分:0.13米ドル 顔データのストレージ 1,000 件:0.013米ドル |
Amazon Lex | 音声リクエスト1回:0.004米ドル テキストリクエスト1回:0.00075米ドル |
Amazon Polly | 100万文字:4.00米ドル |
Amazon Comprehend | キーフレーズ抽出:0.0001米ドル 感情分析:0.0001米ドル エンティティ認識:0.0001米ドル 言語検出:0.0001米ドル 構文解析:0.00005米ドル Amazon Transcribe 1秒:0.0004米ドル |
Amazon Textract | 初月の100万ページ: 0.0015米ドル 追加の100万ページ:0.0006米ドル |
Amazon Personalize | データ取り込み:0.05米ドル/GB トレーニング:0.24米ドル/トレーニング時間 推論の料金:0.20米ドル/1TPS時間 |
Amazon Forecast | 1,000予測あたり0.60米ドル 1GBあたり0.088米ドル 1時間あたり0.238米ドル |
AWS DeepRacer | AWS DeepRacer カー:399米ドル(Amazon USのみ) Amazon SageMakerトレーニング:1時間あたり 0.24米ドル |
※料金は2019年3月17日時点のものです
機械学習用のインスタンス
機械学習は自分でインスタンスを立てて、環境を作ることもできます。 上で挙げたサービスほど手軽ではありませんが、自分で環境を自由にカスタマイズできる利点があります。
Amazon EC2 P2 インスタンス
Amazon EC2 P2インスタンスを使うことで、機械学習に最適な環境を作成できます。EC2 P2はGPU ベースの並列コンピューティング機能が備わっているため、機械学習のようなビッグデータでも高速な計算処理が実現できます。
また、EC2インスタンスに備わっているオートスケーリング機能もあるため、機械学習用インフラのリソース不足に陥る心配がありません。
スペックの詳細については、以下の引用文が参考になります。
EC2+GPUでインスタンスを構築
EC2インスタンスをGPUオプションで立ち上げることでも、上で紹介したEC2 P2のようなインフラ環境を構築できます。EC2 P2があるため出番は少ないでしょうが、個人でAWSと機械学習をはじめて触るような人は勉強も兼ねて、EC2インスタンスを立ち上げるところからはじめるのも良いでしょう。
AWSが提供する機械学習講座
AWSには機械学習大学というものが存在します。これはAmazon社内にて教育するための動画を一般開放したものであり、わかりやすく品質が高いと評判です。
機械学習の概要および「Sikit Learn」「Keras」などのツールについて説明しているサイトはいくつかありますが、AWS機械学習サービスに特化したものは公式サイト以外、多くは存在しません。 そのため本家Amazonが提供する動画講座は、AWS機械学習を勉強するにあたって、とても有益なものです。公開している動画の数も30件、合計45時間以上にのぼり、ボリュームも十分です。
まとめ
AWSが提供する機械学習サービス11種類について、また各サービスを利用する際の料金についても解説しました。
さらには、機械学習サービスのためのGPUオプションを使ったインスタンスが便利な点、AWSが提供している機械学習大学を利用すると効率的に勉強できる点についても説明しました。
機械学習は高度な数学および専門的な知識が必要な分野ですが、AWS機械学習サービスを利用すれば、専門的な知識が少なくとも機械学習を利用できます。機械学習の知見を深めるには最適なサービスだと言えます。
この記事のキーワードに関する勉強会・イベントを探す
TECH PLAYでは、ITエンジニア向けの勉強会・イベント情報を提供しています。
興味のある方はぜひご参加ください。