自然言語処理を体系的に学べる講座【全4回】

2019/04/06(土)19:00 〜 22:00 開催
ブックマーク

イベント内容

自然言語処理を体系的に学べる講座

日程

4月6日(土) 19:00~22:00
4月13日(土) 19:00~22:00
4月20日(土) 19:00~22:00
4月27日(土) 19:00~22:00

講座の動画を復習用に撮ります。もし参加できない日程がございましても、後ほど資料と合わせて共有するようにいたしますので、ご安心ください。

概要

「日本語における自然言語処理を体系的に理解して、実務に活かしたい」という方を対象に本講座を開講いたします!講座内では、基本的な前処理から、単語や文章をどのように扱うかについての理論と実装までを取り扱います。実装はPython3を用いてハンズオン形式で行いますので、PCの持参をお願いいたします。

本講座の特徴は

・基礎から丁寧にわかりやすく
・使用する手法の理論を人に説明できるようになっていただく
・実用レベルで実装できるようになっていただく(Pythonを使います)
・理論だけでなく、システムにどのように組み込むかをできるだけ想像しやすくお伝えする
・チャットアプリケーション(slack)における質問サポート(初回講座から最終講座終了後1週間)
※質問内容は講座と関連する内容に限ります。
・動画で復習が可能
というものです。

希望者には、受講後に試験問題を解いていただき、一定の点数を超えることで本講座を修了したという証明書を当社で発行いたします。

講座を通じて得られること

・日本語自然言語処理における前処理(データ加工)手法の習得
・ニューラルネットワーク・深層学習が自然言語処理のどのような部分に応用されているかを体得
・単語の意味解析・文章の分類手法の全体像の把握
・word2vecの原理の理解と実装
・doc2vecの原理の理解と実装
・トピックモデルの原理の理解と実装
・自然言語処理を自社システムでどのように導入するかのイメージ

カリキュラム

【第一回】 Pythonを用いた自然言語処理の基礎の基礎

目的:日本語自然言語処理における前処理の基本的な技法を知り、Pythonで実装できるようになる。

  • ファイル操作
  • 形態素解析
  • 新語辞書の登録方法
  • データのクリーニング
  • 言語データの作成

【第二回】単語の意味解析

目的:単語をベクトルに変換する手法を理解し、単語の意味を抽出できるようになる

・単語の分散表現
・単語の類似度
・分散表現の実装
・単語分散表現を用いた機械学習
・word2vecを用いた分散表現基礎

【第三回】word2vecの理論と実装と応用

目的:word2vecに対するより深い理解をし、高度な意味解析を体得する

・word2vecの理論(CBOWとskip-gram)
・word2vecの学習方法と適用
・word2vecを利用する際の注意点
・word2vecを用いた応用事例の紹介

【第四回】文章分類

目的:トピックモデルや深層学習を用いた文章分類を理論ベースで理解し、実装できるようになる

・文章のベクトル化と様々な文章分類
・トピックモデルを利用した文章分類の紹介と実装
・Doc2Vecを用いた文章分類の紹介と実装
・RNN,LSTMを利用した文章分類の紹介
・システム化に向けたテクニック


※ 当日予告なく時間配分・内容が変更になる可能性がございます。

こんな人にオススメ

・Pythonのfor文,if文など基本的な文法を理解している方
・自然言語処理を体型的に学びたい方
・自社システムに自然言語処理のシステムを導入したい方
・自然言語処理の基礎をマスターし、キャリアアップに繋げたい方

受講するにあたっての前提基礎知識

【必須】
・Python3の基本的な文法(リスト,辞書,if文,for文,関数)とデータ分析ライブラリpandas,numpyの理解
理解に不安がある方は下記の講座を受講していただくか、ご自身で学習をお願いいたします。プログラムを書きながらの実戦形式で進めていきますので、プログラミング力はあればあるほど理解が促進されます。
【初心者歓迎】Python文法入門
Pythonデータ分析入門
Pythonデータ可視化・Numpy入門


【推奨】
・中学レベルの数学と一部統計学の知識があるとなおよし。
随所に数式が登場します。できるだけ噛み砕いて説明するようにいたしますが、数式への抵抗をなくして臨んだ方がより理解が促進されます。下記講座で統計学の基礎から中級レベルまでを網羅しておりますので、関心のある方は是非受講をご検討ください
レベル1:統計学超入門【超基礎編】(ゼロ〜統計検定3級合格レベルまで )
レベル2:統計学入門【確率変数・確率分布編】(統計検定2級合格レベル)
レベル3:統計学入門【推定・仮説検定編】(統計検定2級合格レベル)
レベル4:統計学入門【ベイズ・回帰・分割表解析編】(統計検定2級合格レベル)

事前準備

Python3のインストールをお願いいたします。
また、以下のパッケージを当講座では利用します。当日までに動作確認をお願いいたします。
・mecab-python3
・sklearn
・numpy
・beautifulsoup4
・gensim
・pandas
・mojimoji

Pythonのインストール、パッケージの導入方法についてご不明点あれば、可能な範囲で対応いたしますので、info@to-kei.netまでご連絡ください。

講師

大川遥平
全人類がわかる統計学の管理人。大学にて統計学を専攻。サイトでは確率分布の記事やサイトデザインを中心に担当。現在は、筑波大学大学院にて自然言語処理の研究に従事。その一方で、Pythonを用いたSEO対策用Webアプリケーションを構築、大手電機メーカーと共同でGANを使ったシステム作成などの活動をしている。
崔一鳴
全人類がわかる統計学の管理人。大学にて統計学を専攻。サイトではPython、R、仮説検定、統計の基礎の記事を中心に担当。また、私立大学医学部で医療統計の業務や保険会社でのデータ分析業務を3年ほど経験。現在は東京工業大学大学院にて、深層学習を用いた、自然言語処理の研究に従事。

持ち物

・Python3の実行環境をインストール済みのPC(windows Mac)
※インストールでお困りの方はinfo@to-kei.netまでご連絡いただければ、可能な範囲で対応致します。

※講座では「jupyter notebook」を使います。同じ実行環境で受講したい方は、インストールをお勧めします。

領収書について

【Stripeで事前決済の方】
クレジットカード会社が発行する明細を領収書の代わりとしてご利用ください。

【Paypalの方】
決済処理後にPaypalから送付されるメール内容、またはPaypalの取引履歴から該当項目を確認の上、「詳細」をご覧ください。それらが領収書の代わりとなります。また、クレジットカード会社発行の利用明細書も領収書としてご利用いただけます。

【別途領収書発行が必要な方】
別途発行手数料として1000円頂きます。必要な方はinfo@to-kei.netまでご連絡ください。領収書発行手数料と受講料金を合算した金額で発行いたします。

受付・入場時間

開始の15分前から

※なるべく5分前までにお入りください。
※途中参加も可能です。

お問い合わせ

・メールでのお問い合わせは、info@to-kei.net までご連絡ください。
・こちらで⇨LINE@からもお問い合わせいただけます。(推奨)

注意事項

・リクルーティング、勧誘、採用活動など、目的に沿わない行為につきまして、主催者が相応しくないと判断した場合は即刻退出処分とします。全員が気持ちよく過ごすことが出来るよう、ご協力をお願い致します。
・講座内で扱うコンテンツは全て「全人類がわかる統計学」に帰属しています。複製はご遠慮ください。
・個人ブログへの講義コンテンツの掲載はご遠慮ください。
・最小遂行人数は「3名」です。開催日の前日までにこの人数に達しない場合は中止となります。ただし、複数の媒体で募集を行っているので、本サイトの申込者数が最小遂行人数に達しない場合でも開催になる場合がございます。もし、中止が決定した場合はその時点で「全額返金」し、登録しているメールアドレスにご連絡させていただきます。

全人類がわかる統計学とは

統計学の学習サイト、全人類がわかる統計学を運営、管理している団体です。統計学とその関連分野について、出来るだけわかりやすく多くの人々に届けるということを目指して活動しています。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

関連するイベント