潜在的ディリクレ配分 (LDA) の概論とハンズオンセミナー

2019/09/07(土)16:00 〜 18:30 開催
ブックマーク

イベント内容

内容概要

自然言語処理の中に、トピックモデルと呼ばれるモデルが存在します。
これは、文書中の単語が潜在的なトピックを持っていると仮定したモデルで、
この潜在的なトピックによって文書のクラスタリングなどに用いられています。

今回は、「トピックモデルと言えば、潜在的ディリクレ配分」と言われるほどに強力なモデルである
LDA (潜在的ディリクレ配分) を扱っていきます。
(もちろん、トピックモデルには様々種類があり、LDA はその中の 1 つです。)

LDA は洗練された手法ですが、理解することは容易ではありません。
まず、確率分布が立ちはだかり、それらが複雑に関係し合うことが原因として挙げられます。

加えて、Python ではライブラリが用意されてはいるのですが、入力データを整えることもまた一苦労です。
(私も初回は苦戦しました。)

本セミナーでは、LDA が何をしているのかを平易に説明した後に、
Pythonで実装するための前処理と実装を行います。

https://github.com/StairsToSeventhHeaven/LDA-implementation

開催日程

9/7(土) 
受付   :15:50〜16:00
講義   :16:00〜18:30

アジェンダ

・LDA概論 (40分)

・前処理 (30分)
  LDAに必要な前処理を説明しますが、LDA に限らない一般的な処理である形態素解析も含みます。

・LDA ハンズオン(50分)
  ハンズオンを通して、LDAの理解を深め、
  使うことができるようになりましょう!
  
※
細かいアジェンダは若干変更になる可能性があります。
途中、10分程度の休憩を設けます。

会場

水道橋駅、神保町駅、九段下駅周辺
千代田区西神田2-7-14 YS西神田ビル2F

当日のお持物

・ノートとペン
・ノートPC
=> ある程度のスペックは欲しいので、5年以内に購入したくらいのものだと嬉しいです。
=> また、WindowsよりもMacの方が環境構築が楽なので推奨です。

事前準備

特に必要はないですが、事前知識に自信のない方は下記に目を通してきていただけたらと思います。
自然言語処理に関する記事です。
https://lib-arts.hatenablog.com/entry/nlp_tutorial1
https://lib-arts.hatenablog.com/entry/nlp_tutorial2


・ライブラリ関連
PythonとAnacondaを利用できるようにしてきてください。
使用するライブラリは、
・NLTK 
・Janome
・gensim 
を想定していますが、すべて使うとは限りません。
インストールについて、不明な点がある方は当日追加1,500円で個別フォローアップも可能です。

費用

・4000円(2.5 時間)

領収書の発行も可能ですのでご希望の方はその旨お申し付けいただければと思います。
領収証発行の際は事務手数料として(法人料金も兼ねて)追加で1,000円のお支払いをよろしくお願いいたします。

定員

6名(人数に合わせて調整します、別媒体でも募集していますので申し込み人数は当日参加者数を反映しません)

ご参加にあたってのお願い

無断欠席や前日以降のキャンセルに関しては当日人数読めなくなり非常に迷惑なので
基本的に行わないようにお願いします。(直前参加は定員的に問題なければ歓迎です!)
体調不良、職務都合、ご家庭の事情などどうしてものケースは別途ご連絡いただくか、
イベントへのお問い合わせよりご連絡いただけますと嬉しいです。
上記がひどいアカウントに関してはブラックリスト処理を行い以後の参加をお断りさせて
いただきますので、その点だけ予めご了承ください
(7割以上来れる前提でのお申し込みと前日以降のキャンセルはメッセージでのご連絡を
いただくということだけ気をつけていただければ大丈夫だと思います)

また、食事は他の参加者の集中を妨害し得るので、ご遠慮ください。

モチベーションの高い参加者の方を重視する運営としていきたいと考えています。
ご協力のほど、よろしくお願いいたします。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

関連するイベント