Rでの自然言語解析入門2

2018/01/20(土)16:00 〜 18:30 開催
ブックマーク

イベント内容

【Rでの自然言語解析入門2】

【概要】
日本語データの読みこみ、前処理、形態素解析、SentimentAnalysis、単語の集計と可視化、2-gramとネットワーク図、wordcloud、用例索引、共起語分析、TwitterAPIからの情報取得とそのデータ解析、トピックモデルなどを扱います。

【タイムライン】
15:40 開場
16:00-16:10 企画紹介と参加者自己紹介
16:10-16:20 日本語テキストの読み込みと前処理
16:20-16:40 形態素解析とwordcloudとn-gramとネットワーク図
16:40-17:10 Twitterからの情報取得とその解析
17:10-17:20 休憩
17:20-17:40 Twitterから取得した情報解析の応用
17:40-17:55 日本語での用例索引
17:55-18:05 Sentiment Analysis
18:05-18:15 共起語分析
18:15-18:25 トピックモデル・Bag-of-Words(BOW)・TF-IDF
18:25-18:30 質疑応答

【日時】2018年1月20日(土)16:00-18:30

【会場】
LabCafe
東京都文京区本郷4-1-3 明和本郷ビル7F
http://lab-cafe.net/page/access
(本郷交番向かいの、ラーメン屋さんが1Fに入っているビルです。)
東京メトロ 丸ノ内線「本郷三丁目」 徒歩3分
都営大江戸線「本郷三丁目」     徒歩3分

【参加費】
学生・ポスドク 無料(受付にて学生証・身分証をお見せください)
社会人3000円(お釣りのないようにお願いします)

【当日の持ち物・必要なPCのスペック・必要なソフトウェア】
※ご自身のノートPCを必ずお持ちください。

【Rのダウンロード・インストール】
【Windowsの方】
Windows 7以上を推奨。
まだRをいれてない方は、Rをダウンロード・インストールしてください。
https://cran.r-project.org/
のDownload R for Windows→base→Download R 3.4.3 for Windows (62 megabytes, 32/64 bit)インストールを進めてください。
【Macの方】
Mac OSX(10.6以上推奨)
Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
Download R for (Mac) OS Xをクリック、R-3.4.3.pkgをクリックするとダウンロードできます。そののちにインストールしてください。
【Linuxの方】
https://cran.r-project.org/
から、Download R for Linuxをクリック、その後、各々の環境に沿ってダウンロードインストールを行ってください。

【MeCabのダウンロードインストール】
【Windowsの方】
以下URLに飛んだあと(MeCabと検索いただいても結構です)
http://taku910.github.io/mecab/
ダウンロード→MeCab 本体→Binary package for MS-Windows→mecab-0.996.exe:ダウンロードの”ダウンロード”をクリック。
【Macの方】
xcode入っていない方は、xcodeをインストール
ターミナルに以下のコマンドを入力
xcode-select --install
homebrewが入っていない方は、以下コマンドをターミナルに入力してhomebrewをいれる、
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
その次に、
brew install wget
と入力。
その後以下コマンドを、一行ずつ入力
cd /tmp
wget -O mecab-0.996.tar.gz "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE"
tar xzf mecab-0.996.tar.gz
cd mecab-0.996
./configure
make
sudo make install
cd ..
wget -O mecab-ipadic-2.7.0-20070801.tar.gz "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM"
tar xzf mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
sudo make install
cd ..
rm -rf /tmp/mecab-*

【Rパッケージのダウンロード・インストール】

以下すでいれたかどうかわからないものは、たとえばtmパッケージなら

library(tm)
と入力してEnter押して、入ってないと出てきたら、
install.packages("tm")
という形でお願いします。
Cran mirrorは、Japan(Tokyo)でよいかと思います。だめならUSのどこかで。

以下一行ずつRのコンソールに張り付けて実行してください。

install.packages("RMeCab",repos="http://rmecab.jp/R")
install.packages("tm")
install.packages("devtools")
library(devtools)
install.packages("purrr")
install.packages("twitteR")
install.packages("wordcloud")
install.packages("igraph")

以下本講習会(Part1,2,3,4)に参加していればおそらく入っているパッケージです。

参加していない方は入れておいてください。

install.packages("formattable")
install.packages("magrittr")
install.packages("dplyr")
install.packages("stringr")

【その他環境】
・無線LAN搭載
・HDD空き容量2GB以上
・メモリ4GB以上

【開発環境設定】
当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関して運営側は責任を負いかねます。
※ご自身のノートPCを必ずお持ちください。

【お願い】
当日、一部でネット環境を必要とします。会場のWi-Fi回線は混みあうことが予想されますので,お持ちの方はモバイルルーターなどをご持参ください(こちらでも用意しています)。

【講師紹介】
鈴木瑞人
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業
2016年4月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程入学

【お問い合わせ先】
machine.learning.r@gmail.com

【主催】
実戦的機械学習勉強会

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。