BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//https://techplay.jp//JP
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALDESC:Lucene 版 #Kuromoji のコードを読む会（辞書ビル
 ダー編）
X-WR-CALNAME:Lucene 版 #Kuromoji のコードを読む会（辞書ビル
 ダー編）
X-WR-TIMEZONE:Asia/Tokyo
BEGIN:VTIMEZONE
TZID:Asia/Tokyo
BEGIN:STANDARD
DTSTART:19700101T000000
TZOFFSETFROM:+0900
TZOFFSETTO:+0900
TZNAME:JST
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
UID:749243@techplay.jp
SUMMARY:Lucene 版 #Kuromoji のコードを読む会（辞書ビルダー
 編）
DTSTART;TZID=Asia/Tokyo:20191003T190000
DTEND;TZID=Asia/Tokyo:20191003T203000
DTSTAMP:20260407T090058Z
CREATED:20190905T141843Z
DESCRIPTION:イベント詳細はこちら\nhttps://techplay.jp/event/74924
 3?utm_medium=referral&utm_source=ics&utm_campaign=ics\n\n概要\nApache S
 olr や Elasticsearch の日本語検索で使われている，Apache Lu
 cene 付属の日本語形態素解析器 Kuromoji (https://github.com/ap
 ache/lucene-solr/tree/master/lucene/analysis/kuromoji) のソースコー
 ドをみんなで読む会です。\n進め方は，@moco_beta がソー
 スコード解説の体で話しつつ，参加者からの質問やつ
 っこみを交えながら知見が共有できればいいなと思っ
 ています。1回で読み切るには分量が多いので，今回は
 システム辞書ビルダーとエンコーダー／デコーダー周
 り（BinaryDictionary + DictionaryBuilder + FST）に絞って資料を
 作ります。省メモリかつ高速な解析を実現するために
 実装上どんな工夫がおこなわれているのか，を中心に
 見ていきます。\nまた時間が許せば，いま進行中のこ
 の JIRA Issue について紹介と，展望（野望？）を語りま
 す。\nLUCENE-8816: Decouple Kuromoji's morphological analyser and its d
 ictionary\n会場提供は（株）サムライズム様 です。\nタ
 イムテーブル\n※目安です。当日の進み具合に合わせ
 て調整します。\n\n\n\n時間\n内容\n\n\n\n\n18:45\n開場\n\n\n1
 9:00 ~ 19:10\n趣旨説明的な\n\n\n19:10 ~ 19:40\n前半戦 - 準備
 ，FST周りを眺める\n\n\n19:40 ~ 19:50\n休憩\n\n\n19:50 ~ 20:30\n
 後半戦 - 単語エントリのエンコードを眺める，他\n\n\n2
 0:30\n解散\n\n\n\nお品書き\n\nコードを読む前に知ってお
 きたいこと\nKuromoji システム辞書のアーキテクチャ，
 バイナリ辞書のありか\n見出し語索引（FST）の設計，
 シリアライズ，データ圧縮の工夫\n単語エントリのフ
 ォーマット，シリアライズ，データ圧縮の工夫\nデコ
 ーディングについて\n\n対象者\nこんな方が楽しめるか
 もしれませ\nん。\n\n業務 or 趣味で Kuromoji を使ってい
 るが中身（実装）に興味がある／改造したい／改造し
 ている\nKuromoji の運用で困っていることがあり相談し
 たい\nLucene\, Solr の開発に参加／コントリビュートして
 みたい\nSolr\, Elasticsearch  における， out-of-the-box な日本
 語検索の未来に興味がある\n\n※基礎的な形態素解析の
 アルゴリズム解説等は行いません。そのあたりは Web 
 上に良い資料がたくさんあるので，必要な方は事前に
 調べてみてください。\n準備\nソースコードを読むので
 ，Java の知識はあるほうが良いでしょう。\n必須ではあ
 りませんが，Lucene/Solr のコードをチェックアウトして
 ，手元の IDE (IntelliJ IDEA or Eclipse がオススメ) で確認で
 きるように準備しておくとより楽しいと思います。\nht
 tps://github.com/apache/lucene-solr\nJDK 11 （以上）と Ant が必要
 です。入っていない場合は ここ と ここ からインスト
 ールしてください。または SDKMAN でもOK。\n$ git clone http
 s://github.com/apache/lucene-solr.git\n$ cd lucene-solr\n$ ant ivy-bootst
 rap\n$ ant idea   # IDEA 使いの方\n$ ant eclipse  # Eclipse 使いの
 方 \n\n\n\n発表者について\nTomoko Uchida : @moco_beta\n検索が
 好きなプログラマ。Apache Lucene のサンデーコミッター
 。Apache Solr 入門3版共著者。最近は Elasticsearch と戯れて
 いる。\nプロフィール: https://medium.com/@mocobeta/about-me-b288
 38ba631f
LOCATION:株式会社サムライズム 東京都豊島区南池袋2-33-6
 佐藤ビルディング7F
URL:https://techplay.jp/event/749243?utm_medium=referral&utm_source=ics&utm
 _campaign=ics
END:VEVENT
END:VCALENDAR
