【自然言語処理の潮流を一挙マスター!】 AI技術で進化するテキストアナリティクス最前線

2024/10/23(水)15:00 〜 17:30 開催
ブックマーク

イベント内容

概要
本イベントでは、テキストマイニングにトピックモデル、ベイジアンネットワークという
AI技術を組み合わせて、有用なビジネスアクションを探索する大規模テキストデータの新
しい分析技術について紹介します。

《第1部》
株式会社アナリティクスデザインラボ 代表取締役 の野守耕爾様より、テキストマイニン
グから大規模言語モデルに至る自然言語処理のAI技術の体系を紹介します。
《第2部》
引き続いて野守耕爾様より、テキストマイニングとトピックモデル、ベイジアンネットワ
ークとを組み合わせた新分析技術とその事例を紹介します。
《第3部》
AITeC データマイニングWGリーダー(株式会社NTTデータ数理システム) の岩本圭介より、
第2部で紹介したAI技術を統合して扱うことができる、同社開発の分析プラットフォーム
を紹介します。

プログラム詳細
15:00     開会、本イベントについてのご案内
15:05     開会のご挨拶、人工知能技術コンソーシアムのご紹介
        【人工知能技術コンソーシアム 会長 本村 陽一 様】
15:15     《第1部》いまさら聞けない自然言語処理のAI技術の体系
        ~テキストマイニング・トピックモデル・深層学習モデル・大規模言語モデル~
        【株式会社アナリティクスデザインラボ 野守 耕爾 様】
16:00     休憩
16:05     《第2部》大規模テキストデータから要因関係を発見する三位一体分析
        ~テキストマイニング×PLSA×ベイジアンネットワーク~
        【株式会社アナリティクスデザインラボ 野守 耕爾 様】
16:50     休憩
17:00     《第3部》多様なAI技術のコラボレーションを実現する分析プラットフォームのご紹介
        【株式会社NTTデータ数理システム 岩本 圭介 様】
17:20     質疑応答
17:30      閉会

各講演概要
《第1部》いまさら聞けない自然言語処理のAI技術の体系
~テキストマイニング・トピックモデル・深層学習モデル・大規模言語モデル~

ChatGPTがリリースされてまもなく2年が経過し、生成AIブームも日常化してきました。
流行や熱狂は課題の本質を見失わせてしまうので、個人的には生成AI一辺倒のアプローチ
には危うさも感じますが、皆さんは生成AIをどこまで理解して使われていますでしょうか。
生成AIは大規模言語モデルをベースにしている、その核心技術がTransformerである、
それくらいのことはよく知られています。しかし、その技術の仕組みを問われて答えられ
る人は限られるかと思います。一般ユーザが技術の理論まで熟知する必要はありませんが、
生成AIを使うからには最低限の仕組みの理解や、それを踏まえた適用性を判断できるスキ
ルは重要です。

本講演では、単語を抽出しカウントする従来の自然言語処理技術である「形態素解析」
「Bag-of-Words」「TF-IDF」から、その単語の頻度から文書のトピックを抽出するトピ
ックモデルの「LSA」「NMF」「PLSA」「LDA」、文章の変換や生成を深層学習で実現した
「word2vec」「RNN」「LSTM」「seq2seq」「Attention」、そしてそれが大規模言語モデ
ルへと進化した「Transformer」「BERT」「GPT」「T5」を取り上げ、技術の進化を辿りな
がら各手法の概要を解説します。また、同じテキストデータを処理対象とするテキストマ
イニングと大規模言語モデルの違いも対比して解説します。

《第2部》大規模テキストデータから要因関係を発見する三位一体分析
~テキストマイニング×PLSA×ベイジアンネットワーク~

テキストデータに潜む傾向を把握するテキストマイニングという分析手法は、今では様々
なツールが登場し、ビジネスの場面でもよく活用されています。テキストマイニングの実
行で文書に含まれる単語を抽出し、その単語を軸とした集計と可視化によって記述傾向の
現状を把握できます。しかし、大規模なデータでは可視化結果が複雑で解釈しにくいこと
や、現状把握を超えて変化の状態を把握するシミュレーションまでは実行できません。

本講演では、こうしたテキストマイニングの課題に対して、トピックモデルのPLSAと確率
的因果モデルのベイジアンネットワークという2つのAI技術を組み合わせて開発した「Nom
olytics」という新しい分析手法をご紹介します。PLSAで得られたトピックに基づく分析
により、大規模なテキストデータでも傾向の把握が容易となります。また、ベイジアンネ
ットワークによりテキストデータに潜む要因関係を発見し、その関連性の影響の変化をシ
ミュレーションできます。これによって影響力のある有用なビジネスアクションを探索で
きます。本講演ではこのNomolyticsの適用事例として、旅行の口コミデータを対象に観光
マーケティングを検討する分析と、特許文書データを対象に企業の技術戦略を検討する分
析をご紹介します。

《第3部》多様なAI技術のコラボレーションを実現する分析プラットフォームのご紹介

第2部でご紹介する「Nomolytics」は、AI技術を複合的に用いることが大きな特色です。
(株)NTTデータ数理システムで開発を行っている分析プラットフォーム「Alkano」では自
然言語処理とトピックモデル、ベイジアンネットワークといった技術を一つのプラットフ
ォーム上で統合して扱うことが可能です。本講演では、分析プラットフォームAlkano、そ
してその上での多様なAI技術のコラボレーションについてご紹介します。

講演者ご紹介
株式会社アナリティクスデザインラボ
代表取締役 野守 耕爾 様

《略歴》
早稲田大学大学院 創造理工学研究科 経営システム工学専攻 博士課程修了。博士(工学)。
産業技術総合研究所 デジタルヒューマン工学研究センター、
有限責任監査法人トーマツ デロイトアナリティクスを経て、
2017年6月に株式会社アナリティクスデザインラボを設立。代表取締役。

企業のデータ分析・データ活用を支援するコンサルティング事業および新しい分析技術の
研究開発を展開。人工知能学会 全国大会優秀賞、日本マーケティング学会
カンファレンスベストペーパー賞、日本人間工学会 大島正光賞(最優秀論文賞)など
受賞。専門は統計解析、人工知能、確率モデリング、テキストマイニングなど。

株式会社NTTデータ数理システム
データマイニング部 主幹研究員 岩本 圭介

《略歴》
AITeC データマイニングWG リーダー。株式会社NTTデータ数理システム にて
開発チームを率いる傍ら、お客様への分析伴走サポート業務や分析受託業務に従事。

セミナー配信方法
Webinar形式(zoom)で配信いたします。
参加用URLは参加をお申込いただいた後に、お申し込みページ内でご確認いただくことができます。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。
情報提供元ページ(Doorkeeper)へ

新規会員登録

このイベントに申し込むには会員登録が必要です。
アカウント登録済みの方はログインしてください。



※ ソーシャルアカウントで登録するとログインが簡単に行えます。

※ 連携したソーシャルアカウントは、会員登録完了後にいつでも変更できます。

関連するイベント