「形態素解析」に関連する技術ブログ

全 82 件中 1 - 15 件目

2026年07月03日

Kuromoji・Sudachi・MeCab・Janome・LLM・semantic search の使い分け【2026】

1年ほど前に、日本語アナライザーを比較する記事を書きました。前回の記事：日本語アナライザーの比較（Kuromoji / Sudachi / MeCab / LLM の性能検証）あれから1年がたち、日本語の検索まわりは少しずつ変わりました。新しい選択肢も出てきましたし、考え方も少し変わりました。そこで今回は、続編としてもう一度比較します。ただし、前回とまったく同じことを繰り返すわけではなく、 2026年の今なら、こう測るともっと良い、というやり方で見直します。今回の検証は「去年と同じ条件での定

Elasticsearch, Python, 形態素解析, Rust, MeCab, 大規模言語モデル（LLM）

サイオステクノロジー((DXS...

2026年06月29日

【25卒新人研修】全社検索研修

はじめにこんにちは、25卒データエンジニアの井上です！このブログは25卒新人向けに行われた研修紹介のブログ記事です、ぜひ

ハンズオン, 形態素解析, 人工知能, フロントエンド, API, OSS

株式会社リクルート

2026年06月18日

Amazon OpenSearch Service による「EC サイト検索ワークショップ」と「Observability Stack ワークショップ」のご紹介

2025 年 3 月に Amazon OpenSearch Service による検索ワークショップ（日本語版）のご紹介という記事を公開し、OpenSearch の基本概念から AI を活用した検索までを学べる日本語ワークショップをご案内しました。このたび、2 つの日本語版ワークショップが仲間入りいたしましたので、ご紹介いたします。 EC サイト検索ワークショップ：架空の EC サイトを題材に、検索機能を全文検索からセマンティック検索、マルチモーダル検索、エージェント検索へと段階的に育てていくワーク

AWS, PostgreSQL, ハンズオン, ワークショップ, 形態素解析, 人工知能, インフラ, OSS, Microservices, 大規模言語モデル（LLM）

AWS

2026年04月16日

ブラウザアプリで文章に使われている単語の使用数を集計する

日本語の文章を単語単位で解析する「形態素解析」について、JavaScriptライブラリ「Kuromoji」を使った方法を解説。サンプルコードを用いて、特定の品詞（名詞）を抽出し、単語の出現頻度を集計する具体的な手順を紹介します。

形態素解析

Ｓｋｙ株式会社

2026年03月25日

Elastic Inference Service (EIS) を使った「ベクトル検索」および「生成AIによる回答（RAG）」（実践編）

Elastic Inference Service (EIS) を使った「ベクトル検索」と「生成AIによる回答（RAG）」について、全2回にわたって解説します。第2回となる今回は「実践編」として、EIS を通じてモデルを呼び出し、「ベクトル検索」と「生成AIによる回答（RAG）」を実際に動かしてみます。目次前提条件テストデータ、各種スクリプト検索データのアップロードインデックスとパイプラインの作成 1. インデックスの作成 2. マッピングの定義 3. エイリアスの作成 4. インジェストパイ

Elasticsearch, GitHub, 形態素解析, 人工知能, テスト, 大規模言語モデル（LLM）, RAG

サイオステクノロジー((DXS...

2026年01月22日

リクルート『ホットペッパーグルメ』が Amazon OpenSearch Service で Hybrid Search を実現し検索体験を革新

株式会社リクルートは、日本国内で HR・販促事業を行う事業会社です。リクルートでは、満足度No1(*1)を誇る飲食店予約・グルメ情報サイト『ホットペッパーグルメ』を運営しています。『ホットペッパーグルメ』では、ユーザーが飲食店を検索する際の「0件ヒット」問題を解決するため、 Amazon OpenSearch Service （以下、OpenSearch Service）を採用し、Hybrid Search 機能を実現しました。約6ヶ月の取り組みにより、検索における0件ヒットを90%削減し、検索経由の予

AWS, 機械学習, 形態素解析, インフラ, テスト, アーキテクチャ, 大規模言語モデル（LLM）, 組み込み

AWS

2025年12月18日

「AIでさがす」サービスのリニューアル - BUYMA内記事コンテンツをベースにした商品提案エージェントの実現

こんにちは、AIテクノロジーグループのエンジニアの吉田です。本記事は Enigmo Advent Calendar 2025 の 18日目の記事です。普段は検索システム全般、機械学習システムのMLOps、AI関連の機能開発を担当しております。この記事では「AIでさがす」サービスのリニューアルについて紹介します。「AIでさがす」サービスとは「AIでさがす」サービスは、 BUYMA のWebサイトおよびアプリで提供している、AIを活用した商品提案サービスです。実際の機能は以下からご利用頂け

形態素解析, 人工知能, フロントエンド, テスト, API, MeCab, Terraform, 設計, MLOps, ChatGPT

株式会社エニグモ

2025年10月17日

グローバルなメルカリの検索バックエンド設計と検索基盤拡充

こんにちは。検索領域でエンジニアをやっております、shinpeiです。本記事は連載企画：メルカリ初の世界共通アプリ「メルカリグローバルアプリ」の開発舞台裏の一環として、メルカリグローバルアプリの検索バックエンドをスクラッチで開発することに伴い、大事にした設計のポイントをご紹介します。また今回の新たな要求を契機に既存の検索基盤の拡充が必要だったのでそれについても書かせていただきました。グローバルアプリでの検索の要件と課題先日、弊社からの発表の通り、メルカリはグローバルアプリの提供を開始しました。

Elasticsearch, Go, Google Analytics, Java, Solr, 形態素解析, テスト, API, Microservices, GA4

株式会社メルカリ

2025年09月12日

メルカリハロのインターンで求人のリスク予測モデル作成・比較してみた

はじめに 2025年度のBuild@Mercariに参加し、メルカリハロのMLチームでインターンをしている＠Ariaと@Ririkoです。私たちはメルカリハロの求人のリスク予測に取り組みました。この記事では、インターンで取り組んだこと・感想などについて書いていきたいと思います！自己紹介＠Aria こんにちは！大学１年の＠Ariaです。私は高校生の時Build@Mercariに参加し、夏休みでBuildインターンをしています！機械学習・AIについて学んでみたいと思い、メルカリハロのMLに応募しました

アルゴリズム, 機械学習, キャリア, 形態素解析, ネットワーク, GPU, 統計, 大規模言語モデル（LLM）, データサイエンス, 組み込み

株式会社メルカリ

2025年09月01日

エンティティリンキングの性能改善のための効果的な絞り込み手法の検証

はじめまして！一橋大学SDS研究科修士1年の佐藤祥太 ( @Shota_Sato01 ) です。今回私は8月のCA Tech JOBインターンに参加させていただきました！この記事では、配属先のAI Shiftでの取り組みについてご紹介させていただきます！配属部署について今回のインターンでは、AI Shiftに配属になりました。「人とAIの協働を実現し人類に生産性革命をもたらす」というMISSIONのもと、AIエージェントやVoiceBotの開発に取り組んでいます。ビジネスサイドとエンジニアサイ

機械学習, 形態素解析, 人工知能, MeCab, 大規模言語モデル（LLM）

株式会社AI Shift（株式...

2025年08月20日

ニューラル機械翻訳の研究動向　【連載】自然言語処理の研究動向　第2回

ニューラル機械翻訳の研究動向　【連載】自然言語処理の研究動向　第2回 2025.8.19 株式会社Laboro.AI　リードMLリサーチャー　趙心怡リードマーケター　熊谷勇一英語版（English version）はこちら。概　要 2017年以降、ニューラル機械翻訳（Neural Machine Translation, NMT）においてTransformerアーキテクチャが主流となり、XLM（Cross-lingual Language Model）、mBART（Multilingual

機械学習, 自然言語処理, 形態素解析, ネットワーク, OSS, アーキテクチャ, 設計, ChatGPT, 統計, 大規模言語モデル（LLM）

Laboro.AI

2025年08月20日

ニューラル機械翻訳の研究動向　【連載】自然言語処理の研究動向　第2回

ニューラル機械翻訳の研究動向　【連載】自然言語処理の研究動向　第2回 2025.8.19 株式会社Laboro.AI　リードMLリサーチャー　趙心怡リードマーケター　熊谷勇一概　要 2017年以降、ニューラル機械翻訳（Neural Machine Translation, NMT）においてTransformerアーキテクチャが主流となり、XLM（Cross-lingual Language Model）、mBART（Multilingual BART）、mT5（Multilingual T5）といっ

機械学習, 自然言語処理, 形態素解析, ネットワーク, OSS, アーキテクチャ, 設計, ChatGPT, 統計, 大規模言語モデル（LLM）

Laboro.AI

2025年08月18日

Elasticsearchの bbq_hnsw を使ったベクトル検索（実践編）

目次はじめに対象読者対象バージョン検索の準備 1. インデックスの作成 2. インデックスのマッピング設定 3. モデルの準備 4. インジェストパイプラインの作成 5. インジェストパイプラインの確認 6. データの登録 6.1 NDJSONの用意 6.2 一時インデックスへのアップロード 6.3 _reindexの実行 6.4 タスクの完了確認 6.5 _refreshの実行登録データのストレージ利用量確認ベクトル検索の実行 rescore_vector を行わないベクトル検索 resco

Elasticsearch, Kibana, Linux, 形態素解析, 初心者

サイオステクノロジー((DXS...

2025年07月15日

日本語アナライザーの比較：Kuromoji・Sudachi・MeCab・Janome・LLMの性能検証

Elasticsearchの標準アナライザーは  Kuromoji  ですが、他にも日本語向けのアナライザーが存在します。本記事では  Sudachi  や  MeCab 、およびPythonライブラリの  Janome 、そして  LLM（GPT-4）  といった選択肢を比較し、どんな場面でどれを使うべきかを検討しました。なお、Elasticsearch 9.xではSudachiやMeCabの公式対応プラグインはまだリリー

Elasticsearch, Python, 形態素解析, テスト, API, MeCab, macOS, 統計, 大規模言語モデル（LLM）

サイオステクノロジー((DXS...

2025年07月07日

Elasticsearchでの外部のEmbed Modelを使った密ベクトル検索

目次はじめに対象読者環境 Elasticsearch同梱モデル vs 外部モデル Elasticsearch同梱の Model を利用する場合 Elasticsearchの外部のEmbed Modelを利用する場合比較表 Elasticsearchで密ベクトル生成に利用可能なサービス準備 Cohere API Key の取得 Machine Learning インスタンス /_inference/text_embedding/用エンドポイントの作成インデックスの作成マッピングの作成ドキュメ

Elasticsearch, Kibana, プログラミング, Linux, 形態素解析, API

サイオステクノロジー((DXS...