【報道発表】自然言語処理技術BERTモデルをベースとする100言語対応の自動テキスト要約ソリューション

トレンド
深層学習モデルをベースとする多言語対応の自動テキスト要約ソリューション
【報道発表】自然言語処理技術BERTモデルをベースとする100言語対応の自動テキスト要約ソリューション

自然言語処理技術BERTモデルをベースとする100言語対応の
自動テキスト要約ソリューションを2020年2月から提供開始

-「ClassCat(R) Text Summarizer Multilingual Edition」-

 株式会社クラスキャット (代表取締役社長:佐々木規行、茨城県取手市) は、深層学習モデルをベースとする多言語対応の自動テキスト要約ソリューション「ClassCat(R) Text Summarizer Multilingual Edition」を2020年2月から提供開始することを発表致しました。

対応可能な言語は日本語と英語を中心におよそ100言語に渡り、重視する言語の要約品質をあげるためにチューニングすることも可能です。BERTと呼称される自然言語処理技術を応用しており、実装は標準的な深層学習フレームワークの最新版TensorFlow 2.1とPyTorch 1.3 を利用しています。

自動テキスト要約は人工知能による自然言語処理の伝統的な目標タスクですが、現代ではインターネット上で膨大なドキュメントが溢れる中、タスクの重要性が増して多くの現実的なメリットがあります。必要なドキュメントの選択を容易にするだけでなく、人間のテキスト要約よりもバイアスがかからず偏りがないという優位点もあります。

自動テキスト要約は一般に抽出型と抽象型に分けられますが、本製品は文を選択する抽出型に該当しドキュメント管理システムとして利用することも可能です。

本製品「ClassCat(R) Text Summarizer Multilingual Edition」は多言語に対応しています。対応可能な言語はおよそ 100 言語に渡りますが、英語と日本語については最先端モデルの適用や語彙の充実により要約品質を高めています。他の言語についてもクライアントが望まれる言語についてチューニングすることが可能です。

本製品「ClassCat(R) Text Summarizer Multilingual Edition」はBERT (Transformer からの双方向エンコーダ表現) と呼称される最新の自然言語処理技術やその改良版である RoBERTaをベースとするモデルを採用しており、高品質なテキスト要約が可能になっています。
モデル実装は深層学習フレームワークのデファクトスタンダードであるTensorFlow 2.1と PyTorch 1.3を利用しています。
※ BERTは “Bidirectional Encoder Representations from Transformers” の略称です。

本製品「ClassCat(R) Text Summarizer Multilingual Edition」の動作環境はマルチクラウドに対応しています。各種パブリッククラウド Amazon EC2、Microsoft Azure、IBM Cloud、Google Cloud Platform 上のインスタンスやベアメタルで提供されます。
GPU装備が推奨されますが、CPUのみのインスタンスでも動作可能です。

【製品販売概要】
・製品名:ClassCat(R) Text Summarizer Multilingual Edition
・販売時期:2020年02月03日
・販売形態:直接販売・販売パートナー経由・OEM
・販売価格:オープンプライス

【動作環境】
・OS:Ubuntu Server 18.04 LTS
・ハードウェア:各種パブリッククラウドの仮想サーバ、ベアメタルサーバ
※GPU推奨(CPU onlyでも動作可)

◆ お問合せ ◆
本件に関するお問い合わせ先は下記までお願いいたします。
株式会社クラスキャット
〒300-1525 茨城県取手市桜ヶ丘 4-48-7 (AI LAB)
セールス・マーケティング本部 セールス・インフォメーション

・E-Mail:sales-info@classcat.com
・WebSite:http://www.classcat.com/
・Facebook:https://www.facebook.com/ClassCatJP/

※ClassCat は株式会社クラスキャットの登録商標です。
※その他、記載されている会社名・製品名は各社の登録商標または商標です。

おすすめのコラム