「大規模言語モデル(LLM)」に関連する技術ブログ

企業やコミュニティが発信する「大規模言語モデル(LLM)」に関連する技術ブログの一覧です。

Amazon SageMaker JumpStartによるエンドポイントデプロイのベンチマークと最適化

大規模言語モデル (LLM) をデプロイする場合、機械学習 (ML) の担当者は通常、モデルサービングのパフォーマンスの 2 つの測定値に注目します。1 つ目は 1 トークンの生成にかかる時間で定義されるレイテンシー、二つ目は 1 秒あたりに生成されるトークンの数によって定義されるスループットです。デプロイされたエンドポイントへの単一のリクエストは、モデルレイテ

AWS Marketplace の Pinecone を Amazon Bedrock のナレッジベースとして利用する

By Kazuki Motohashi, Ph.D., Partner Solutions Architect, AI/ML – AWS Japan  By Yuji Arakawa, Sr. Enterprise Architect, Partner Core Tech – AWS Japan 本稿では、スケーラブルでありながらもコスト効率に優れる Pinecone serverless ベクトルデータベースを Amzon Bedrock のナレッジベースとして利用することでビジネスが生成 AI による新しい体験を迅速にユーザーへ届けることができることを紹介します。RAG

言語処理学会第30回年次大会(NLP2024) でAI Shiftから3件の発表を行います

こんにちはAI Shiftの栗原です。3月11日(月)から3月15日(金)に 神戸国際会議場 で 言語処理学会年次大会 が実施され、AI Shiftからは口頭発表1件とポスター発表2件の合計3件の発表を行います。 本記事では各発表の概要と、ポスター発表については議論したいポイントについて取り上げたいと思います。 1. AI Shiftからの発表 3月12日(火) 18:00-19:30 P5-5 RAGにおけるLLMの学習と評価:F

基盤モデル開発に挑む各社が成果を共有。AWS LLM 開発支援プログラム 成果発表会

アマゾン ウェブ サービス ジャパン(以下、AWS ジャパン)は 2023 年 7 月 3 日に、日本独自の施策として国内に法人または拠点を持つ企業・団体の生成 AI 基盤モデル・大規模言語モデル(以下、LLM)の開発を支援する AWS LLM 開発支援プログラム を発表しました。 本プログラムでは、LLM 開発を行うための計算機リソース確保に関するガイダンスや AWS 上での LLM 事前学習に

Vertex AI の LLM 自動評価ツール AutoSxS(automatic side-by-side) 使ってみた!

1. はじめに こんにちは、クラウドエース データソリューション部所属の泉澤です。 クラウドエースの IT エンジニアリングを担うシステム統括部の中で、特にデータ基盤構築・分析基盤構築からデータ分析までを含む一貫したデータ課題の解決を専門とするのがデータソリューション部です。 データソリューション部では活動の一環として、毎週 Google Cloud の新規リリー

ハイブリッド検索の威力を検証!Knowledge Bases for Amazon Bedrock

サーバーワークスの村上です。 2024年3月1日のアップデートでKnowledge Bases for Amazon Bedrockがハイブリッド検索に対応しました。 以前にも「RAGの主役は生成AIではなく検索システムだ」というブログで検索の重要性を書いていますが、今回ハイブリッド検索が追加されたことで、あらためて検索の違いによるLLMの回答差異を検証してみたいと思います。 blog.serverworks.co.jp やった

OWASP Top 10 for LLM を活用した生成 AI アプリケーションの多層防御セキュリティ設計

大規模言語モデル (LLM) を中心に構成された生成 AI (人工知能) アプリケーションは、ビジネスに経済的価値を生み出し、さらに加速する可能性を示してきました。アプリケーションの例には、 会話型検索 、 カスタマーサポートエージェントアシスト 、 カスタマーサポート分析 、 セルフサービス仮想アシスタント 、 チャットボット 、 リッチメディア生成 、 コンテン

32,000トークン対応の商用利用可能な日本語チャットモデル CyberAgentLM2 をワンクリックで FineTune とデプロイ

生成 AI の発展と共にモデルの規模はどんどん大きくなり、デプロイするためのインフラの選択や設定はますます複雑になっています。 Amazon SageMaker JumpStart は大規模言語モデルを最適な設定、かつワンクリックでデプロイする機能を提供します。 オープンソースコミュニティとの連携を通じ 、AWS はこれまで Meta の Llama2 や TII の Falcon 、 rinna の japanese-gpt-neox などを JumpStart

【Dialogflow】新機能 カスタム要約プロンプトとは?

はじめに こんにちは、クラウドエース データソリューション部所属の ジェスター です。 データソリューション部 では、Google Cloud が提供しているデータ領域のプロダクトについて、新規リリースをキャッチアップするための調査報告会を毎週実施しています。 新規リリースの中でも、特に重要と考えるリリースを記事としてまとめ、本ページのように公開しています。

Amazon OpenSearch Service の検索機能強化: 2023年のまとめ

これまでの年月を経て、ユーザーが検索エンジンに期待するものは進化してきました。ほとんどのユーザーにとって、迅速に文字通りに関連性の高い結果を返すだけでは、もはや十分とはいえません。今では、ユーザーは意味的理解を通じてさらに関連性の高い結果を取得したり、メタデータのテキスト検索ではなく画像の視覚的類似性を通じて検索することを可能にす

イノベーションの解放: AWS と Anthropic が協力して生成 AI の限界を押し広げる (Amazon Bedrock で Anthropic Claude 3 が利用可能に)

Amazon Bedrock は、大規模言語モデル (LLM) やその他の基盤モデル (FMs) を使用した、生成 AI アプリケーションの構築およびスケーリングに最適なサービスです。お客様は Anthropic Claude のモデルなど、様々な高性能 FMs を活用して独自の生成 AI アプリケーションを構築できます。Anthropic が AWS 上での構築を初めて開始した 2021 年を振り返ると、Claude がこれほどの変革をもたらす

Mistral AI モデルが Amazon Bedrock で間もなく利用可能に

フランスに本拠を置く AI 企業である Mistral AI は、公開されているモデルを最先端のパフォーマンスに高めるというミッションを掲げています。同社は、チャットボットからコード生成まで、さまざまなタスクに使用できる高速かつ安全な大規模言語モデル (LLM) の作成を専門としています。 2 つの高性能 Mistral AI モデルである Mistral 7B と Mixtral 8x7B がまもなく Amazon Bedrock で

2024年2月のイチオシGoogle Cloudアップデート

G-gen の杉村です。2024年2月のイチオシ Google Cloud アップデートをまとめてご紹介します。記載は全て、記事公開当時のものですのでご留意ください。 はじめに Meet で参加者全員向けに画面のピン留めができるように Cloud Logging から Cloud Storage へのエクスポート Cloud Translation で Adaptive Translation が Preview => GA(Preview) Google Meet API が Preview => GA Google アカウントのログイン

生成 AI をセキュアにする : 生成 AI セキュリティスコーピングマトリックスの紹介

生成 AI は組織の想像力をかき立て、世界中のあらゆる規模の業界で顧客体験を変革しています。数十億パラメーターの大規模言語モデル (LLM) とトランスフォーマーによって促進された AI 機能の飛躍的な進歩により、新たな生産性の向上や創造的な能力などへの扉を開きました (訳者注 : トランスフォーマーについては以降本記事では扱いませんが、詳しく知りたい方は、

GPT-4によってメディアサイトの翻訳を実現!効率的な翻訳に至るまでの開発秘話

こんにちは、ZOZO NEXTでFashion Tech Newsの開発を担当している 木下 です。先日、弊社が運営するオウンドメディアのFashion Tech Newsにおいて英語版が公開されました。本記事では、機械翻訳サービスの比較検討、翻訳精度を向上するための調整、スムーズな翻訳を実現する仕組みについてご紹介します。比較検討の結果GPT-4を採用したため、GPT-4の本番運用を検討されている方の
技術ブログを絞り込む

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか?