「大規模言語モデル(LLM)」に関連する技術ブログ

企業やコミュニティが発信する「大規模言語モデル(LLM)」に関連する技術ブログの一覧です。

AWS Trainium、AWS Inferentia が AWS 上の Llama 3.1 モデルに高性能と低コストを提供

本日、 AWS Trainium と AWS Inferentia による Llama 3.1 モデルのファインチューニングと推論のサポートを発表できることを嬉しく思います。Llama 3.1 ファミリーは、8B(80億)、70B(700億)、405B(4,050億)サイズの事前学習およびインストラクションチューニング済みの多言語大規模言語モデル(LLM)のコレクションです。 以前の投稿 では、 Amazon SageMaker JumpStart で AWS Trainium と Infe

Vertex AI Searchの新方式Answer APIを解説

G-gen 又吉です。当記事では、2024年6月に GA した Vertex AI Search の最新検索方式である Answer API について紹介します。 はじめに RAG とは Vertex AI Search Answer API 概要 メリット クエリフェーズ クエリ言い換え クエリ簡素化 マルチステップ推論 クエリ分類 検索フェーズ 回答フェーズ フォローアップ検索(マルチターン検索) 概要 セッション サンプルコード コード Tips クエリ

生成 AI アプリケーションのデータベース選択における重要な考慮事項

2024 年 1 月 4 日、データベースの講義で知られる CMU の Andy Pavlo 教授が 2023 年のデータベースレビュー を公開しました。主にベクトルデータベースの台頭に焦点を当てたものです。こうした革新的なデータストレージソリューションが注目を集めています。生成人工知能 (AI) モデルの人気が高まり続ける中、ベクトルストレージと検索機能を備えたデータベースに関心が寄

jinjer 株式会社様の AWS 生成 AI 活用事例 「人事系 SaaS における人事問い合わせ AI 機能の開発」

本ブログは jinjer 株式会社様と Amazon Web Services Japan 合同会社が共同で執筆いたしました。 みなさん、こんにちは。AWS ソリューションアーキテクトの呉です 。 昨今、多くのお客様から生成 AI の活用についてご相談いただくようになりました。本記事では、 Amazon Bedrock と Amazon Kendra を活用した、RAG (Retrieval Augmented Generation) の事例をご紹介します 。 RAG は、大規模言語モデ

GENIAC における計算リソース提供者として AWS が選定されました

2024年7月16日、 開発事業者の公募が開始 された「 GENIAC (Generative AI Accelerator Challenge) 」における計算リソース提供者として、AWS が選定されました。 GENIAC は、 経済産業省 と 国立研究開発法人新エネルギー・産業技術総合開発機構 (NEDO) が推進する取り組みで、日本国内の生成 AI 基盤モデル開発力を底上げし、企業等の創意工夫を促すことを目的とするものです。今回の事

【事例】Gemini for Google Workspace を全社導入した理由と効果、そして乗り越えた壁

生成AI は莫大な学習データから新たな価値を生み出す そもそも、生成AIというのはどのような技術なのでしょうか。生成AIは、大量のデータを用いて新たなデータを生成する人工知能の技術を指します。この技術は、ディープラーニングと呼ばれる機械学習の一種を用いて、テキスト、画像、音声、動画などの新しいコンテンツを生成することができます。代表的な例とし

Amazon MemoryDB のベクトル検索を一般公開

7月10日、 Amazon MemoryDB のベクトル検索 の一般提供についてお知らせします。これは、インメモリパフォーマンスとマルチ AZ 耐久性を備えたリアルタイム機械学習 (ML) および 生成人工知能 (生成 AI) アプリケーションの開発用の新機能で、ベクトルの保存、インデックス作成、取得、検索に使用できます。 今回のリリースにより、Amazon MemoryDB は、Amazon Web Services (AWS) で人気

FastAPI で実装した API を、gcloud CLI で Cloud Run にデプロイする

AI事業本部 協業リテールメディア Div. の青見 (@nersonu) です。恐らく機械学習エン ...

Amazon Q Apps の一般公開を開始、独自の生成 AI アプリ構築が可能に

AWS では 2024 年 4 月に Amazon Q Business をリリースした際、 Amazon Q Apps のプレビュー版 もリリースしました。 Amazon Q Apps は、組織のデータに基づいて生成人工知能 (生成 AI) を利用したアプリケーションを作成するための、Amazon Q Business 内の機能です。ユーザーは自然言語を使用してアプリを構築し、それを組織のアプリライブラリに安全に公開して、誰もが使用できるように

Amazon Q Developer (IDE 内) をプライベートコードベースでカスタマイズ

7月10日、 Amazon Q Developer (IDE 内) のカスタマイズ機能をインラインコード補完で一般利用できるようにし、チャットのカスタマイズ機能のプレビューをローンチしました。 Amazon Q をカスタマイズして、IDE コードエディタとチャットにおいて、プライベートコードリポジトリから特定の推奨コードを生成できるようになりました。 Amazon Q Developer は人工知能 (AI) コーディング

Amazon Bedrock のエージェントがメモリ保持とコード解釈をサポートするようになりました (プレビュー中)

Agents for Amazon Bedrock を使用すると、 生成人工知能 (AI) アプリケーションはさまざまなシステムやデータソースにわたって多段階のタスクを実行できます。数か月前、エージェントの 作成と設定を簡素化しました 。7月10日、フルマネージド型の 2 つの新機能をプレビューで紹介します。 複数のインタラクションにわたってメモリを保持 – エージェントは各ユーザーとの会

【第二回】高校生が書く、生成AI基盤Dify入門

Dify連載2回目の記事です。 前回 に引き続き、つきみがお送りいたします。 さて、前回ではDifyの初期設定とLLMのセットアップをしましたので、次はDifyを使い、簡単にAIを搭載したサービスを作っていきます。 そもそもDifyで何ができるのか? Difyは高度なプログラミングスキルや、応用的な数学の知識をあまり必要としないで、AIを使って自分好みにカスタマイズすること

【寄稿】AI民主化に向けた丸紅の取組

こんにちは。ソリューションアーキテクトの齋藤です。丸紅株式会社(以下、丸紅) デジタル・イノベーション部 では、デジタルを活用して丸紅グループの変革を推進し、デジタル人財を育成して各部門の事業を大きくしていくことをミッションに掲げています。当部では、デジタル技術に精通するメンバーが、丸紅の各組織へ、課題整理→実証実験→実用化まで一気通貫

AWS Weekly Roundup: Amazon S3 Access Grants、AWS Lambda、European Sovereign Cloud リージョンなど (2024 年 7 月 8 日)

7月1日週の月曜日以来の AWS ニュースは 21 件しかなく、そのほとんどは既存のサービスと機能のリージョンレベルの拡張に関するものでした。比較的静かな 1 週間をお過ごしいただけたのではないでしょうか。7月8日週はたくさんお知らせすることがあります。 7月8日週は、7 月 10 日 (水) に Jacob Javits Convention Center で開催される AWS Summit New York にお客様とパートナーをお迎

AWS Weekly Roundup: Amazon Bedrock での AI21 Labs の Jamba-Instruct、Amazon WorkSpaces Pools など (2024 年 7 月 1 日)

AWS Summit New York まであと 10 日です。新しい発表と 170 以上のセッションをとても楽しみにしています。サミット終了後、 A Night Out with AWS イベントが開催されます。このイベントは、 Amazon Web Services (AWS) の既存のお客様、またはビジネスで AWS クラウドサービスを利用することに強い関心を持っているメディア、エンターテインメント、ゲーム、スポーツ業界の専門家を対象
技術ブログを絞り込む

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか?