「大規模言語モデル(LLM)」に関連する技術ブログ

企業やコミュニティが発信する「大規模言語モデル(LLM)」に関連する技術ブログの一覧です。

【Gemini-1.5-Pro】マルチモーダルLLMを使って動画検索してみた

こんにちは、クラウドエース SRE ディビジョン所属の茜です。 今回は、マルチモーダル LLM として注目されている Gemini-1.5-Pro を使用して、自然言語での動画検索が可能な簡易的なアプリケーションを作成します。 マルチモーダル LLM とは マルチモーダル LLM (Large Language Model) は、テキストだけでなく、画像、音声、動画などの複数のモダリティのデータを理解し、処理する

Audio-Mambaを使った音声分類

こんにちは、AIチームの戸田です 今回は近年Transformerの次のアーキテクチャになるのでは?と話題の状態空間モデル、Mambaを使った音声分類を試してみたいと思います。 Mamba Mambaは近年主流となっているTransformerの次のアーキテクチャとして期待されているモデルの一つです。LLMの文脈で目にすることが多いのですが、音声を扱う Audio-Mamba や、画像を扱う Vision-Mamba などの

【徹底解説】Document Intelligenceを利用してRAGを構築する【セマンティックチャンキング】

こんにちは、サイオステクノロジー の佐藤 陽です。 今日は Azure の AI サービスである Document Intelligence を利用した RAG システムを構築してみたいと思います。 PDF データを独自データとした RAG を構築したい! Document Intelligence とか Azure AI Search ってどうやって使うの? セマンティックチャンキングって何? といった方は最後までご覧ください! はじめに こちらの サンプ

Amazon SageMaker JumpStart で ELYZA の日本語 LLM をワンクリックデプロイ

生成 AI アプリケーションの構築には、適切な日本語大規模言語モデル (LLM) の選定と活用が不可欠です。AWS では Amazon Bedrock , Amazon SageMaker JumpStart , AWS Marketplace でさまざまな基盤モデル (Foundation Model; FM) および大規模言語モデル (Large Language Model; LLM) を提供しています。最近、日本のスタートアップ企業である ELYZA の日本語 LLM が SageMaker JumpStart に掲載され、AWS 環境へワン

2024 年 6 月第 3 週の Google Cloud の主なリリースに関するニュース

6 月 10 日 〜 6 月 14 日の期間にアナウンスされた Google Cloud の主なリリースに関してご紹介します。 ! 該当日の全ての情報を掲載しているものではございません。すべてのリリースノートを確認されたい方は、当該ページからご確認ください。 Virtual Private Cloud (VPC) Private Service Connect Port Mapping(Preview) 単一の Private Service Connect エンドポイントを介すことにより、コン

株式会社ナウキャスト様の AWS 生成 AI 事例:決算短信データ抽出業務における LLM 業務適用

本稿は株式会社ナウキャスト データ & AI ソリューション事業部 事業責任者 片山 燎平様と Amazon Web Services Japan ソリューションアーキテクト 宮﨑の共同執筆です。LLM の業務活用に取り組まれる方の参考となれば幸いです。また、今回内容を含む 講演動画 も公開されておりますので、ご興味をお持ち頂けましたらあわせてご覧ください。 == 株式会社ナウキャスト では PO

コードとブログの両方を効率的にレビューする仕組みについて:PR-Agent(Amazon Bedrock Claude3)の導入

こんにちは。 DBRE チーム所属の @hoshino です DBRE(Database Reliability Engineering)チームでは、横断組織としてデータベースに関する課題解決や、組織のアジリティとガバナンスのバランスを取るためのプラットフォーム開発などを行なっております。DBRE は比較的新しい概念で、DBRE という組織がある会社も少なく、あったとしても取り組んでいる内容や考え方が異なるような

AWS で構築する生成 AI マーケティングポータル

はじめに このシリーズの前回の記事で、私たちは「 生成 AI のマーケティング戦略への適用: 入門編 」でマーケティング戦略に対する 生成 AI の変革的な影響を検討し、「 From Prompt Engineering to Auto Prompt Optimisation 」で Amazon Bedrock などのサービスを使用してマーケティングコンテンツの作成を強化するプロンプトエンジニアリングの複雑さを掘り下げました。 また、大規模

生成 AI のマーケティング戦略への適用: 入門編

このブログは一連のブログ記事の一部です。以下もご覧ください。 AWS のサービスとマイクロサービスアーキテクチャを使用して 生成 AI マーケティングポータルを構築する方法の実践的な解説については、以下のリンクを参照してください。   AWSで構築する生成 AI マーケティングポータル はじめに 人工知能 (AI) は疑いなく多くの業界を形作り、21 世紀における最も

CVPR 2024 技術動向調査: Best Paper Award Candidates まとめ

はじめに CVPR2024は、コンピュータビジョンとパターン認識の分野における最前線の研究成果を集める国際会議です。今年の論文提出数は11532件で、昨年のCVPR2023から26%の増加を記録しました。その中で採択されたのは2719件、採択率は23.6%です。この中から特に優れた24件の論文が Best Paper Award 候補として選出されました。 本記事では、これらのアワード候補となった論文

週刊AWS – 2024/6/3週

みなさん、こんにちは。ソリューションアーキテクトの根本です。 今週も 週刊AWS をお届けします。 いよいよ AWS Summit Japan が来週に迫ってきました。2024年6月20日、21日、会場は幕張メッセになります。ご都合つく方は是非会場にいらしてください。 私も会場に行く予定なので、見かけたら遠慮なくお声がけください! それでは、先週の主なアップデートについて振り返

社内ナレッジ活用のためのRAG基盤のPoCを行いました

この記事は every Tech Blog Advent Calendar 2024(夏) 10 日目の記事です。 はじめに こんにちは。DELISH KITCHEN 開発部の村上です。 エブリーでは4月に第4回挑戦weekを実施しました。挑戦week5日間の中で私たちのチームはナレッジ活用のために社内ChatAppに社内ドキュメントを参照できる仕組みづくりに取り組みを行いました。今回はその中でRAG基盤のPoCを行ったので、その取り組みにつ

kotoba-whisper, ReazonSpeech, Nue-ASRの文字起こし性能を比較してみた

はじめに こんにちは、AIチームの大竹です。 最近、高性能な日本語音声認識モデルのリリースが相次いでいます。普段、音声認識を用いたプロダクト開発をしている中で、各モデルの音声認識性能や推論速度がどれくらいのものなのか気になったので簡単な実験をして性能を比較してみました。 書き起こしや評価周りの実装も記載しているので参考にしていただけたら幸

もう不気味じゃない!? MetaHumanでリアルなVTuberを始めよう

はじめに こんにちは、テリーです。毎週のように新しいAI技術とサービスが発表されて、「我こそは世界一」と聞こえる群雄割拠の時代が続いています。特にLLM(大規模言語モデル)はモデルが多数公開されて、どれを使うのがよいか悩 […]

【開催報告】生成 AI の価値を最大限に引き出すためのデータ基盤

2024年5月16日にオンラインセミナー「生成 AI の価値を最大限に引き出すためのデータ基盤」を開催いたしました。セミナーの開催報告として、ご紹介した内容や、当日の資料・収録動画などを公開いたします。 はじめに 生成 AI の力を最大限に引き出すためには、日頃生み出しているビジネスデータを格納した強力なデータ基盤が必要不可欠です。既存の生成 AI モデルを
技術ブログを絞り込む

TECH PLAY でイベントをはじめよう

グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか?