「GPU」に関連する技術ブログ

LLMで英会話の練習をしたい

2024/02/16

皆さん、お疲れ様です。ニフティ基幹システムグループの山田（山田一族）です。突然ですが、皆さんも昔は英語を話せるようになりたいと思っていませんでしたか？私も昔はそう思っていた時期がありました。英語を話せるようになりたいと思って、かれこれ8年ぐらいは通勤時の電車内で BBC放送のpodcastを聞いています。ですが一向に英語を話せるようにはなりませ

Bot, GPU, 大規模言語モデル（LLM）

AWS における生成 AI インフラストラクチャ

2024/02/07

ブックマーク

この記事は、 Generative AI Infrastructure at AWS を翻訳したものです。生成 AI モデルの構築やトレーニング、そして正確で洞察に満ちた出力の予測と提供には、大規模なインフラストラクチャを必要とします。大規模言語モデル（LLM）や基礎モデル（FM）が生成する高品質の合成テキスト、画像、その他のメディアの出力には、大量のデータが必要です。まず、モデルのトレー

AWS, 人工知能, GPU

Kubeflow Pipelines の local 実行で開発効率を上げる

2024/02/01

ブックマーク

はじめに AI Team MLOps エンジニアの西原です。2024 年 1 月にローカル環境で Kubeflow Pipelines を実行するドキュメントが公式から公開されました。今回はそのドキュメントを参考にローカル環境で Kubeflow Pipelines を実行する方法を紹介します。はじめに Kubeflow Pipelines とは kfp を使った開発の課題 kfp を手元の開発環境で実行するローカル環境でコンポーネント実行アーティフ

Python, 機械学習, GPU

AWS上の高度運転支援システム（ADAS）のためのモジュラー機能設計

2024/01/31

ブックマーク

このブログは、 Modular functions design for Advanced Driver Assistance Systems (ADAS) on AWS を翻訳したのものです。過去 10 年間で、多くのプレイヤーがディープニューラルネットワーク（DNN）を使った自動運転車（AV）システムを開発してきました。これらのシステムはシンプルなルールベースのシステムから進化し、先進運転支援システム（ADAS）や完全な自動運転車へと変わってきて

AWS, GPU, 3D

AWS上の高度運転支援システム（ADAS）のためのモジュラー機能設計

2024/01/31

ブックマーク

このブログは、 Modular functions design for Advanced Driver Assistance Systems (ADAS) on AWS を翻訳したのものです。過去 10 年間で、多くのプレイヤーがディープニューラルネットワーク（DNN）を使った自動運転車（AV）システムを開発してきました。これらのシステムはシンプルなルールベースのシステムから進化し、先進運転支援システム（ADAS）や完全な自動運転車へと変わってきて

AWS, GPU, 3D

日本語CLIP 学習済みモデルと評価用データセットの公開

2024/01/29

ブックマーク

はじめに基盤モデルがAIの新潮流となりました。基盤モデルというとやはり大規模言語モデルが人気ですが、リクルートでは、画像

TensorFlow, テスト, GPU

必要なぶんだけ GPU を使いたい。Kubernetes でやってみよう

2023/12/19

ブックマーク

こんにちは、ホシイです。貧乏性なので、仕事中はたいてい費用のことを考えています。今回は、機械学習インフラにも関連する記事です。AI に関しては SQUARE ENIX AI 技術ブログもありますので、ご興味がありましたらぜひご覧ください！ GPU をお安く、好きなときに好きなだけ利用したい AI の話題花盛りの昨今、アプリケーションで GPU を利用する機会も増えてきまし

Google Cloud, Kubernetes, GPU

llama.cpp の動かし方と量子化手法

2023/12/17

ブックマーク

はじめに Turingアドベントカレンダー17日目です！今日は Research チームの柏谷が担当します。 Research チームでは、LLMによる完全自動運転を実現するための技術開発を行っています。その中で重要な技術の１つが量子化です。量子化によって少ビットでパラメータを表現できれば、LLM の膨大なパラメータのデータ圧縮が可能となります。量子化実装はいろいろと考えられま

C言語, Windows, 機械学習, GPU, ハードウェア, 大規模言語モデル（LLM）

AWS Inf2の導入による音声感情認識の爆速化とコスト削減

2023/12/15

ブックマーク

こんにちは、 RevComm Research Dept. Development Groupの id:tmotegi です。趣味は積読と日本酒を嗜んでおります。昨日は仙禽の雪だるまを飲みました。現世で2度目のアドベントカレンダーなので緊張します。この記事は RevComm Advent Calendar 2023 、15日目の記事です。昨日の記事は豊崎さんによる「 CodemagicでFlutterアプリをビルドする」でした。私達のチームは、チームトポロジー

AWS, Deep Learning, GPU

アニメーションでDeepSpeed (ZeRO1)の仕組みを完全に理解する

2023/12/14

ブックマーク

Turingのリサーチチームで完全自動運転の研究開発を行なっている棚橋です。Turingアドベントカレンダー14日目の記事として、DeepSpeedについて取り上げます。 DeepSpeedはMicrosoftによって開発されたライブラリで、一言で言うと、「1つのGPUに乗り切らないような巨大MLモデルをなんとか学習させるため」のツールです。特に、この論文で提案されているDeepSpeedのZero Redundancy Optimiz

GitHub, Python, GPU, 大規模言語モデル（LLM）

サイバーエージェントの生成AI開発を支える機械学習基盤

2023/12/12

ブックマーク

この記事は CyberAgent Developers Advent Calendar 2023 1 ...

Ansible, GPU, 大規模言語モデル（LLM）

大規模言語モデルの事前学習知見を振り返る

2023/12/03

ブックマーク

はじめに Turing 株式会社のリサーチチームでインターンをしている東京工業大学横田研究室B4の藤井(@okoge_kaz)です。 2022年11月末にChatGPTがリリースされてから早1年、2023年は大規模言語モデル開発の領域において飛躍の１年となりました。国内でもCyberAgent, PFN, ELYZAを筆頭に3B〜13B程度のモデルが多数公開され、多くの方にとってLLMが身近になった1年であったかと思われます

GitHub, 機械学習, HTML, GPU, アーキテクチャ, ハードウェア, ChatGPT, 大規模言語モデル（LLM）

音声処理系国際会議INTERSPEECH・SSW出張レポート

2023/11/16

ブックマーク

RevComm Research の加藤集平です。8月下旬に音声処理のトップカンファレンスである INTERSPEECH で発表するため、また引き続いて行われた ISCA Speech Synthesis Workshop (SSW) に参加するためにヨーロッパに出張をしてきました。今回の記事では、INTERSPEECH, SSWおよび私の発表について紹介いたします。 INTERSPEECH 会議の概要 International Speech Communication Association (ISCA) が主催する国際会議で

ワークショップ, GPU, CS

AWS Weekly Roundup—短時間の ML ワークロードのために GPU 容量を確保、Finch は GA、その他—2023 年 11 月 6 日

2023/11/16

ブックマーク

2023年も終わりを迎え、クリスマスまであと 50 日、AWS re:Invent まであと 21 日! ラスベガスにいるなら、私に挨拶しに来てください。私はほとんどの時間、Serverlesspresso のブースにいます。 10月30日週のリリース 10月30日週のリリースの中から、私の目に留まったリリースをいくつかご紹介します。 Amazon EC2 – Amazon EC2 は ML 向けキャパシティブロックを発表しました。これは、

AWS, GPU, macOS

LLMで英会話の練習をしたい

AWS における生成 AI インフラストラクチャ

Kubeflow Pipelines の local 実行で開発効率を上げる

AWS上の高度運転支援システム（ADAS）のためのモジュラー機能設計

AWS上の高度運転支援システム（ADAS）のためのモジュラー機能設計

日本語CLIP 学習済みモデルと評価用データセットの公開

最新の自動運転研究 in NeurIPS2023

必要なぶんだけ GPU を使いたい。Kubernetes でやってみよう

llama.cpp の動かし方と量子化手法

AWS Inf2の導入による音声感情認識の爆速化とコスト削減

アニメーションでDeepSpeed (ZeRO1)の仕組みを完全に理解する

サイバーエージェントの生成AI開発を支える機械学習基盤

大規模言語モデルの事前学習知見を振り返る

音声処理系国際会議INTERSPEECH・SSW出張レポート

AWS Weekly Roundup—短時間の ML ワークロードのために GPU 容量を確保、Finch は GA、その他—2023 年 11 月 6 日

アクセス数ランキング

レバレジーズの機械学習エンジニアの1年を振り返る

社内プロダクトにHono🔥を採用した話

Google CloudとGitHub Actions(Terraform)を連携するDirect Workload Identityを作成するbashスクリプト

【RAG評価手法】評価できないものは改善できない！？体系的に評価指標をご紹介！

本番環境で発生したAurora MySQL 3 系のデッドロックの原因を調査した話

タグから技術ブログをさがす

ソフトウェア開発

プログラミング

領域

TECH PLAY でイベントをはじめよう