「GPU」に関連する技術ブログ

全 291 件中 211 - 225 件目

2024年02月07日

この記事は、 Generative AI Infrastructure at AWS を翻訳したものです。生成 AI モデルの構築やトレーニング、そして正確で洞察に満ちた出力の予測と提供には、大規模なインフラストラクチャを必要とします。大規模言語モデル（LLM）や基礎モデル（FM）が生成する高品質の合成テキスト、画像、その他のメディアの出力には、大量のデータが必要です。まず、モデルのトレーニングに使用されるデータセットには、一般的に 10 億個ほどの変数（パラメータ）が含まれています。このペタバイ

AWS, 人工知能, GPU

AWS

2024年02月01日

Kubeflow Pipelines の local 実行で開発効率を上げる

はじめに AI Team MLOps エンジニアの西原です。2024 年 1 月にローカル環境で Kubeflow Pipelines を実行するドキュメントが公式から公開されました。今回はそのドキュメントを参考にローカル環境で Kubeflow Pipelines を実行する方法を紹介します。はじめに Kubeflow Pipelines とは kfp を使った開発の課題 kfp を手元の開発環境で実行するローカル環境でコンポーネント実行アーティファクトを出力任意のコンテナイメージを使ったコ

Python, 機械学習, GPU

キャディ株式会社

2024年01月31日

AWS上の高度運転支援システム（ADAS）のためのモジュラー機能設計

このブログは、 Modular functions design for Advanced Driver Assistance Systems (ADAS) on AWS を翻訳したのものです。過去 10 年間で、多くのプレイヤーがディープニューラルネットワーク（DNN）を使った自動運転車（AV）システムを開発してきました。これらのシステムはシンプルなルールベースのシステムから進化し、先進運転支援システム（ADAS）や完全な自動運転車へと変わってきています。これらのシステムはペタバイト規模のデータと数千

AWS, GPU, 3D

AWS

2024年01月31日

AWS上の高度運転支援システム（ADAS）のためのモジュラー機能設計

AWS, GPU, 3D

AWS

2024年01月29日

日本語CLIP 学習済みモデルと評価用データセットの公開

はじめに基盤モデルがAIの新潮流となりました。基盤モデルというとやはり大規模言語モデルが人気ですが、リクルートでは、画像

TensorFlow, テスト, GPU

株式会社リクルート

2023年12月24日

最新の自動運転研究 in NeurIPS2023

TuringでResearcherをしているいのいちです。先日、会社にサポートしていただいてニューオーリンズで開催されたNeurIPS 2023に参加させていただくことができたので、今年のNeurIPSで発表された自動運転系の論文をいくつかピックアップして紹介しようと思います。 NeurIPSとは NeurIPSは1987年から開かれている機械学習系でトップの国際会議です。この会議が発足した当初はBiologicalとArtificialの両方の側面からニューラルネットワークを研究しようという趣旨があり

GitHub, アルゴリズム, 機械学習, 人工知能, ネットワーク, API, GPU, アーキテクチャ, 設計, ChatGPT

チューリング

2023年12月19日

必要なぶんだけ GPU を使いたい。Kubernetes でやってみよう

こんにちは、ホシイです。貧乏性なので、仕事中はたいてい費用のことを考えています。今回は、機械学習インフラにも関連する記事です。AI に関しては SQUARE ENIX AI 技術ブログもありますので、ご興味がありましたらぜひご覧ください！ GPU をお安く、好きなときに好きなだけ利用したい AI の話題花盛りの昨今、アプリケーションで GPU を利用する機会も増えてきました。GPU の用途もいろいろとありますが、最近でわたし周辺の需要として特に多いのは、機械学習です。ざっくり言うとタスクに対してパラ

Google Cloud, Kubernetes, GPU

株式会社スクウェア・エニックス

2023年12月17日

llama.cpp の動かし方と量子化手法

はじめに Turingアドベントカレンダー17日目です！今日は Research チームの柏谷が担当します。 Research チームでは、LLMによる完全自動運転を実現するための技術開発を行っています。その中で重要な技術の１つが量子化です。量子化によって少ビットでパラメータを表現できれば、LLM の膨大なパラメータのデータ圧縮が可能となります。量子化実装はいろいろと考えられますが、今回は実装にアクセス可能な llama.cpp とその量子化技術について見ていきましょう！ llama.cpp とは Geo

C言語, Windows, 機械学習, GPU, ハードウェア, 大規模言語モデル（LLM）

チューリング

2023年12月15日

AWS Inf2の導入による音声感情認識の爆速化とコスト削減

こんにちは、 RevComm Research Dept. Development Groupの id:tmotegi です。趣味は積読と日本酒を嗜んでおります。昨日は仙禽の雪だるまを飲みました。現世で2度目のアドベントカレンダーなので緊張します。この記事は RevComm Advent Calendar 2023 、15日目の記事です。昨日の記事は豊崎さんによる「 CodemagicでFlutterアプリをビルドする」でした。私達のチームは、チームトポロジーのイネイブリングチームに相当す

AWS, Deep Learning, GPU

株式会社RevComm

2023年12月14日

アニメーションでDeepSpeed (ZeRO1)の仕組みを完全に理解する

Turingのリサーチチームで完全自動運転の研究開発を行なっている棚橋です。Turingアドベントカレンダー14日目の記事として、DeepSpeedについて取り上げます。 DeepSpeedはMicrosoftによって開発されたライブラリで、一言で言うと、「1つのGPUに乗り切らないような巨大MLモデルをなんとか学習させるため」のツールです。特に、この論文で提案されているDeepSpeedのZero Redundancy Optimizer (ZeRO)という技術が非常に注目されています。また、Deep

GitHub, Python, GPU, 大規模言語モデル（LLM）

チューリング

2023年12月12日

サイバーエージェントの生成AI開発を支える機械学習基盤

この記事は CyberAgent Developers Advent Calendar 2023 1 ...

Ansible, GPU, 大規模言語モデル（LLM）

CyberAgent

2023年12月03日

大規模言語モデルの事前学習知見を振り返る

はじめに Turing 株式会社のリサーチチームでインターンをしている東京工業大学横田研究室B4の藤井(@okoge_kaz)です。 2022年11月末にChatGPTがリリースされてから早1年、2023年は大規模言語モデル開発の領域において飛躍の１年となりました。国内でもCyberAgent, PFN, ELYZAを筆頭に3B〜13B程度のモデルが多数公開され、多くの方にとってLLMが身近になった1年であったかと思われます。 Turingでは完全自動運転の実現に向けた研究開発の一環としてLLMに早くか

GitHub, 機械学習, HTML, GPU, アーキテクチャ, ハードウェア, ChatGPT, 大規模言語モデル（LLM）

チューリング

2023年11月16日

音声処理系国際会議INTERSPEECH・SSW出張レポート

RevComm Research の加藤集平です。8月下旬に音声処理のトップカンファレンスである INTERSPEECH で発表するため、また引き続いて行われた ISCA Speech Synthesis Workshop (SSW) に参加するためにヨーロッパに出張をしてきました。今回の記事では、INTERSPEECH, SSWおよび私の発表について紹介いたします。加藤集平（かとう　しゅうへい）シニアリサーチエンジニア。RevCommには2019年にジョインし、音声処理を中心とした研究開発を担当。A

ワークショップ, GPU, CS

株式会社RevComm

2023年11月16日

AWS Weekly Roundup—短時間の ML ワークロードのために GPU 容量を確保、Finch は GA、その他—2023 年 11 月 6 日

2023年も終わりを迎え、クリスマスまであと 50 日、AWS re:Invent まであと 21 日! ラスベガスにいるなら、私に挨拶しに来てください。私はほとんどの時間、Serverlesspresso のブースにいます。 10月30日週のリリース 10月30日週のリリースの中から、私の目に留まったリリースをいくつかご紹介します。 Amazon EC2 – Amazon EC2 は ML 向けキャパシティブロックを発表しました。これは、短時間の ML ワークロード用に GPU コンピュートキャパシティ

AWS, GPU, macOS

AWS

2023年11月14日

Cloud Run ジョブのタイムアウト時間の延長

はじめにこんにちは！クラウドエースデータ ML ディビジョン所属のきょくです。データ ML ディビジョンでは、Google Cloud が提供しているデータ領域のプロダクトについて、新規リリースをキャッチアップするための調査報告会を毎週実施しています。新規リリースの中でも、特に重要と考えるリリースを記事としてまとめ、本ページのように公開しています。今回紹介するリリースは、「Cloud Run ジョブのタイムアウト時間の延長」についてです。このリリースによって、従来 1 時間までだったジョブのタイム

Google Cloud, インフラ, GPU