チューリングの技術ブログ

全109件

2026/02/02

Tokyo 30の舞台裏？AWSで作る！フルマネージドな大規模GPUクラスターの構築/運用のリアル

はじめにチューリングのMLOpsチームに所属する大戸（おおど）と言います。 2025年10月に入社し、クラウド上のGPUクラスターの構築・運用や、大量のデータセット管理システムの設計・開発など、MLOps領域の業務を幅広く担当しています。今回は、実際に都内を30分程度走行させることに成功したモデルの開発を支えた GPUクラスター基盤の話を書こうと思います。 https://zenn.dev/turing_motors/articles/bc6436727234ad 大規模なクラウドGPUクラスターの話を、構築から運用からクロージング(削除)まで、一貫してやったという記事は少ない

2025/12/19

「画像なし」で挑むVLM学習 / Text-Printed Imageによるアプローチ

VLM学習のための「Text-Printed Image」手法。テキストを画像化することでモダリティギャップを緩和しより効果的に学習できるようにする。はじめにチューリングでインターンをしている東京科学大学(Institute of Science Tokyo)の山辺です。インターンでは、「画像を一切使わずに VLM を学習できるか？」というテーマで研究を進め、その成果を論文としてまとめて arXiv に投稿しました。画像付きデータを大量に集めるのではなく、テキストだけをうまく活用して VLM を学習させる、という少し変わったアプローチに取り組んでいます。論文はすでに公開されて

2025/12/03

Kaggle 2COOOL 準優勝：学習データなし動画コンペのVLM解法とICCVレポート

はじめにチューリングのVLAチームでエンジニアをしている横井です。 2025年にKaggleで開催された自動運転とVLM (Vision-Language Model) のドメインである2COOOLコンペに社内のKaggler ( Kento Sasaki, ymg_aq, colum2131, Hidehisa Arai, Hotaka Ueda) で参加しました。幸運にも2位を獲得し、ICCVに参加するなどの貴重な経験ができたので参加記録を残します。これはKaggle Advent Calendar 2025の3日目の記事です。表彰してもらえました本記事では以下の内容を

2025/11/21

30万kmの道のり、東京でE2E自動運転を走らせる

はじめにチューリングで自動運転第一グループのマネージャをやっている棚橋です。今週、チューリングは無事にシリーズA 1st closeの資金調達を発表することができました。 E2E自動運転の開発においても、ようやく都内を30分ほど走行できるレベルに到達しつつあります。しかし、ここに至るまでの道のりは決して平坦ではなく、多くの失敗や試行錯誤を積み重ねてきました。実際にチューリングでは今まで累計約30万kmもの走行データを取ってきました。この記事ではこれまでの開発の道のり、そして今後について書きたいと思います。 E2E自動運転開発は簡単？ E2E自動運転のタスクは極めてシンプルで

2025/11/19

NVIDIA NeMoを利用したGPT-OSSの学習

はじめに Turing CTO室に所属している東京科学大学(Institute of Science Tokyo)の藤井です。本記事では、OpenAIから2025年8月にリリースされたgpt-ossをNVIDIA NeMoフレームワークにて学習するための方法について解説します。 2025年11月4日時点では、NVIDIA公式からは、LoRA finetunigを行う方法についてのみ解説されており、Long Context継続事前学習(Continual Pre-Training)など本格的な学習を行うにはハードルが多数あります。本記事では、学習を行うために解決する必要があるすべて

2025/11/13

LLM開発の裏で行われるデバッグ作業: PyTorch DCP

はじめに Turing CTO室に所属している東京科学大学(Institute of Science Tokyo)の藤井です。本記事は、LLM, VLM開発の裏で行われるリアルなデバッグ作業の様子を紹介します。 LLM, VLMの開発の裏には本記事で紹介するような地道なデバッグ作業が多数あるのですが、なかなかその実態が伝わっていないように思います。できるだけ詳細にデバッグ作業の様子を記しましたので、実際の現場で行われている作業を追体験いただけますと幸いです。 Background まず、デバッグ作業を行う前の背景と経緯について説明します。学習に使用している依存関係の継続的なu

2025/10/06

全プロセスが一秒止まる不具合続編: カーネル内部で何が起きたか？

はじめに完全自動運転の実現を目指すスタートアップ「チューリング」でエンジニアをしています、鈴木勝博です。私が所属しているDrivingSystemチームでは、自動運転向けのシステム開発を担当しています。 Linuxを用いたシステム開発を行っていると、カーネルの挙動、周辺デバイスとの組み合わせ等によって、思いがけない問題に遭遇することが少なくありません。この記事では、実際にシステム開発中に遭遇した「再現が難しく、原因の切り分けに時間を要した問題」について深堀りしてご紹介します。概要編はこちらのテックブログにてご紹介しています。 https://zenn.dev/turing_mot

2025/09/30

全プロセスが一秒止まる不具合、原因はLinuxカーネルにあり？

はじめに完全自動運転の実現を目指すスタートアップ「チューリング」でエンジニアをしています、坂本です。私が所属しているDrivingSystemチームでは、組み込みLinuxをベースに、自動運転システムと、自動運転モデル学習用データ収集システムを開発しています。組み込みLinuxの開発を行っていると、カーネルの挙動、周辺デバイスとの組み合わせ等によって、思いがけない不具合に遭遇することが少なくありません。この記事では、実際にシステム開発中に遭遇した再現が難しく、原因の切り分けに時間を要した不具合について紹介していきます。同じように組込みLinuxや自動運転ソフトウェアの開発に携わっ

2025/09/23

都市部の自動運転を支えるマップマッチング

はじめに End-to-End自動運転開発チーム (以降E2Eチーム) の塩塚です。本記事では、画像認識結果とベクターマップをマッチングすることで自己位置推定を行う手法について紹介します。アイディアとしては高架下などGNSSが不安定な場所では自己位置がズレる。その結果、本来は適切に車線中央を走行しているのに、自己位置上は白線の上を走行しているような状態になる。車両にとりつけられたカメラの画像を見れば車線中央を走行していることは明らかなので、その情報を使って自己位置を修正する。といった感じです。結果はこちらです。以下の場面ではGNSSによる自己位置が車線一本分もずれてい

2025/09/10

Turing MLOpsチームの誕生秘話

Turingには「MLOpsチーム」と呼ばれるチームがあります。このチームはもともと、自動運転を実現するMLモデルを開発する「E2Eチーム」から、2025年3月頃に独立して誕生しました。今回の記事では、MLOpsチーム誕生に至る経緯と、その役割について紹介できればと思います。自動運転MLモデル開発に必要なドメインは多い TuringのE2Eチームは、自動運転用の機械学習(ML)モデルを開発するチームです。チーム名の「E2E」はEnd to Endの意味で、このチームが開発するモデルの特徴を表しています。このチームには、自動運転MLモデルを開発するエンジニアが多くいますが、そのカ

2025/08/29

`uv pip install torch --torch-backend=auto`で互換性の高いPyTorchをインストールする流れ

チューリングのMLOpsエンジニアの岩政です。先日ポストした内容が思いのほか拡散されたので、個人的な再現性が保ちやすい PyTorchの環境構築の流れについてまとめた記事です。 https://x.com/colum2131/status/1960520833438482930 本記事の主な対象は、Linux OSでNVIDIA GPUが搭載されているマシンでPyTorchをインストールする方です。他のOSやWSL2などで同様の操作が可能かは保証しません。 1. 結論本記事で紹介したい流れを具体的なコマンドをもとに先に紹介します。 1.1 NVIDIA Driverのインス

2025/08/15

自動運転基盤モデルの最前線：VLAモデルの今とこれから【2025年版】

1. はじめに完全自動運転の実現を目指すスタートアップ「チューリング」でエンジニアをしています、佐々木です。現在、Vision-Language-Action (VLA) モデルの研究開発に取り組んでいます。本記事では、自動運転VLAモデルの概要と最新の研究動向を整理し、今後の取り組みについて掘り下げていきます。 1.1 自動運転システムの概要まずは、本題に入るまえに自動運転システムのパラダイムについて確認していきましょう。 Modular-based System モジュラーベースシステムは、3P (Perception → Prediction → Planning)の

2025/08/13

MIRU2025で3DGSドライビングシミュレータを展示しました

はじめに Turing基盤AIチームの荒居と上田です。2025 年 7 月 29 日〜8 月 1 日に京都・国立京都国際会館で開催された国内最大規模のコンピュータビジョン会議 MIRU 2025（画像の認識・理解シンポジウム）にブース出展し、3D Gaussian Splatting（3DGS）を活用したドライビングシミュレータを実機デモしました。 MIRU2025で展示したチューリングのブース会場には 3 面ディスプレイとステアリングコントローラを備えた運転リグを持ち込み、実写データから再構成した街並みを“運転席目線”で自由に走行できる体験を提供しました。試乗待ちの行列ができ

2025/06/19

[Tips] PyTorch Lightning を利用した学習 Tips

はじめに Turingの基盤AIチームに業務委託として所属している東京科学大学(Institute of Science Tokyo)の藤井です。本記事では、PyTorch Lightningを利用してマルチノード(=2インスタンス以上の環境)で学習を行う際のTipsと、PyTorch Lightningと Lightningの併用により生じる問題の解決策について紹介を行います。普段はSwallow Projectや横田研究室にて大規模モデルの分散並列学習や低精度学習について研究を行っていますので、そちらもご覧いただけますと幸いです。 2ノード以上で発生する問題 PyTorch

2025/06/16

[Tips] NGC PyTorchのversion lockを解除する方法

はじめに Turingの基盤AIチームに業務委託として所属している東京科学大学(Institute of Science Tokyo)の藤井です。本記事では、NVIDIA NGC PyTorchのcontainerを利用する際に直面するversion lock問題に関する知見や注意点について紹介します。普段はSwallow Projectや横田研究室にて大規模モデルの分散並列学習や低精度学習について研究を行っていますので、そちらもご覧いただけますと幸いです。 NGC PyTorchとは NGC PyTorchとは、NVIDIAが提供しているコンテナの総称であり、LLMの学習やN

2025/06/11

「言葉」で守る自動運転の安全と倫理 –マルチモーダル時代のアラインメント戦略

はじめにチューリングの髙橋です。機械学習やAIにおけるセキュリティやプライバシーの研究開発を専門としています。チューリングでは、「完全自動運転」の実現を見据えて、LLMに視覚理解や行動計画を統合したマルチモーダルAIの研究開発に取り組んでいます。このようなモダリティの統合に加えて、ひとの価値観と整合（アライン）したふるまいも、安全な自動運転AIに欠かせない要素です。このテックブログでは、どのようにして人間社会の規範や倫理観にアラインさせていくのか、近年の機械学習モデルに対する脅威や攻撃、セーフティアラインメントの研究動向を踏まえ、「言葉を介してひとの価値観とアラインする」とい

2025/05/30

[Tips] PyTorchにおける動的リンク

はじめに Turingの基盤AIチームに業務委託として所属している東京科学大学(Institute of Science Tokyo)の藤井です。本記事では、PyTorchをsource buildした後に利用する際にCUDA Toolkitをmodule loadしておく必要があることの背景について解説を行います。また、pip installによりbuild済みのbinaryをインストールしたときのPyTorchとsource buildした場合の違いについても解説を行います。普段はSwallow Projectや横田研究室にて大規模モデルの分散並列学習や低精度学習について研

2025/05/27

[Tips] LFTPによるデータ転送

はじめに Turingの基盤AIチームに業務委託として所属している東京科学大学(Institute of Science Tokyo)の藤井です。本記事では、LLM(Large Language Models)やVLM(Vision Language Models)などの学習で利用するデータセットを複数のデータセンター間で並列転送する際に利用しているLFTPの使用方法について紹介します。AWS S3, GCSなどのCloud Service企業のストレージサービスを利用される場合は、aws s3コマンドやgcloudコマンドなどにより並列転送を容易に実現可能ですが、そうでない場合に

2025/05/20

Webスケールの日本語-画像のインターリーブデータセット「MOMIJI」の構築 /巨大テキストデータをAWSで高速に処理するパイプライン

はじめにチューリング基盤AIチームの @stu3dio_graph です。チューリングでは視覚と言語を統合的に理解できるAIを自動運転に応用するため，LLMを視覚モーダルに拡張したVision-Language モデル（VLM）「Heron」の開発に取り組んでいます。チューリングは経済産業省およびNEDOが推進する日本の生成AIの開発力強化に向けたプロジェクト GENIAC第2期に採択されました。GENIACでは，完全自動運転を見すえた「身体性」を持つマルチモーダル基盤モデルの開発に取り組みました。日本語環境で高性能なマルチモーダル基盤モデルを作るためには，品質のいい日本語画

2025/05/13

軽量な視覚言語モデル「Heron」のiOSアプリを公開しました

完全自動運転の実現を目指すTuringでは、Webスケールのデータセットで学習した大規模視覚言語モデル（VLM）の持つ「常識」を利用することで、幅広い状況に対応できる自動運転モデルの開発を実現できると考えています。この目標のもと、基盤AIチームでは2023年から視覚言語モデル「Heron」の開発に取り組んできました。 https://www.watch.impress.co.jp/docs/news/1529946.html VLMを自動運転に活用していく上で重要な要件の一つが「軽量」であることです。Turingでは経済産業省およびNEDOが推進する日本の生成AIの開発力強化に向けた

コンテンツ

トップイベント資料ブログフォロワーグループに関するお問い合わせ

チューリング の技術ブログ

コンテンツ

チューリングの技術ブログ