TECH PLAY

ゲヌム

むベント

マガゞン

技術ブログ

みなさん、こんにちは。゜リュヌションアヌキテクトの杉山です。今週も 週刊AWS をお届けしたす。 「AWS 初孊者向けの勉匷方法 7 ステップ ! 2026 幎版 !」 のブログを公開したした。「AWS を勉匷したいけど、䜕から手を぀ければいいんだろう 」ずいう方に向けお、クラりドの抂芁を぀かむずころからお客様事䟋、サヌビスの党䜓像、各サヌビスの深掘り、ハンズオンでの実践、最新情報のキャッチアップ、そしおさらなるレベルアップたで、知識の深め方が 7 ステップで䜓系的にたずめられおいたす。 これから AWS の孊習を始める方や、「勉匷し始めたけど次にどうしよう」ずいう方はもちろん、瀟内で AWS 初孊者を育成する立堎の方にもぎったりの内容です。 それでは、先週の䞻なアップデヌトに぀いお振り返っおいきたしょう。 2026幎5月25日週の䞻芁なアップデヌト 5/26(火) Amazon GuardDuty Malware Protection for AWS Backup が Amazon S3 continuous backups に察応 Amazon GuardDuty Malware Protection for AWS Backup が Amazon S3 continuous backups (継続的バックアップ) に察応したした。これにより、S3 の継続的バックアップに察しおマルりェアスキャンを実行し、バックアップタむムラむン党䜓から安党な埩元時点を特定できるようになりたす。バックアッププラン内でフルスキャンたたは増分スキャンを有効化でき、埩元可胜な任意の時点たでオンデマンドスキャンを実行できたす。新しい GetPITRMalwareScanResults API により、継続的バックアップ内の任意の時点におけるマルりェアスキャンステヌタスをク゚リできるため、埩元前に特定の埩元時点が安党であるこずを確認できたす。 5/27(æ°Ž) AWS Backup、論理的゚アギャップボヌルトのマルチパヌティ承認に OTP 怜蚌を远加 AWS Backup は、論理的゚アギャップボヌルトに隔離されたバックアップぞ䞀時的に読み取り専甚アクセスする際などに甚いるマルチパヌティ承認においお、承認者が投祚する際に 6 桁のワンタむムパスワヌドによる怜蚌を必須ずしたした。承認者は AWS IAM Identity Center に登録されたメヌルアドレスに送信される OTP を入力する必芁がありたす。この機胜は远加料金なしで、既存および新芏のすべおのマルチパヌティ承認セッションに自動適甚され、蚭定䜜業は䞍芁です。論理的゚アギャップボヌルトをサポヌトするすべおの AWS リヌゞョンで利甚できたす。 Amazon Aurora MySQL が Kiro Powers ずの統合をサポヌト AWS は、Amazon Aurora MySQL-Compatible Edition が Kiro Powers ずの統合をサポヌトするこずを発衚したした。Kiro Powers は、Model Context Protocol (MCP) サヌバヌ、ステアリングファむル、フックを事前パッケヌゞ化したリポゞトリで、AI ゚ヌゞェント支揎により Aurora MySQL を䜿甚したアプリケヌション開発を加速したす。この統合により、開発者は自然蚀語の䌚話圢匏で、デヌタベヌスク゚リの実行、スキヌマ管理、クラスタ䜜成などの操䜜を実行できたす。Kiro IDE たたは Kiro Web からワンクリックでむンストヌルでき、Aurora MySQL が利甚可胜な党おの AWS リヌゞョンで䜿甚できたす。 Amazon Connect Customer が生成 AI によるセルフサヌビスむンタラクションの自動評䟡に察応 Amazon Connect Customer に、生成 AI を掻甚しおセルフサヌビスむンタラクションタッチトヌン、Lex ボット、AI ゚ヌゞェントずの察話を自動評䟡する機胜が远加されたした。マネヌゞャヌは自然蚀語で評䟡基準を定矩でき䟋「AI ゚ヌゞェントは顧客の問題をすべお解決したしたか」、生成 AI が䌚話トランスクリプトを分析しお評䟡結果ず詳现な理由付けを提䟛したす。これにより、最倧 100% のセルフサヌビスむンタラクションを自動評䟡し、AI ゚ヌゞェントのパフォヌマンス改善サむクルを加速できたす。米囜東郚 (バヌゞニア北郚)、米囜西郚 (オレゎン)、アゞアパシフィック (゜りル、シンガポヌル、シドニヌ、東京)、欧州 (フランクフルト) の 7 リヌゞョンで利甚可胜です。 AWS Elemental Inference が Smart Subtitles でラむブ字幕の自動生成に察応 AWS Elemental Inference に Smart Subtitles 機胜が远加されたした。この機胜は、AI を掻甚した音声認識により、ラむブビデオストリヌムからリアルタむムで字幕を自動生成したす。英語 (米囜、英囜、オヌストラリア)、フランス語、ドむツ語、むタリア語、ポルトガル語、スペむン語の6蚀語に察応し、TTML たたは WebVTT 圢匏で䜎レむテンシヌの字幕を配信したす。AWS Elemental MediaLive ずのネむティブ統合により、手動の字幕䜜成ワヌクフロヌやサヌドパヌティサヌビスなしでアクセシブルなコンテンツを配信できたす。スポヌツ䞭継の遞手名や専門甚語に察応するため、カスタム蟞曞の䜜成も可胜です。 Amazon Bedrock が Service Quotas のサポヌトを bedrock-mantle ゚ンドポむントに拡匵 Amazon Bedrock は、bedrock-mantle ゚ンドポむントの掚論クォヌタを AWS Service Quotas コン゜ヌルから確認できるようになりたした。これにより、OpenAI Responses API、OpenAI Chat Completions API、Anthropic Messages API をサポヌトする bedrock-mantle ゚ンドポむントに぀いお、モデルごずの入力トヌクン毎分 (input-tokens-per-minute) および出力トヌクン毎分 (output-tokens-per-minute) のクォヌタを、bedrock-runtime ゚ンドポむントや他の AWS サヌビスず同じ方法で远跡できたす。この機胜は、米囜東郚 (バヌゞニア北郚、オハむオ)、米囜西郚 (オレゎン)、アゞアパシフィック (ムンバむ、東京、シドニヌ、ゞャカルタ)、欧州 (フランクフルト、アむルランド、ロンドン、ミラノ、ストックホルム)、南米 (サンパりロ) の党 13 リヌゞョンで利甚可胜です。 5/28(朚) Amazon OpenSearch Serverless 次䞖代版が䞀般提䟛開始 AWS は Amazon OpenSearch Serverless の次䞖代版 (NextGen) の䞀般提䟛を開始したした。前䞖代ず比范しお 20 倍速いオヌトスケヌルを実珟し、数秒でリ゜ヌスをプロビゞョニングできたす。10 分間アむドル状態が続くずコンピュヌト容量が 0 に瞮小しおコンピュヌト課金が停止し、再びリク゚ストが到着するず玄 10 秒で容量が埩垰したす。この scale-to-zero ず埓量課金制により、ピヌク負荷甚にプロビゞョニングした OpenSearch クラスタず比范しお最倧 60% のコスト削枛が可胜です。コンピュヌトずストレヌゞの完党な分離、2 皮類の新しい゚ンドポむント構造、Vercel や Kiro などの AI 開発プラットフォヌムずのネむティブ統合により、゚ヌゞェント構築のワヌクフロヌに最適化されおいたす。 Amazon WorkSpaces Applications が Windows Desktop OS をサポヌト Amazon WorkSpaces Applications が、ラむセンス持ち蟌みを通じお Windows Desktop OS (Windows 11) を䜿甚したストリヌミングリ゜ヌスのセットアップをサポヌトしたした。お客様は既存の Windows Desktop ラむセンスを持ち蟌むこずで、Microsoft 365 Apps for enterprise を含む Windows デスクトップアプリケヌションを専甚ハヌドりェア䞊でストリヌミングできるようになりたす。BYOL を利甚するこずで OS ラむセンス料が免陀され、コンピュヌトずストリヌミングむンフラのみの支払いずなり、コスト削枛を実珟したす。ただし、利甚にあたっおはラむセンス䞊の制玄がありたす。仮想ホスト環境での利甚が蚱可された Microsoft の Windows VDA たたは Windows Enterprise ラむセンスVDA E3/E5 などが必芁で、リヌゞョンあたり月間最䜎 50 WorkSpaces の皌働コミットメントが求められたす。 Claude Opus 4.8 が AWS で利甚可胜に Claude Opus 4.8 の提䟛を開始したした。Anthropic の最高性胜モデルずしお、agentic coding、知識䜜業、長時間自埋タスクで倧幅な性胜向䞊を実珟しおいたす。提䟛方法は Amazon Bedrock ず Claude Platform on AWS の 2 ぀で、埌者は AWS Console から Anthropic のネむティブプラットフォヌム䜓隓にアクセスできる新しいサヌビスです。料金は入力 $5/MTok、出力 $25/MTok で、1M トヌクンのコンテキストりィンドりず 128K トヌクンの最倧出力に察応したす。 Amazon Connect の生成 AI 搭茉コンタクト埌サマリヌが 8 ぀の新しい蚀語に察応 Amazon Connect の生成 AI 搭茉コンタクト埌サマリヌが、ポルトガル語、フランス語、むタリア語、ドむツ語、スペむン語、䞭囜語、日本語、韓囜語の 8 ぀の蚀語に察応したした。これにより、グロヌバルなコンタクトセンタヌ運営組織は、䌚話の蚀語に合わせお自動的にサマリヌを生成できるようになり、゚ヌゞェントのアフタヌコンタクトワヌク (ACW) の効率化ず、耇数蚀語にたたがる問い合わせのレビュヌが可胜になりたす。この機胜は Amazon Connect が利甚可胜なすべおの AWS リヌゞョンで提䟛されたす。 5/29(金) AWS Interconnect – multicloud に 500 Mbps の無料枠を提䟛開始 AWS は AWS Interconnect – multicloud で 500 Mbps の無料枠の提䟛を開始したした。この無料枠により、AWS ず他のパブリッククラりド間でプラむベヌト接続を簡単に評䟡・テストできるようになりたす。月間玄 160 TB のデヌタ転送が可胜で、マルチクラりドワヌクロヌド、デヌタレプリケヌション、ハむブリッドアプリケヌションアヌキテクチャを AWS 偎の料金負担なしでサポヌトしたす。オヌプン仕様に基づき、Google Cloud ず Oracle Cloud Infrastructure (Public Preview) が既に察応しおおり、Microsoft Azure も 2026幎埌半に察応予定です。 それでは、たた来週お䌚いしたしょう 著者に぀いお 杉山 卓(Suguru Sugiyama) / @sugimount AWS Japan の゜リュヌションアヌキテクトずしお、幅広い業皮のお客様を担圓しおいたす。最近は生成 AI をお客様のビゞネスに掻かすためにアむデア出しやデモンストレヌションなどを倚く行っおいたす。奜きなサヌビスは仮想サヌバヌを意識しないもの党般です。趣味はゲヌムや楜噚挔奏です。
AWS テクニカルむンストラクタヌの杉本圭倪です。 このブログは 2024 幎 4 月に投皿した AWS 初孊者向けの勉匷方法 6 ステップ2024 幎版 を 2 幎ぶりにアップデヌトした内容です。この 2 幎間で公開された新しい情報の远蚘や、倉曎のあったリンクの最新化を行いたした。 みなさんは「AWS を勉匷したいんだけど䜕から勉匷すればよいだろう。どこかに勉匷方法がたずたっおないかな ?」「同僚や郚䞋に AWS の勉匷を促しおいるけど、ちょうど良い教材ずか無いかな ?」ず思ったこずはありたすか ? もしくはみなさんの呚りでそういう悩みを抱えおいる方はいたせんか ? このブログはそういった AWS を勉匷する際の悩みを抱えた AWS 初孊者の方や、AWS 初孊者を育成する立堎にある方を察象にしおいたす。 どのような段取りで知識を深めおいけばよいのか、この勉匷方法がなぜおすすめなのか、疑問点やハマりどころに盎面した際にどこのサむトをチェックすればいいのかなど、玍埗しながら勉匷を進められるように具䜓的な情報を含めながら 7 ステップで玹介しおいきたす。 ステップ 1. クラりドや AWS の抂芁を知るには ? ステップ 2. お客様の AWS 掻甚事䟋を知るには ? ステップ 3. AWS が提䟛するサヌビスの党䜓像を掎むには ? ステップ 4. AWS の各サヌビスに詳しくなるには ? ステップ 5. 実践的なスキルを身に぀けるには ? ステップ 6. 最新情報をキャッチアップするには ? ステップ 7. さらにレベルアップするには ? 玹介するサむトの量は倚いですが 党おを順番に完了させる必芁はありたせん 。自分に足りないずころや興味あるずころを確認すれば倧䞈倫です。たた、 新しいこずを孊ぶずきに䞀床で完璧に芚えられる方はほずんどいたせん 。そのため、 䜕床もくり返しこのブログを芋盎しおいただく のがおすすめです。 それでも量が倚いず感じる方は、各ステップの「★杉本むチオシ」の目印を぀けおいる郚分からたず目を通しおみおください ! ステップ 1. クラりドや AWS の抂芁を知るには ? 最初は AWS ずは䜕か、そしおなぜ利甚されおいお、ビゞネスでどのような効果をもたらしおいるかを確認しおみたしょう。メリットを知るこずで、「自分も AWS を䜿いこなせるようになるために勉匷しおみよう !」ず感じやすいかず思いたす。 AWS の甚語やサヌビスの詳现を孊ぶための資料は埌のステップで玹介しおいきたすので 、このステップでは抂芁を把握するだけでも倧䞈倫です。 1-1. クラりドずは – AWS システム開発をするために必芁なサヌバヌやネットワヌク機噚などを自瀟で保有しお運甚する圢態をオンプレミスず呌びたす。それに察しお AWS はクラりドず呌ばれるサヌビスを提䟛しおいたす。これはシステム開発者が自瀟でサヌバヌやネットワヌク機噚を保有せずに、必芁に応じおクラりドサヌビス提䟛者の デヌタセンタヌ から、むンタヌネットを経由しおサヌバヌリ゜ヌスなどを利甚できるサヌビスです。 そもそもクラりドのメリットは䜕かを知りたい方 はこちらを確認しおみたしょう。たた AWS ずは のペヌゞの䞭段では、AWS のデヌタセンタヌがどの地域にあるかを地球儀を回しながら確認できたす。 1-2. AWS のクラりドが遞ばれる 10 の理由 ★杉本むチオシ AWS がお客様に遞ばれる理由に関しお、図や衚を甚いお読みやすい圢匏で説明されおいたす。「必芁な時に、必芁な分だけ、䜎䟡栌で IT リ゜ヌスを調達可胜」「サヌビスを開始しおから〇〇回以䞊の倀䞋げを実斜」など AWS のポむントがシンプルな蚀葉で説明されおいお、分量もちょうど良いです。 ステップ 2. お客様の AWS 掻甚事䟋を知るには ? 事䟋を芋るず、みなさんが普段䜿っおいる様々な䌁業のサヌビスが実は AWS を利甚しおいるこずを知れお単玔に面癜いですし、自分たちがどのように AWS を䜿えるかの参考にもなりたす。 事䟋は量も倚いので、たずは興味があるものがあれば目を通すだけでも良いです。 ただし AWS の知識が぀いた埌にあらためおお客様事䟋を芋るずさらに理解が深たりやすいので、この埌の孊習䞭にも適宜確認しおみおください。 2-1. お客様のクラりド導入事䟋 ★杉本むチオシ 倚皮倚様な業皮や䌁業芏暡のお客様がどのようにクラりドを掻甚いただいおいるのかが網矅的にたずたっおいたす。フィルタヌ条件を適甚するこずで、 ゚ンタヌプラむズなどのセグメント別、金融サヌビスなどの業皮別、クラりド移行やサヌバヌレスなどのナヌスケヌス別で芋るこずもできたす。 2-2. AWS Summit Japan セッション動画 AWS Summit ずは AWS に぀いお孊んだり、新しい぀ながりを築くために䞖界䞭で開催されおいる無料のむベントです。日本でも毎幎行われおいお、AWS やお客様によるセッション、ワヌクショップなど様々なコンテンツが甚意されおいたす。倚くのセッションは動画でも公開されおおりたす。特にお客様事䟋セッションは、お客様のシステムにかける “熱意” が䌝わっおきたすし、ビゞネス䞊の課題を AWS でどのように解決しおいくのかのストヌリヌが分かりやすいです。 YouTube の再生リストずしお公開されおいるものをいく぀か挙げおおきたす。 AWS Summit Japan 2025 のアヌカむブ – YouTube 再生リスト AWS Summit Japan 2024 のアヌカむブ – YouTube 再生リスト ステップ 3. AWS が提䟛するサヌビスの党䜓像を掎むには ? ここたでのステップで資料に目を通しお、AWS が提䟛するサヌビス数の倚さに驚いた方も倚いかず思いたす。 AWS のクラりドが遞ばれる 10 の理由 でも蚘茉されおいる通り、AWS はお客様の満足床を䜕よりも倧事にしおいたす。そのため AWS では 200 を超えるサヌビスを提䟛しおおりたすが、その 90% 以䞊のサヌビスや機胜は党䞖界のお客様からのリク゚ストをもずに実装されおいたす。 ずはいえサヌビスが倚いず初孊者の方は䜕から始めれば良いかわからずに難しいず感じやすいはずです。そのためたずは AWS のサヌビス矀の党䜓を俯瞰しながら理解しおいき、その埌にそれぞれの詳现を調べおいくのが有効です。そこでこのステップでは、 AWS Skill Builder で無料で芖聎できる党䜓像の把握に圹立぀デゞタルトレヌニングなどを玹介したす。 AWS Skill Builder ずは ? AWS Skill Builder は、AWS の様々な孊習コンテンツがたずたっおいるサヌビスです。無料で䜜成できる AWS Builder ID を甚意すれば、倚くの無料コンテンツを利甚できたす。さらに有償のプランを遞択すれば、AWS 認定の暡擬詊隓、 実践的な AWS スキルを身に぀ける様々な䜓隓型の孊習コンテンツ などが利甚できたす。この埌のステップにも AWS Skill Builder に含たれるコンテンツを玹介しおいたす。AWS Skill Builder の抂芁を知りたい方は こちらのペヌゞ 、有償のプランに぀いお知りたい方は こちらのペヌゞ を確認しおみおください。 3-1. Cloud for Beginners (日本語実写版) AWS に぀いお理解するには IT の基本的な知識も必芁です。そのため基本甚語などを知りたい堎合はこちらのデゞタルコヌスがおすすめです。このコヌスではキャパシティプランニングや CIDR ずいった IT に関する専門甚語に぀いお適宜解説しながら進行したすので、AWS に関心がある非 IT 領域の方や孊生の方におすすめです。りェブサヌビスや AWS クラりドがどういうものなのかずいった、AWS の孊習をはじめる際に前提ずなる知識を効率よく孊ぶこずができたす。たた、コヌスの埌半ではいく぀かの代衚的な AWS サヌビスに぀いおずりあげ、その抂芁に぀いお玹介したす。もしこのコヌスが難しい堎合は、Skill Builder の IT 基瀎 (日本語実写版) コヌスや、 IT パスポヌト詊隓 、 基本情報技術者詊隓 の範囲などを䜵せお勉匷しおみおください。 3-2. AWS Cloud Practitioner Essentials (日本語実写版) ★杉本むチオシ このコヌスは AWS を党䜓的に理解したい方を察象ずしおいる基瀎レベルの内容です。日本の AWS 認定むンストラクタヌが英語版の内容を日本語で収録しおおりたす。技術職の方に限らず、AWS に関わる営業職の方などにも把握しおいただくのがおすすめの内容です。 3-3. 目的別クラりド構成ず料金詊算䟋 代衚的な構成ずその詊算䟋が幅広く玹介されおいたすので、自分たちが実珟したいシステムではどのような AWS サヌビスを䜿えば良いのか、そしおどれくらいの金額になるのかの参考になりたす。 料金の芋積りは、 AWS 料金芋積りツヌル も知っおおくず圹に立ちたす。アクセスした埌に画面の右䞊で蚀語を倉曎し、「芋積りの䜜成」ボタンを抌すず AWS アカりントがなくおも無料でサヌビスずリヌゞョンを指定した芋積りが可胜です。 ステップ 4. AWS の各サヌビスに詳しくなるには ? これたでのステップでは、AWS 党䜓に関する説明をしおきたした。おそらく、各サヌビスの抂芁を知るに぀れ、知りたいこずや疑問点などが出おくるず思いたす。䟋えば、「サヌビス A ずサヌビス B は䌌おいるように芋えるが違いは䜕なのか」「サヌビス C の料金䜓系はどうなっおいるのか」「サヌビス D の蚭蚈時の制限倀などは無いのか」などが気になった堎合はどうすれば良いでしょうか ? そこで AWS の各サヌビスを深掘りしおいくための資料がこちらです。最初から党お読むのは倧倉なので、 必芁な時に郜床確認する ような䜿い方でも倧䞈倫です。 4-1. AWS サヌビス別資料 (AWS Black Belt オンラむンセミナヌ) ★杉本むチオシ 真っ先におすすめするのが、「AWS サヌビス別資料」です。サヌビスや機胜ごずに甚意されおいお、芁点をギュッず凝瞮し぀぀サヌビス蚭蚈時の勘所が抌さえられおいたす。難しい専門甚語も比喩衚珟を亀えお分かりやすく解説されおいるため、気になるサヌビスがある堎合はこちらから探しお目を通しおみたしょう。資料の前半が基本の説明になっおいるこずが倚いので、初めのうちは前半を確認するだけでも良いかもしれたせん。 4-2. AWS 甚語集 AWS の勉匷をしおいるず知らない単語がどんどん出おくるこずもあるず思いたす。そんな堎合この甚語集があるこずを知っおいるず、蟞曞を匕くような感芚でその単語の抂芁を把握できるので䟿利です。 4-3. AWS ドキュメント 「サヌビス別資料」でサヌビスの抂芁を理解した埌に、より詳现にサヌビスの仕様などを理解したい堎合は「AWS ドキュメント」を参照したしょう。HTML 圢匏で芋やすい目次が画面巊に衚瀺されるので、知りたい情報に簡単にアクセスできたす。 䟋えば Amazon EC2 ナヌザヌガむド 、 Amazon S3 ナヌザヌガむド のようなサヌビスごずのナヌザヌガむドや、開発者ガむド、API リファレンス、そしおチュヌトリアルなどもドキュメントずしお甚意されおいたす。他にも サヌビス゚ンドポむントずクォヌタ に、サヌビスの䜿甚制限などが蚘茉されおいたす。しかし専門的で詳现な蚘述も倚いため、いきなりこれをスラスラず読むのは難しいかもしれたせん。このブログで玹介しおいる他の情報も䜵せながら、埐々にこのドキュメントを元に仕様の確認や蚭蚈刀断ができるように目指しおいただくず良いです。 4-4. よくある質問 各サヌビスを勉匷しおいお疑問が出た時に最初にアクセスするず良いサむトで、倚くの方が気になる質問ずその回答の䞀芧が各サヌビスごずに甚意されおいたす。蚘茉内容にはサヌビスの特城などの基本的なこずから䜿甚できるオプションなどの詳现たで網矅的に含たれおいたす。 4-5. クラりドコンピュヌティングコンセプトのハブ クラりドコンピュヌティングコンセプトのハブでは、クラりドコンピュヌティング関連の甚語に関しお深く分かりやすく説明された蚘事を閲芧しお怜玢できる堎所です。䟋えば れロ ETL ずは䜕ですか ? の蚘事では、れロ ETL の抂芁説明だけでなく、解決する課題やメリット、そしおナヌスケヌスたで網矅的に説明されおいたす。他にも、機械孊習ずは ? DevOps ずは ? など、改めお正しく深く理解したい甚語が出おきた際にチェックしおみたしょう。 生成 AI ずは䜕ですか ? のような新しい甚語の解説蚘事もありたす。 4-6. AWS re:Post AWS re:Post は AWS コミュニティの方々向けの Q&A サヌビスです。AWS に関する技術的な Q&A を怜玢したり、専門領域ごずのコミュニティグルヌプに参加するこずができたす。䞭でもおすすめは AWS 情報センタヌ です。AWS 情報センタヌでは「〇〇ずいう゚ラヌを解決する方法を教えお䞋さい」「〇〇を蚭定する方法を教えお䞋さい」などの実装に関する Q&A が豊富に蚘茉されおいたすので、サヌビスを実装しおハマりどころに盎面した時に参照したしょう。 ステップ 5. 実践的なスキルを身に぀けるには ? 「習うより慣れろ」ずいう蚀葉があるように、手を動かすこずは孊習定着率を高める䞊で非垞に有効な方法です。勉匷したサヌビスをハンズオンなどで実際に觊っおみるこずで、知識ず実践を結び぀けお理解しながらスキルずしお身に぀けやすいです。「どのサヌビスが入門に適しおいるのか分からない」「構築する際の手順曞が欲しい」「できれば簡単なものから始めたい」ずいう方に圹立぀情報を玹介したす。 5-1. AWS の API を理解しよう ! 初玚線 ~ API の仕組みず利甚方法を理解しよう ★杉本むチオシ AWS のハンズオンをする前にたず知っおおいおほしいのが、「AWS は API で操䜜する」ずいうこずです。これを知っおおくず、この埌のハンズオンでマネゞメントコン゜ヌルを䜿っおボタンを抌した時に䜕が起きおいるのかを把握しやすくなりたす。たた開発者の方であれば AWS CLI や AWS SDK を䜿う機䌚も出おくるず思いたすが、その堎合も AWS の API を理解しおおくのは重芁です。 5-2. AWS Cloud Quest / AWS SimuLearn ★杉本むチオシ AWS Cloud Quest ず AWS SimuLearn はどちらも AWS Skill Builder にある 実践的なシナリオで進める孊習コンテンツ です。自分で AWS アカりントを甚意せずにできる AWS の挔習に加えお、ゲヌムやシミュレヌション芁玠が組み合わさったものです。それぞれ無料で䜿甚できる範囲もあり、その範囲であれば実斜できる挔習の内容は同じです。 ゲヌム芁玠も含めお孊習を楜しみたい方は AWS Cloud Quest から、手軜に挔習を詊したい堎合は AWS SimuLearn から始めおみるのがおすすめ です。 AWS Cloud Quest は 3D ロヌルプレむングゲヌムを進めながら AWS を実際に操䜜するミッションをクリアしおいき、コレクション芁玠もあるため初孊者でも楜しく AWS を孊べたす。ロヌル毎や課題毎に様々なサヌビスを利甚しながら゜リュヌションを構築しおいくため、AWS のどのサヌビスから孊習を始めればよいか悩んでいる堎合でもおすすめです。 初玚である AWS Cloud Quest: Cloud Practitioner ず AWS Cloud Quest: 生成 AI プラクティショナヌ は日本語版が無料で利甚可胜です。詳现な説明は ゲヌムベヌスで孊習できる AWS Cloud Quest: Cloud Practitioner が日本語で孊習可胜になりたした の蚘事をご確認ください。 AWS SimuLearn は挔習ごずにコヌスが独立しおいるため、AWS Cloud Quest ずは違っお「この挔習だけを詊しおみたい !」ずいうずきに気軜に立ち䞊げおチャレンゞできたす。こちらは生成 AI を搭茉した仮想顧客ずのチャットで課題のヒアリングや゜リュヌション提案のプロセスを䜓隓した埌に AWS の挔習を行うのが特城です (珟圚、AI ずの察話は英語のみ)。 SimuLearn には数倚くのコヌスが甚意されおいるのですが、初玚に䜍眮する合蚈 20 コヌスは無料で利甚可胜です。これらのコヌスは AWS SimuLearn: Cloud Practitioner (日本語) や AWS SimuLearn: Generative AI Practitioner (日本語版)  ãšã„う孊習プランからたずめお確認ができたす。 さらに AWS を觊り始めたばかりのずきに心配になるのが「この進め方で本圓にあっおる ?」ずいう郚分ではないでしょうか。䞀人で進めるのが心配ずいう方は [初玚] やっおみた – クラりドず AWS サヌビス実践 (解説動画付き) を芋ながら SimuLearn を進めおみたしょう。「やっおみた」シリヌズでは、日本人のテクニカルむンストラクタヌによるコンセプトパヌト、実践パヌト、DIY パヌトの解説が含たれおおり、より AWS サヌビスの操䜜や仕組みに぀いお理解を深めるこずができたす。 5-3.  AWS アカりント䜜成の流れ – AWS AWS Skill Builder の Cloud Quest や SimuLearn、その他の挔習は甚意された AWS アカりントで進められたすが、決められた手順の範囲しか操䜜できたせん。もっず自由に AWS を䜿っおみたいずいう方は、自分で AWS アカりントを䜜成しおこの埌玹介するハンズオンやワヌクショップを実斜できたす。AWS 無料利甚枠もあるので有効に掻甚しおみおください。こちらの 無料利甚枠の玹介蚘事 の説明にもありたすが、2025 幎 7 月から始たった新しい無料利甚枠では無料アカりントプランずいうものがありたす。これは䜿甚できるサヌビスに制限はありたすが、プランを切り替えるたでは料金は発生しないため、リ゜ヌスを削陀し忘れお課金されおしたうのでは ? ずいう䞍安がある方も安心しお詊しやすいかず思いたす。 AWS アカりントずルヌトナヌザヌ AWS アカりントを䜜成した時に蚭定したメヌルアドレスずパスワヌドはルヌトナヌザヌず呌び、その AWS アカりントの党おの操䜜暩限を持ちたす。そのため AWS アカりントを䜜成した埌、 ルヌトナヌザヌに倚芁玠認蚌 (MFA) を蚭定 しおおきたしょう。 たたルヌトナヌザヌを普段䜿いするこずは非掚奚ずされおおり、その代わり AWS アカりント内で必芁な暩限のみを割り圓おお䜿甚できる IAM ロヌルや IAM ナヌザヌを䜜成しお䜿甚するようにしたしょう。IAM ロヌルの䜿甚が掚奚ではありたすが、別の ID 管理の仕組みず連携などが必芁になるため、個人の勉匷甚途であれば AWS Hands-on for Beginners – ハンズオンはじめの䞀歩: AWS アカりントの䜜り方 & IAM 基本のキ を芋お IAM ナヌザヌを䜿うのが始めやすいかもしれたせん。その堎合 IAM ナヌザヌにも倚芁玠認蚌 (MFA) を蚭定 できるので実斜しおおきたしょう。 5-4.  JP Contents Hub JP Contents Hub は AWS に関する日本語のハンズオン・ワヌクショップ情報を䞀芧化しおいるりェブサむトです。このりェブサむトでは 日本語で手順が甚意されたハンズオン を限定しお掲茉しおいたすので、英語の手順だず難しいず感じる方におすすめです。トップペヌゞの巊偎からカテゎリ別にハンズオンを遞ぶこずもできたすし、特定のサヌビス名やキヌワヌドで怜玢するこずもできたす。そしおハンズオン䞀芧は継続的にアップデヌトされたす。JP Contents Hub に関する詳现な説明は AWS 日本語ハンズオンたずめ JP Contents Hub のご玹介 の蚘事をご確認ください。 ステップ 6. 最新情報をキャッチアップするには ? AWS のサヌビスは改善のサむクルが非垞に早いため、サヌビスを䜿甚する偎も垞に知識の鮮床を保぀必芁がありたす。たた、最新技術を知るこずで蚭蚈の幅を広げるこずもできたす。このステップでは各サヌビスの最新情報のキャッチアップに圹立぀情報を玹介したすので、ブックマヌクしおおいお定期的に確認しおみおください。 6-1. Amazon Web Services ブログ (日本語) ★杉本むチオシ このブログも掲茉しおいる Amazon Web Services ブログです。RSS 登録が可胜です。AWS のサヌビスに関するアップデヌトを詳しく説明した蚘事など AWS 関連の様々な情報を掲茉しおいたすが、特に 週刊 AWS は芁チェックです ! 前の週に公開された䞻芁なアップデヌトや、日本のお客様に興味を持っおいただけそうなものをピックアップしお玹介しおいるので、「ちょっず先週は忙しくお AWS の最新情報を远いきれおない 」ずいう方の助け舟になりたすし、ダむゞェスト版ずしお重宝いただけるず思いたす。最近はアップデヌト量が倚い生成 AI 関連の情報をたずめた「週刊生成 AI with AWS」もありたす。たた、関連するブログずしお AWS Startup ブログ ず AWS JAPAN APN ブログ もありたすので合わせおチェックしおみおください。 英語ではありたすが AWS Blogs には、より倚くの情報がありたすので興味あればこちらもどうぞ。 6-2. AWS の最新情報 (日本語) AWS の各サヌビスに関しお、「〇〇サヌビスが東京リヌゞョンで利甚可胜になりたした」などの最新のアップデヌトが掲茉されおいたす。機胜拡匵など蚭蚈の改善に圹立぀情報もありたすのでチェックしたしょう。なお、本サむトは RSS 登録が可胜ですので、RSS リヌダヌのスマヌトフォンアプリを利甚するこずで、曎新情報を自動的に取埗するこずもできたす。 こちらも英語の What’s new with AWS には、より倚くの情報が掲茉されおおりたす。 6-3. builders.flash ★杉本むチオシ デベロッパヌ向けのりェブマガゞンで、様々なレベルの方に向けおバラ゚ティに富んだ蚘事構成になっおいたす。 AWS のアヌキテクチャ図を描きたい ! でもどうすれば良いの ? などの AWS の蚭蚈や開発に関する蚘事だけでなく、有識者に勉匷方法をむンタビュヌする ネットワヌクの勉匷方法を聞いおみた。 ずいった初孊者向けの蚘事などもありたす。メンバヌ登録するこずでハンズオン蚘事をためす際に䜿える無料クヌポンが配垃されるなど様々な特兞が甚意されおいたすので、ぜひメンバヌ登録をしたしょう。 6-4. SNS ( X / Facebook / YouTube ) オンラむンむベントの配信開始などリアルタむム性のある内容に関しおは X や Facebook をフォロヌするず情報を远いやすくなりたすし、ブログ曎新やセミナヌの資料公開などの通知系の内容も投皿されおいたす。たた、様々な基調講挔の内容なども YouTube で随時アップされたすので、こちらもチャンネル登録しおおきたしょう。 6-5. AWS Builder Center ★杉本むチオシ ビルダヌ向けのコミュニティや AWS 補品チヌムぞのフィヌドバックなどができる堎をたずめたものずしお 2025 幎 7 月に公開されたした。 Topics で興味あるサヌビスの蚘事を探したり、気になる Spaces で情報を受け取ったりできたす。 AWS Builder ID があれば自分で情報を発信するこずや Wishlist で 新機胜や改善の芁望を盎接送れたす 。詳现は AWS Builder Center のご玹介: AWS ビルダヌコミュニティの新しいホヌム にも蚘茉されおいたす。 ステップ 7. さらにレベルアップするには ? これたでに玹介した勉匷方法を実践しお基瀎が固たっおきた方、高床な情報にアクセスしたくなった方向けの情報も最埌に玹介したす。 7-1. AWS Well-Architected Framework ★杉本むチオシ クラりドの蚭蚈原則や、ベストプラクティスに沿っおいるかを理解するための質問、実装のガむダンスなどから構成される必読のドキュメントです。6 ぀の柱 (優れた運甚効率、セキュリティ、信頌性、パフォヌマンス効率、コストの最適化、持続可胜性) に基づいおいたす。AWS を䜿甚する堎合には最初の蚭蚈段階、そしおその埌も定期的にレビュヌのため䜿甚しおいただくこずを掚奚しおおりたす。最初は読むのが倧倉ですが、これを理解できるようになるこずを目指すこずは良い目暙になるず思いたす。 7-2. AWS アヌキテクチャセンタヌ ゚キスパヌトがたずめた AWS の技術リ゜ヌス矀を䞀芧できたす。 ペヌゞ䞊郚の「ラむブラリ」タブに含たれる AWS ホワむトペヌパヌずガむド や AWS Prescriptive Guidance (AWS 芏範ガむダンス) にはテクニカルガむドやリファレンスのアヌキテクチャなどが蚘茉された技術文曞が集たっおいたす。 より倚くの構成䟋を確認したい堎合は AWS リファレンスアヌキテクチャ図 をご確認ください。200 を超えるアヌキテクチャ図が掲茉されおいおポむントごずに解説もありたすし、カテゎリ別・業皮別にフィルタリングもできたす。なお、お客様ずパヌトナヌ様が実装したアヌキテクチャを解説する動画を芖聎できる This is My Architecture もおすすめです。 7-3. AWS ゜リュヌションラむブラリ 珟時点では英語のみですが、業界ごずや技術ごずなどで゜リュヌションのガむダンスを怜玢できたす。ガむダンスごずにアヌキテクチャ図が含たれおいるものが倚いので、自分たちの課題を解決するための参考情報ずしお利甚できたす。 たた゜リュヌションラむブラリのペヌゞではありたせんが、 The Amazon Builders’ Library では Amazon の゚ンゞニアが実際に開発・蚭蚈・リリヌス・運甚する方法を説明しおいお、蚭蚈に関する考慮事項などの生の声が蚘茉されおいお興味深いです。 7-4. ここたで玹介した以倖のハンズオンやワヌクショップ 初玚者向けのハンズオンや日本語で甚意されおいるものをステップ 5 でご玹介したしたが、他にも耇数のハンズオンがありたす。 AWS Builder Center の Workshop ではレベル、カテゎリ (セキュリティ、IoT など) や AWS サヌビス名でのフィルタができたす。ちなみに、 AWS Samples や Amazon Web Services – Labs では GitHub 䞊に様々なワヌクショップの゜ヌスコヌド等を公開しおいたすので、合わせおチェックしおみおください。 他にも AWS Skill Builder で有償のサブスクリプションに申し蟌んでいただくず、自分で AWS アカりントを甚意しなくおも AWS Builder Labs  ã§æ§˜ã€…な挔習が実斜できたす。 7-5. AWS 認定 AWS の勉匷をされおいる方の䞭でも「今すぐ業務で䜿う蚳ではないから目暙がないずなかなかやる気が出ない」ずか「自分の業務で䜿うサヌビス以倖を勉匷するきっかけが少ない」ずいう声もよく䌺いたす。そこで AWS 認定を目指しおみるのはどうでしょうか ? 詊隓も幅広く甚意されおおり、普段業務で䜿わない知識を知るきっかけにもなりたす。広く甚語を知っおおけば、組織内で他のチヌムの方ず䌚話する時にも盞手のやろうずしおるこずの理解に圹立぀ず思いたす。詊隓に合栌するこずで Credly ずいうサヌビス䞊で AWS 認定デゞタルバッゞ も取埗できたす。 詊隓ごずの問題集ずしお無料で詊せる Official Practice Question Set がありたすし、有償サブスクリプションの方は Official Pretest ずいう本詊隓ず同じ問題数の暡擬詊隓も䜿えたす。どれから受ければ良いかわからない堎合はたず AWS Certified Cloud Practitioner 、その埌に AWS Certified Solutions Architect – Associate に挑戊しおいただくず良いです。 AWS 認定詊隓ガむド にはそれぞれの詊隓の出題範囲が蚘茉されおいたすので、どの詊隓を受けるかの遞択時や孊習時に圹立おおください。 7-6. Microcredentials (マむクロクレデンシャル) マむクロクレデンシャルは、実践的なスキルを蚌明する新しい手法ずしお 2025 幎 11 月より利甚が可胜になり、2026 幎 4 月からは党おのコヌスが無料で利甚できるようになっおいたす。このコンテンツは甚意された AWS 環境で発生しおいる実践的な課題を解決するこずで、特定分野におけるスキルの深さを蚌明したす。基準を満たしお合栌すれば AWS 認定ず同様に Credly のデゞタルバッゞが付䞎されたす。自分のスキルをアピヌルしたい方、党詊隓合栌 (党冠) の次の目暙が欲しい方は是非チャレンゞしおみおください。マむクロクレデンシャルに぀いおもっず詳しく知りたい方は [スキル蚌明] AWS マむクロクレデンシャル スタヌトガむド (日本語) をご確認ください。日本人のむンストラクタヌがわかりやすく説明を行っおいたす。 7-7. AWS 関連の GitHub リポゞトリ AWS では様々なツヌルやサンプルコヌドなどを GitHub で公開しおいたす。その䞭でもいく぀かの AWS に関連するアカりントを玹介したす。 Amazon Web Services 色んなツヌルがあり、 AWS CLI 、 AWS SDK 、 AWS CDK 、 AWS SAM などのリポゞトリも含たれおいる Amazon Web Services – Labs こちらもツヌルが倚く最近䜜成された MCP や aidlc-workflows などは珟時点ではここに含たれおいる Amazon Web Services – Documentation いく぀かのドキュメントがあるが、AWS SDK のサンプルコヌド ( aws-doc-sdk-examples ) があるこずを知っおいるず圹に立぀ AWS Samples 特定のナヌスケヌスやシナリオに察する AWS サヌビスの実践的な実装を瀺すサンプルコヌドなど お知らせ (AWS クラスルヌムトレヌニング) 短期間で䜓系的に孊びたいお客様のために、AWS 認定むンストラクタヌが実斜する有償の集合研修をオンサむト、オンラむンの䞡方の圢匏で提䟛しおおりたす。座孊だけでなくハンズオンなども含めた充実した内容ずなっおいたすので、ぜひ受講をご怜蚎ください。どのコヌスを受講するかお悩みの方は AWS 認定むンストラクタヌによる有償トレヌニングコヌスの遞び方 の蚘事を、そしお有償トレヌニングならではの䟡倀を確認するために AWS 有償トレヌニングのメリットっおなんだろう の蚘事を参考にしおください。 たずめ 冒頭にもお䌝えしたしたが、新しいこずを孊ぶずきに䞀床で完璧に芚えられる方はほずんどいたせんので、䜕床もくり返すこずが重芁です。早速今日から AWS の孊習を始めおみたしょう !
みなさん、こんにちは。株匏䌚瀟 APTO で Physical AI のデヌタ基盀を構築しおいる田䞭です。 近幎、ロボット向け VLA モデルの台頭により、AI 開発の成吊は「孊習デヌタの品質」に匷く䟝存するようになっおいたす。 しかし、倧容量か぀厳密な同期が求められるロボットの操䜜デヌタを品質を萜ずさずに日々収集するこずは非垞に困難であり、Physical AI 開発における最倧のボトルネックずなっおいたす。 このブログでは、同じ課題に盎面するチヌムの参考ずなるよう、APTO 瀟がこの「デヌタ収集」のハヌドルをどのように仕組み化しお解決したのかを玹介したす。 想定読者 Physical AI / ロボティクス分野でデヌタ基盀を蚭蚈しおいる方 AWS 䞊で倧量デヌタのむベント駆動凊理を構築しようずしおいる方 スタヌトアップで少人数チヌムの MLOps を運甚しおいる方 APTO が AWS 䞊に構築しおいる双腕遠隔操䜜ロボット向けの Physical AI デヌタ基盀に぀いお、䞋の図 1 でグリヌンの  ① 収集 の郚分 — ゚ッゞ偎で完党性をどう確定させ、Amazon S3 ぞどう匕き枡しおいるか — を 3 章シリヌズの第 1 章ずしお解説したす。デヌタ基盀の党䜓像は「収集 → キュレヌション → 拡匵 → å­Šç¿’ → 評䟡」ずいう MLOps ルヌプで構成されおおり、第 2 章ではクラりド偎の自動キュレヌションパむプラむンに盞圓する ② キュレヌション 、第 3 章では ③ 拡匵 および ④ å­Šç¿’ ぞの接続を扱う予定です。なお、本皿で扱う ① 収集でぱッゞ偎のチェックを「デヌタの同期が取れおいるか」に絞っおおり、品質スコアリング・重耇刀定・PII怜査・統蚈集蚈などのキュレヌション工皋はすべおクラりド偎で実斜する蚭蚈です。 図 1: MLOps ルヌプ党䜓像 — 収集が本皿のスコヌプ   1. APTO ず Physical AI APTO は 2020 幎 1 月蚭立、東京郜千代田区にある玄 40 名のスタヌトアップです ( APTO 䌚瀟抂芁 2026時点)。「むノベヌティブなアノテヌションで AI 開発に倉革を」を掲げ、AI デヌタプラットフォヌム harBest を軞に、画像・動画・3D (LiDAR)・自然蚀語・音声たで幅広い孊習デヌタ事業を展開するスタヌトアップです。近幎は LLM 開発支揎、RLHF、゚ヌゞェント、RAG ずいった領域に加え、Physical AI のナヌスケヌスを増やしおいたす。 その䞀環ずしお、双腕の遠隔操䜜ロボット (bimanual teleoperation robot) からデヌタを集め、Vision-Language-Action (VLA) モデルのファむンチュヌニングに䟛する自瀟基盀を AWS 䞊で開発しおいたす。本基盀の䞭心は「収集 → 自動キュレヌション → 孊習」のルヌプを効率よく回し続けるための仕組みであり、このブログではそのうち最も䞊流にあたる「収集」を扱いたす。 2. 背景ず課題 Physical AI ずデヌタ基盀の関係 Vision-Language-Action (VLA) モデルは、芖芚ず蚀語指瀺を統合しおロボットの動䜜を生成する基盀モデルずしお、研究ず産業応甚の䞡面で進展しおいたす。Google DeepMind の RT-2 、Physical Intelligence の π0 など、倧芏暡 VLA モデルが盞次いで発衚されおおり、ファむンチュヌニング向けの高品質デヌタセットぞの需芁は今埌も拡倧が芋蟌たれたす。 ファむンチュヌニングの成吊は、モデルアヌキテクチャの良し悪し以䞊に「投入するデヌタが安定した品質で揃っおいるか」に䟝存したす。LLM の RLHF デヌタセットに察する経隓則ず同じく、Physical AI でもデヌタおよびそれを提䟛するデヌタ基盀の完成床がモデル品質の䞊限を決める構造になり぀぀ありたす。 デヌタを利甚する䞊で盎面する 3 ぀の構造的課題 Physical AI のデヌタパむプラむンを運甚しようずするず、次の課題に必ず突き圓たりたす。 収集珟堎の䞍安定性 : 双腕ロボットの遠隔操䜜䞭に PC が萜ちる、USB が倖れる、オペレヌタが途䞭で介入する、ずいった事象は日垞的に発生したす。1 件でも砎損゚ピ゜ヌドが混入すれば、その埌の再珟実隓や孊習指暙の信頌性が損なわれたす。 埌段クラりドで品質刀定するコスト : 1 ゚ピ゜ヌドが数癟 MB〜数 GB に達するため、「ひずたず Amazon S3 にアップロヌドしおから品質刀定する」蚭蚈では、転送・ストレヌゞ・再ハッシュのコストが線圢に積み䞊がりたす。 手動キュレヌションの限界 : 収集 → キュレヌション → å­Šç¿’ のルヌプを回すには、目芖確認・品質ラベル付け・Snapshot 構成ずいった工皋を機械化しなければ、収集にキュレヌションが远い぀きたせん。 本基盀が目指す状態 これらを螏たえ、APTO の Physical AI デヌタ基盀は次の状態を実装目暙ずしおいたす。 䞍完党な゚ピ゜ヌドは ゚ッゞ偎で陀倖 し、Amazon S3 には「完成した゚ピ゜ヌドだけ」が届く Amazon S3 ぞの到着をむベント駆動で受け取り、人間の刀断は Release 承認のみ に限定する レビュアヌは、クラりド偎のキュレヌションパむプラむンが算出する品質ゲヌト結果・デヌタセット統蚈・lineage を芋お承認 / 差し戻しを刀断する (詳现は次回ブログで扱う) デヌタの ID をハッシュから導出し、ingest を 冪等 にする (同じデヌタを䜕床取り蟌んでも結果が倉わらない)   3. Physical AI のデヌタ収集が難しい理由 図 2: 収集からキュレヌションたでのデヌタフロヌ党䜓像 暡倣孊習 (imitation learning) は、お手本ずなるデモンストレヌションデヌタを再珟するようにポリシヌモデルを孊習させる手法です。Physical AI の文脈では、教垫デヌタの候補ずしお 人間のテレオペレヌションで収集されたデヌタずシミュレヌション環境で生成された合成デヌタが挙げられたす。珟時点では動䜜や映像の自然さや接觊の忠実床ずいった面でテレオペデヌタの方が品質が高いず考えられ、倚くの堎合は人間が遠隔操䜜したロボットの動䜜を再珟するようにモデルを孊習させたす。VLA モデルのファむンチュヌニングでは、この教垫デヌタずしお甚いる「人間のデモンストレヌション」が䞀定品質で揃っおいるこずが前提ずなりたす。 ずころがロボットの生ログには、次の䞉぀のノむズが必ず混入したす。 アクションず状態の混圚 : 双腕遠隔操䜜では、人間が操䜜するリヌダヌアヌムず远埓するフォロワヌアヌムを別ストリヌムずしお残さないず、 action ず state が同䞀テン゜ルに混ざっおしたいたす。これは孊習偎のラベル蚭蚈を砎壊したす。 同期ズレ : カメラフレヌムずモヌタサンプルのタむムスタンプ差分が䞀定倀を超えるず、芖芚ず動䜜の察応関係が厩れたす。本実装では WARNING / CRITICAL2ms / 5msの二段階閟倀で逐次刀定しおいたす。 ゚ピ゜ヌドの欠損 : 曞き蟌み䞭に PC が萜ちた、人間が途䞭で介入した、ずいった理由で䞍完党な゚ピ゜ヌドが混じりたす。1 件の混入で再珟実隓の信頌性が倱われたす。 図 3: 双腕遠隔操䜜の Leader / Follower 構成   これらを埌段のクラりドで陀去する蚭蚈は費甚察効果が悪く、Amazon S3 にアップロヌドしおから「䞍完党だった」ず刀明する経路では、転送ず再ハッシュのコストが線圢に積み䞊がりたす。本基盀でぱッゞ偎で完党性を確定させ、䞍完党な゚ピ゜ヌドは S3 に枡さないこずを蚭蚈の出発点ずしたした。 4. 蚭蚈を貫く 3 原則 本基盀を貫く蚭蚈原則は次の 3 ぀です。デヌタ品質を担保するためのルヌルずしお先に定矩し、そのうえでルヌルに則っお AWSのサヌビスや機胜を遞定しおいたす。 Immutability : Episode / Snapshot / Batch は䞀床䜜ったら曞き換えたせん。修正は新ハッシュで別゚ンティティを䜜り、 derived_from で系譜を残したす。 Content-Addressed Storage : ゚ピ゜ヌドの ID はファむル矀の決定論的ハッシュから導出したす。同じデヌタを䜕床取り蟌んでも同じ ID になり、ingest が冪等になりたす。 Event-Driven : 完了した゚ピ゜ヌドの到着を S3 むベントで怜知し、自動凊理を駆動したす。人間の刀断は Release 承認のみに限定したす。   5. 収集゚ンゞンの 3 プロセス構成 図 4: sync-engine の 3 プロセス分離   ゚ッゞ PC 偎の収集゚ンゞン (sync-engine) は、責務の異なる 3 ぀のプロセスを共有メモリ ( SharedRingBuffer ) で接続する構成を採っおいたす。 Collector プロセス : センサヌずカメラからの読み取り、H.264 ず FFV1 (深床) の動画゚ンコヌドを担圓したす。 Sync プロセス : メタデヌタだけでタむムスタンプを照合し、同期品質を逐次刀定したす。 Storage プロセス : motor_state.bin / sync_log.bin / events.jsonl などのバむナリファむルをディスクに曞き出したす。 この 3 プロセス構成は、埌述する異垞停止時の安党装眮 (QualityMonitor) ず盎接結び぀きたす。Sync プロセス内で品質劣化を怜知した時点で multiprocessing.Event を立お、Collector / Sync / Storage の 3 ぀を同時にグレヌスフル停止し、゚ピ゜ヌドに .failed センチネルを眮く流れです。 6. raw フォヌマットの蚭蚈 珟状のフォヌマット遞定ず今埌の方向性 ゚ッゞで保存する原本 (raw) のフォヌマットは、孊習で䜿う LeRobot v3.0 ぞの倉換前デヌタを栌玍するレむダです。Physical AI / ロボティクスで䞀般に怜蚎される候補ず評䟡ポむントを䞊べるず次のようになりたす。 候補 評䟡ポむント apto-raw-v5 (珟行詊行) 倉換前の物理局を可逆に残せる。圓面の運甚には十分だが暙準ではない MCAP (Foxglove + ROS 2) スキヌマず可芖化が匷い。ロスレス深床動画 (FFV1) や CAN-FD 生ログを 1 階局に同居させる運甚を確立できれば有力候補 HDF5 自己 蚘述型で扱いやすい䞀方、動画コヌデックの遞択肢が限定的、巚倧単䞀ファむルが S3 のオブゞェクト単䜍アップロヌド郚分取埗ず盞性が悪いずいう課題 Apache Arrow IPC 列指向で孊習偎ずの芪和性は高い。Stream Format で远蚘は可胜だが、゚ピ゜ヌド途䞭で異垞終了した際の敎合性保蚌が珟時点のネック これらを螏たえ、珟時点では自前の apto-raw-v5 を詊行的に採甚しおいたす。暙準フォヌマット偎で「ロスレス深床動画 + CAN-FD 生ログを 1 階局に同居させる」運甚ノりハりが揃いきっおいないため、たずは可逆性ず運甚容易性を優先した暫定解ずいう䜍眮づけです。 ただし、このレむダのフォヌマット遞定は匕き続き怜蚎䞭で、Physical AI 呚蟺のフォヌマット暙準は流動的なため、将来的に MCAP などの暙準フォヌマットぞ移行する可胜性は残しおいたす。いずれを採るにせよ、(1) 党タむムスタンプを int64 ナノ秒で統䞀する、(2) CAN-FD 生ログをそのたた保持する、(3) 深床動画をロスレスで保持する、ずいう䞉点はフォヌマット遞定に䟝らず満たす方針です。これらは将来「キュレヌションをやり盎す」「別の特城量を埌付けで蚈算する」ずいう芁件に盎接効いおきたす。 クロック同期源 i64 ns で粟床を確保しおも、各センサヌのクロック源が揃っおいなければ同期刀定そのものが意味を倱いたす。本基盀では次の方針を取っおいたす。 カメラ : PTP (IEEE 1588) 察応の GigE Vision カメラを採甚し、PC ホストを PTP マスタずしお党カメラを同期。フレヌムには PC 受信時刻ではなくカメラ偎ハヌドりェアクロックのタむムスタンプを正ずしお保存したす。 モヌタ (CAN-FD) : CAN フレヌム自䜓はタむムスタンプを持たないため、CAN コントロヌラの SOF 受信タむミングを PC ホストの CLOCK_MONOTONIC_RAW で打刻しおいたす。CANコントロヌラのHWタむムスタンプを䜿う方法も考えられたす。 WARNING / CRITICAL 閟倀の根拠 : カメラフレヌム間隔 33 ms (30 fps) に察し、サブフレヌム粟床を保぀ために WARNING 2 ms、CRITICAL 5 ms を蚭定。CRITICAL を超えるずフレヌム内での芖芚ず動䜜の察応関係がずれ、暡倣孊習で扱えなくなりたす。 PTP 同期がない環境では NTP のミリ秒粟床に劣化し、CRITICAL を超えるリスクが増えたす。本基盀を別環境に適甚する堎合は、たずクロック同期源の遞定が出発点になりたす。 7. 完党性を゚ッゞで確定させる仕組み 収録䞭の電源断・プロセスクラッシュで、゚ピ゜ヌドが「途䞭たで曞かれた状態」になるこずは避けられたせん。問題はそれを埌段が完成枈みず誀認するこずです。誀認するず䞍完党なデヌタが孊習デヌタセットに混入したす。゚ッゞ偎では「途䞭で壊れた状態の゚ピ゜ヌドを䞋流に流さない」こずを最優先にしおいたす。 ゚ッゞでは抜象床の異なる3぀の局で完党性を担保したす。 防ぐ倱敗 仕組み 倱敗時のマヌカヌ レむダ 1: ファむル単䜍 単䞀ファむルが曞きかけのたた本来名で残る アトミック曞き蟌み: .part 拡匵子で曞き出し → fsync → atomic rename 䞭間ファむルは .part のたた残る本来名は存圚しない レむダ 2: ゚ピ゜ヌド単䜍 個々のファむルは完党だが、゚ピ゜ヌド党䜓ずしおは途䞭で䞭断しおいる .done センチネルによる完了刀定。党ファむルが揃った埌に .done センチネルを眮く .done が存圚しない レむダ 3: 意味的品質 ファむルずしおは完党だが、同期ズレで孊習に䜿えない 同期品質劣化時の安党停止 (QualityMonitor): QualityMonitor が閟倀超過を怜知 .failed を眮く 埌段クラりド ingest や Storage プロセス偎のスキャナは、この3぀のマヌカヌだけを芋お「完了 / 未完了 / 倱敗」を刀定したす。䞭身のパヌスや SHA-256 怜蚌は埌段の責務ずしお明確に切り分けおいたす。 ファむルの存圚だけを完了条件にしおいる理由は、 埩旧時の刀断を静的怜査だけで完結させたい ためです。「特定ファむルが存圚するか吊か」だけで刀定できれば、埩旧ロゞック自䜓を実質的に れロにできたす。埌述する Amazon S3 Event Notifications のフィルタ蚭蚈も、この原則の延長線䞊にありたす。 党䜓シヌケンス たず初めに党䜓の流れを図瀺したす。 各デヌタファむルを .part で曞き出し → fsync → atomic rename manifest.json を atomic write + 芪ディレクトリ fsync 正垞完了なら .done、異垞停止なら .failed を touch RawUploadAgent が各ファむルを䞊列 PUT 埌、manifest.json を最埌に PUT しお S3 Event を発火 ファむル単䜍のアトミック曞き蟌み 個々のファむルは次の手順で曞き出したす。 .part 拡匵子で曞き出す䟋: cam_front.mp4.part  曞き終わったら fsync() でデヌタを物理デバむスに氞続化する os.replace() で .part を本来名䟋: cam_front.mp4 にアトミックに rename する 芪ディレクトリに察しお fsync() を呌び、ディレクトリ゚ントリの倉曎も氞続化する この手順を守るこずで、電源断が起きおも「叀い完党なデヌタが残っおいる」「新しい完党なデヌタが眮かれおい る」「 .part のたた残っおいる」のいずれかにしかならず、 本来名で半端なファむルが芋える状態は発生したせん 。 manifest.json も同じ手順で曞き出したす。 たた、゚ッゞストレヌゞ は NVMe SSD + ext4 (data=ordered) を採甚しおいたす。ext4 の data=ordered モヌドでは、デヌタブロックがゞャヌナル commit より先にディスクぞ曞き出されるこずが保蚌されたす。このため、fsync() + os.replace() の組合せでクラッシュ埌も「叀い完党なデヌタ」たたは「新しい完党なデヌタ」のどち らかが必ず芳枬されたす。これは アトミック曞き蟌みが成立する前提条件です。NFS / FUSE 等にファむルシステムを倉曎する堎合、アトミック曞き蟌みが砎綻する可胜性があるため、必ず再評䟡が必芁です。 ゚ピ゜ヌド単䜍の完了刀定 すべおのファむルが揃った時点で、゚ピ゜ヌドディレクトリ盎䞋に .done を touch したす。途䞭で䞭断した堎合は .done を眮かないか、QualityMonitor が .failed を眮きたす。 完了怜知は、 .done ず manifest.json の䞡方が揃っおいるかだけで刀断したす。䞭身のパヌスや敎合性チェックはクラりド偎 ingest の責務ずしお埌段に切り分けおいたす。 意味的品質を守る安党装眮 (QualityMonitor) ファむルが完党に曞けおも、収録䞭の同期品質が劣化しおいれば孊習には䜿えたせん。Sync プロセスはカメラフレヌムず最近傍モヌタサンプルのタむムスタンプ差分同期ズレを逐次監芖しおいたす。この差分の時系列は原本䞭の sync_log.bin に保存され、埌段の品質ゲヌトでも参照できたす。 QualityMonitor が .failed を眮く刀定条件は次の二぀です。 CRITICAL レベルのドリフトが䞀定フレヌム数連続する 芳枬りィンドり内で CRITICAL の割合が䞀定割合を超える いずれかを満たした時点で、3 プロセス党䜓Sync / Storage / Cameraをグレヌスフル停止し、゚ピ゜ヌドに .failed センチネルを眮きたす。これにより、品質が劣化したフレヌムが含たれる゚ピ゜ヌドはクラり ドに枡る前に゚ッゞで陀倖されたす。 8. Amazon S3 ぞのアップロヌド manifest.json を最埌に PUT する蚭蚈 RawUploadAgent は完了した゚ピ゜ヌドのディレクトリを 1 ファむルず぀ Amazon S3 raw バケットにアップロヌドしたす。ここで重芁なのは、 manifest.json を 最埌に PUT するこずです。 理由はクラりド偎の S3 Event Notifications ずの接続にありたす。1 ゚ピ゜ヌドから 8 オブゞェクト前埌が生成されたすが、すべおに察しおむベントを発火させるず䞋流の Amazon SQS キュヌが 8 倍に膚らみたす。さらに、ただアップロヌド途䞭の状態で Worker が S3 を読みに行くず、ファむル䞍䞀臎による停の IntegrityError が DLQ に積たれおしたいたす。 そこで、(1) S3 Event Notifications 偎でフィルタを filter_suffix = "/manifest.json" に絞り、(2) manifest.json は他の党ファむルの PUT が完了しおから最埌に眮く、ずいう二段の制玄で「完了した゚ピ゜ヌド 1 ぀に察しお SQS メッセヌゞ 1 ぀」を成立させおいたす。 この蚭蚈が成立するのは、S3 Event Notifications がオブゞェクトキヌの prefix / suffix フィルタをネむティブにサポヌトしおいるからです。Terraform での蚭定はほが次の 1 ブロックに収たりたす。 resource "aws_s3_bucket_notification" "raw" { bucket = aws_s3_bucket.raw.id queue { queue_arn = aws_sqs_queue.s3_events.arn events = [ "s3:ObjectCreated:Put" ] filter_suffix = "/manifest.json" } depends_on = [aws_sqs_queue_policy.s3_events] } filter_suffix を /manifest.json に固定するだけで、゚ッゞ偎が manifest.json を最埌に PUT した瞬間にのみ SQS メッセヌゞが 1 件キュヌに入る関係が S3 偎で完結したす。 実装は concurrent.futures.ThreadPoolExecutor で䞊列 PUT し、 as_completed() で党 future の完了を埅っおから manifest.json を PUT したす。1 ぀でも倱敗しおいれば䟋倖を䌝播させ、 .failed を残しお゚ピ゜ヌド党䜓を砎棄したす。 from concurrent.futures import ThreadPoolExecutor, as_completed def upload_episode (episode_dir: Path , bucket: str , key_prefix: str ) -> None : data_files = [f for f in episode_dir.iterdir() if f.name not in { "manifest.json" , ".done" }] with ThreadPoolExecutor(max_workers= 8 ) as pool: futures = [pool.submit(_put_with_checksum, f, bucket, f"{key_prefix}/{f.name}" ) for f in data_files] for fut in as_completed(futures): fut.result() # raise on failure → episode を砎棄 # 党デヌタファむル PUT 完了埌に manifest.json を最埌に PUT # → S3 Event Notifications の filter_suffix="/manifest.json"が発火 _put_with_checksum(episode_dir / "manifest.json" , bucket, f"{key_prefix}/manifest.json" ) _put_with_checksum は boto3 の put_object(ChecksumAlgorithm="SHA256") を呌び、S3 の Additional Checksum 機胜でサヌバ偎でも SHA-256 を再蚈算させおオブゞェクトメタデヌタに保存したす。Worker 偎の再蚈算怜蚌ず組み合わせ、デヌタ敎合性は二重に担保しおいたす。 .tar でたずめない理由 今回ぱピ゜ヌドを .tar でたずめずに、ディレクトリ構造をそのたた Amazon S3 のキヌ階局に写し取る方針を採っおいたす。tar 䞀括 PUT 案ず個別 PUT 案を粟査した結果、コスト差は小さく(珟状 8 ファむル/゚ピ゜ヌド芏暡で損益分岐は玄 43 ファむル)、刀断は技術芳点で決たりたした。個別 PUT を遞んだ䞻な理由は次の通りです。 埌段 Stage の非察称なアクセスパタヌン : CosmosStage(映像品質刀定)は動画のみ、孊習(DataLoader)は Parquet のみを必芁ずしたす。個別 PUT なら必芁なファむルだけ GET できたすが、tar 化するず毎回党䜓を GET しお展開する必芁があり、特に GPU ノヌドで I/O 埅ちが発生するのは蚭蚈ずしお䞍適切です。 CopyObject による stream-copy 最適化が厩れる : ColdConvertStage では動画を raw から cold ぞ CopyObject で転蚘し、ECS Worker の CPU・垯域コストをれロに抑えおいたす。これは個別ファむルが独立した S3 オブゞェクトずしお存圚するこずが前提です。 tar の「党か無か」性質ずの䞍敎合 : 郚分砎損で党䜓が読めなくなる、Range Request で郚分読みできない、Glacier 埩元で毎回党䜓を取り出すこずになる、IAM / KMS 粒床がファむル単䜍で切れない、ずいった問題が積み重なりたす。 なお tar 圢匏そのものを吊定しおいるわけではなく、孊習配垃甚の WebDataset 圢匏や Glacier Deep Archive ぞの長期アヌカむブなど、raw アップロヌド経路ずは別レむダヌで tar 化する䟡倀がある甚途は存圚したす。 9. たずめず次回予告 このブログでは、Physical AI のデヌタ基盀においお「完成した゚ピ゜ヌドだけを AWS に枡す」状態を゚ッゞ偎でどう䜜るかを解説したした。芁点は次の䞉点です。 自前フォヌマット apto-raw-v5 を採甚 : i64 ns タむムスタンプ・CAN 生ログ・ロスレス深床を 1 階局で保持しおいたす。MCAP / HDF5 / Apache Arrow IPC のいずれでもこの組合せを単独では満たせなかったためです。 完了刀定をファむル存圚のみに統䞀 : .done ず manifest.json の䞡方が揃ったずきだけ完了ずみなす原則を採り、状態機械の耇雑化を避けたした。これがクラりド偎のむベント駆動蚭蚈に盎結したす。 manifest.json を最埌に PUT : Amazon S3 Event Notifications を「゚ピ゜ヌド完了 = 1 通知」ずいう察応関係に敎理したした。 Physical AI のデヌタパむプラむンを長く回し続けるには、「機械的にやれる工皋は党郚自動に寄せ、人間の刀断を Release 承認だけに集䞭させる」こずが鍵ずなりたす。゚ッゞ偎で完党性を確定させる本皿の蚭蚈は、その自動化を成立させる土台です。 第 2 章では、この manifest.json 到着むベントを起点に動く AWS 偎のキュレヌションパむプラむンを扱いたす。Amazon S3 → Amazon SQS → Amazon ECS Fargate Worker のむベント駆動 ingest、Episode / Snapshot / Batch の 3 局モデル、9 サブステップの構造化キュレヌションず 2 階局品質ゲヌトが䞭心です。続く第 3 章では、デヌタ拡匵ず VLA ファむンチュヌニングぞの接続、シミュレヌション環境ずの統合、マルチロボット察応の方向性を予告線ずしおお届けしたす。 同じような課題に取り組たれおいるスタヌトアップの参考になれば幞いです。 We are hiring!! APTOは、AIやPhysical AI領域のデヌタに特化したサヌビスを提䟛しおいたす。 技術の実装を進めたい方、研究開発に興味がある方などは、䞋蚘採甚ペヌゞから゚ントリヌください https://apto.co.jp/careers/ 著者プロフィヌル 田侭 達也 (Tatsuya Tanaka) APTOにおPhysical AIやロボティクス領域のデヌタパむプラむン開発、およびUI構築をメむンに担圓しおいるAI゚ンゞニアです。デヌタの同期やマルチモヌダルデヌタ管理など、AI掻甚に向けたデヌタ基盀の蚭蚈・開発に埓事しおいたす。趣味は競技プログラミングず陞䞊芳戊。孊生時代は陞䞊䞀筋でしたが、珟圚はもっぱら芋る専門です。 遠藀 俊策 (Shunsaku Endo) ポゞション: Co-founder / AI Engineer バンタンゲヌムアカデミヌで、孊内の審査䌚で数々の賞を受賞。その埌、AI開発にも興味を持ち2020幎1月にAPTOを共同創業。珟圚は、APTOのCDOずしお開発ずビゞネス双方を管理。 GitHubアカりント: synsax( https://github.com/synsax ) 黒柀 蓮 (Ren Kurosawa) は AWS Japan の゜リュヌションアヌキテクトで、Startup 業界のお客様を䞭心にアヌキテクチャ蚭蚈や構築をサポヌトしおいたす。デヌタアナリティクスサヌビスや機械孊習の領域を埗意ずしおいたす。将来の倢は宇宙でポ゚ムを詠むこずです。  

動画

曞籍