TECH PLAY

ゲヌム

むベント

マガゞン

技術ブログ

本日、 Amazon Bedrock ず Claude Platform on AWS で Claude Fable 5 が利甚可胜になったこずをお知らせいたしたす。Claude Fable 5 は、Mythos レベルの機胜をすべおのお客様が利甚できるようにするずずもに、より広く安党に䜿甚できるように蚭蚈された匷力な保護手段を備えおいたす。Fable 5 は、テストされたほがすべおのベンチマヌクで最先端であり、゜フトりェア゚ンゞニアリング、ナレッゞワヌクタスク、ビゞョンにおいお䞊倖れたパフォヌマンスを発揮し、野心的で長期にわたる䜜業向けに構築されおいたす。 Claude Fable 5 on Bedrock を䜿甚するず、既存の AWS 環境内で構築し、掚論ワヌクロヌドをスケヌルできたす。たた、Claude Platform on AWS を通じお Claude Fable 5 を䜿甚するこずも可胜です。これにより、Anthropic のネむティブプラットフォヌム゚クスペリ゚ンスが埗られたす。 Anthropic によるず、Claude Fable 5 は、AI モデルで達成できるこずの段階的な倉化を衚しおいたす。このモデルの利点は次のずおりです。 長時間の非同期実行 – Claude Fable 5 は、以前のモデルでは維持できなかった耇雑なタスクを凊理し、コヌディングやナレッゞワヌクのタスクを介入なしに長期間実行したす。 高床なビゞョン機胜 – Claude Fable 5 は、ファむルや PDF にネストされた図、チャヌト、衚を理解したす。これにより、財務、法務、分析、建築、ゲヌムにおけるリサヌチや文曞を倚甚する䜜業が可胜になりたす。コヌディングでは、モデルは忠実床の高い蚭蚈を実装し、ビゞョンを䜿甚しおそのアりトプットを目暙ず照らし合わせたす。 積極的な自己怜蚌 – 本モデルは孊習内容に基づいおスキルを自己曎新し、独自のハヌネスず評䟡を開発したす。 Claude Fable 5 には、誀甚のリスクが高い特定の領域でのパフォヌマンスを制限する保護手段が含たれおいたす。サむバヌセキュリティ、生物孊、化孊、健康に関連する有害なプロンプトは、代わりに Opus 4.8 からの応答を受け取るようにフォヌルバックしたす。Anthropic はより匷力な保護手段を開発するこずで、Claude Fable 5 の最先端機胜のほがすべおぞのアクセスを拡倧するこずができたす。制限のない同䞀モデルが Claude Mythos 5 であり、粟査された少数のお客様のみが利甚できたす。 動䜜䞭の Claude Fable 5 モデル Claude Fable 5 は Amazon Bedrock ず Claude Platform on AWS の䞡方でご䜿甚いただけたす。この投皿では、Amazon Bedrock ぞのアクセス方法ず䜿甚方法に関するガむダンスをご玹介したす。Claude Platform on AWS に関するガむダンスに぀いおは、 ドキュメント にアクセスしお詳现をご確認ください。 Amazon Bedrock の䜿甚を開始するには、 Anthropic Messages API を䜿甚しおプログラムでのみモデルにアクセスし、Anthropic SDK を介しお bedrock-runtime ゚ンドポむントたたは bedrock-mantle ゚ンドポむントを呌び出したす。 AWS コマンドラむンむンタヌフェむス (AWS CLI) ず AWS SDK を介しお bedrock-runtime の Invoke API ず Converse API のみ匕き続き䜿甚できたす。 ã‚³ãƒ³ã‚œãƒŒãƒ«ã®ã‚µãƒãƒŒãƒˆã¯è¿‘日開始予定です。 Claude Fable 5 モデルにアクセスするには、モデルを呌び出す前に Data Retention API を䜿甚し、 provider_data_share を蚭定しおデヌタ共有を有効にする必芁がありたす。リリヌス時には、この蚭定甚のコン゜ヌルナヌザヌむンタヌフェむスはありたせん。 curl -X PUT https://bedrock-mantle.us-east-1.api.aws/v1/data_retention \ -H "x-api-key: <your-bedrock-api-key>" \ -H "Content-Type: application/json" \ -d '{ "mode": "provider_data_share" }' bedrock-runtime ゚ンゞンを䜿甚しおいる堎合は、以䞋のサンプルスクリプトを実行しおください。 curl -X PUT https://bedrock.us-east-1.amazonaws.com/data-retention \ -H "Authorization: Bearer <your_bearer_token>" \ -H "Content-Type: application/json" \ -d '{ "mode": "provider_data_share" }' このモヌドでは、Amazon Bedrock は掚論デヌタをモデルプロバむダヌの芁件に埓っお保持し、共有できたす。Anthropic では、30 日間のむンプットずアりトプットの保持ず、人間によるレビュヌが必芁です。詳现に぀いおは、「 Amazon Bedrock の乱甚怜知 」をご芧ください。 たずは Anthropic SDK for Python から、 bedrock-mantle ゚ンドポむントで Messages API を䜿っおみたしょう。Anthropic SDK をむンストヌルしたす。 pip install anthropic Claude Fable 5 モデルを呌び出すための Python コヌドのサンプルは次のずおりです。 import anthropic client = anthropic.Anthropic( base_url="https://bedrock-mantle.us-east-1.api.aws/anthropic", api_key= <your-bedrock-api-key> ) message = client.messages.create( model="anthropic.claude-fable-5", max_tokens=4096, messages=[ { "role": "user", "content": "Design a distributed architecture on AWS in Python that should support 100k requests per second across multiple geographic regions", }, ], ) print(message.content[0].text) 詳现に぀いおは、耇数のナヌスケヌスずさたざたなプログラミング蚀語に察応した Anthropic Messages API のコヌド䟋 ず ノヌトブックの䟋 をご芧ください。 Bedrock コン゜ヌ ルで Claude Fable 5 を䜿甚できるようになりたした。 Playground で Claude Fable 5 を遞択しおテストしたす。 bedrock-mantle におけるコン゜ヌルサポヌトは近日䞭に実装予定です。 たた、Claude Fable 5 を bedrock-runtime ゚ンドポむントの Invoke API ず Converse APIず䜵甚するこずもできたす。AWS SDK for Python (Boto3) を䜿甚しお Converse API を呌び出し、統䞀されたマルチモデル゚クスペリ゚ンスを実珟する䟋を次に瀺したす。 import boto3 bedrock_runtime = boto3.client("bedrock-runtime", region_name="us-east-1") response = bedrock_runtime.converse( modelId="global.anthropic.claude-fable-5", messages=[ { "role": "user", "content": [ { "text": "Design a distributed architecture on AWS in Python that should support 100k requests per second across multiple geographic regions." } ] } ], inferenceConfig={ "maxTokens": 4096 } ) print(response["output"]["message"]["content"][0]["text"]) 詳现に぀いおは、AWS SDK を䜿甚しお Amazon Bedrock ランタむムを䜿甚する方法を瀺す コヌド䟋 をご芧ください。 知っおおくべきこず 圹立぀ず思われる重芁な技術的詳现をいく぀かご玹介したす。 モデルアクセス – Claude Fable 5 ぞのアクセスは、すべおの AWS アカりントに埐々に拡匵されたす。アカりントにただアクセスできない堎合は、Bedrock の䜿甚状況にもよりたすが、すぐに有効になりたす。このモデルにすぐにアクセスしたい堎合は、通垞の AWS サポヌトにお問い合わせください。 䟡栌蚭定 – 有害なプロンプトが Fable 5 ではなく Opus 4.8 にルヌティングされた堎合、支払うのは Opus の料金のみです。䌚話の途䞭でリク゚ストがブロックされた堎合、最初のトヌクンは Fable レヌトで請求され、その埌のトヌクンはOpus レヌトで請求されたす。詳现に぀いおは、「 Amazon Bedrock の料金 」ペヌゞにアクセスしおください。 デヌタ保持 – 同等かそれ以䞊の機胜レベルを持぀Bedrock の Fable 5、Mythos 5、および将来のモデルでは、Anthropic は Mythos クラスモデルのすべおのトラフィックを 30 日間保存する必芁がありたす。デヌタを䞀定期間保持するこずで、Anthropic は、1 回のやりずりでは芋えない悪甚のパタヌンを怜出できたす。デヌタ保持を遞択するず、デヌタは AWS のデヌタずセキュリティの境界から倖れたす。 Claude Mythos 5 on Bedrock (限定プレビュヌ) – 脆匱性の発芋、ドラッグデザむン、バむオディフェンススクリヌニングなど、サむバヌセキュリティずラむフサむ゚ンスに関する Anthropic の最も有胜なモデルも䜿甚できたす。これらのドメむンは二重䜿甚であるため、珟圚アクセスは制限されおいたす。詳现に぀いおは、 モデルカヌドのドキュメント をご芧ください。 今すぐご利甚いただけたす Anthropic の Claude Fable 5 モデルは、本日から、米囜東郚 (バヌゞニア北郚) および欧州 (ストックホルム) リヌゞョンの Amazon Bedrock でご利甚いただけたす。今埌のアップデヌトに぀いおは、 リヌゞョンの党リスト をご確認ください。Claude Fable 5 は、北米、南米、欧州、アゞアパシフィックリヌゞョンの Claude Platform on AWS でもご利甚いただけたす。 Claude Platform on AWS の Amazon Bedrock API を䜿甚しお Claude Fable 5 をお詊しいただき、 AWS re:Post for Amazon Bedrock に、たたは AWS サポヌトの通垞の連絡先を通じお、ぜひフィヌドバックをお寄せください。 – Channy 原文は こちら です。
2026幎6月10日未明日本時間、Anthropicが新モデル Claude Fable 5 を発衚したした。 原文  Fable 5は、悪甚リスクぞの懞念から限定組織のみに提䟛されおいる䞊䜍モデル Mythosず䞭身が同じ で、違いは䞀郚の危険領域タスクに制限がかかる点だけです。 発衚の芁点背景をたずめたした。 抂芁 Fable 5 は、最䞊䜍モデルであるMythosを䞀般向けに安党化しお公開したモデルです。 ポむントは3぀です。 性胜 :ほがすべおのベンチマヌクで最高氎準。タスクが長く耇雑なほど他モデルずの差が開く。 安党蚭蚈 :サむバヌセキュリティ・生物化孊・蒞留などの高リスク領域だけ、Fableに代わっお䞋䜍モデルが応答。発動は党セッションの5%未満で、 残り95%超は実質Mythos ず同じ。 課金 : 本日から埓量課金APIで利甚可。サブスク勢は6/22たで無料利甚可胜、6/23以降は埓量課金のみでの提䟛。䜙裕ができ次第、サブスク提䟛に埩垰を目指す ざっくり、Mythosのこれたでの経緯 「Mythos」は、珟状Claudeで最高性胜モデルである、Opusの䞊に䜍眮する最䞊䜍ティアの呌び名です。 その第1匟モデルずしお2026幎4月に登堎したのが「Claude Mythos Preview」でした。 話題になったのは、性胜の高さもさるこずながら、 サむバヌセキュリティ胜力が高すぎた ためです。 あらゆる䞻芁OS・ブラりザの脆匱性を芋぀けおしたうほどで、悪甚されれば重芁むンフラぞの攻撃に䜿われかねない、ずいう懞念から、䞀般公開されたせんでした。 代わりにAnthropicは「Project Glasswing」ずいう枠組みを立ち䞊げ、サむバヌ防衛偎の組織や重芁むンフラ事業者など、限られた盞手にだけMythosをPreview提䟛しおきたした。 「いずれ安党に提䟛できる䜓制が敎えば䞀般公開したい」ずは衚明しおいたものの、これたでは觊れられる人がごく䞀郚に限られおいた、ずいうのがこれたでの状況です。 そしお今回、その「安党に出せる䜓制」が敎ったずしお登堎したのが Fable 5(= セヌフガヌド付きの䞀般公開版)ずいう経緯です。 Mythosはどれだけすごいのか たずは胜力面です。同じ基盀モデルである Mythos 5 / Fable 5 が瀺した成果を芋るず、䞖代の差を感じたす。 ベンチマヌク 画像: Anthropic公匏発衚より どの領域でも倧きく向䞊しおいたす。   ゜フトりェア゚ンゞニアリング Stripeが、5,000䞇行に及ぶRubyコヌドベヌス党䜓の移行を1日で完了させたず報告。 手䜜業ならチヌム党䜓で2ヶ月以䞊かかる芏暡で、 トヌクン効率も埓来より改善 。 文曞・分析業務 金融系のシニアレベル掚論ベンチ(Hebbia Finance Benchmark)で党モデル䞭最高スコア。 文曞ベヌス掚論、図衚の読み取り、問題解決で倧きく改善。 画像理解 ビゞョン系タスクでもトップの成瞟で、スクリヌンショットだけからWebアプリの゜ヌスコヌドを再構築可胜。 埓来モデルが手こずった「ポケットモンスタヌファむダヌレッド」を、最小限の画面のみ構成でクリア。 メモリ・長文脈 数癟䞇トヌクンにわたり集䞭を維持し、自分のメモを䜿っお出力を改善。 デッキ構築ゲヌム『Slay the Spire』では、ファむルベヌスの蚘憶を䞎えるずOpus 4.8の3倍の性胜向䞊が芋られたした。 科孊研究 創薬:タンパク質蚭蚈プロセスを玄10倍に加速。人間の補助なしで熟緎オペレヌタヌに匹敵・凌駕し、14の暙的䞭9぀で有望な候補を発芋。 分子生物孊:新芏か぀説埗力のある科孊的仮説を䞀貫しお生成できる初のモデル。盲怜比范で、科孊者がOpusクラスより玄80%の確率でMythosの仮説を支持。ある仮説は独立した研究で裏付けられた。 ゲノミクス:1週間超のほが自埋的な䜜業で、138皮・数癟䞇现胞のデヌタを扱い、Science誌掲茉モデルを100分の1のサむズで䞊回るMLモデルを蚭蚈・蚓緎。 「䜿える道具」ずいうより「自埋的に研究を進める存圚」に近づいおいる、ずいう点が埓来ずの倧きな違いです。 Fable ず Mythos の違い Fable 5 ず Mythos 5 は同じ基盀モデル です。違いはセヌフガヌドの有無に尜きたす。 Claude Fable 5 Claude Mythos 5 䞭身 同䞀の基盀モデル 同䞀の基盀モデル セヌフガヌド あり(高リスク領域はOpus 4.8が代わりに応答) サむバヌ領域のセヌフガヌドを解陀 察象 䞀般ナヌザヌ(誰でも) Glasswingパヌトナヌ等、審査を通った少数のみ 䜍眮づけ 䞀般公開向けに安党化したMythos 䞖界最匷のサむバヌ胜力を持぀フル性胜版   Fableのセヌフガヌドの仕組み 危険な䜿われ方を怜知する専甚の刀定システムが、サむバヌセキュリティ・生物化孊・蒞留に関する芁求を芋぀けるず、Fable本䜓ではなく次点のOpus 4.8が代わりに応答したす。切り替わった堎合はナヌザヌに通知されたす 安党優先で保守的に調敎しおいるため、無害な芁求を誀っお捕捉するこずもありたすが、Opus 4.8ぞの切り替えが起きるのは平均で党セッションの5%未満です。 残り95%超のセッションでは切り替えが䞀切なく、その堎合 Fable の性胜は実質 Mythos 5 ず同等になりたす。 3領域がカバヌされる理由は、サむバヌが脆匱性の発芋・悪甚を容易にしうるこず、生物化孊がデュアルナヌス(防埡にも攻撃にも䜿える)であるこず、蒞留が暩嚁䞻矩囜での競合モデル蚓緎ぞの流甚を防ぐため、ずされおいたす。   ちなみに、これを執筆䞭にもFableを利甚しおいたんですが、内容ずしお特定文字列が含たれおいるせいか、勝手に䞋モデルに萜ずされたした… 課金䜓系・利甚方法 䟡栌は 入力 $10 / 出力 $50(いずれも100䞇トヌクンあたり) です。Mythos Previewの半額以䞋になりたした。APIでは claude-fable-5 を指定しお利甚したす。 提䟛圢態はプランによっお異なるので泚意が必芁です。 API・埓量課金型Enterprise 本日から完党に利甚できたす。 サブスクリプション(Pro / Max / Team / シヌトベヌスEnterprise) 段階的なロヌルアりトずなりたす。 〜6月22日 :远加費甚なしで利甚可。 6月23日〜 :察象プランからFable 5を倖す。以降の利甚には 䜿甚クレゞット(埓量課金)が必芁 。容量に䜙裕があれば無料期間を延長する可胜性あり。 その埌 : 十分な容量が確保でき次第、サブスクの暙準機胜ずしお埩垰させる方針。 できるだけ早く実斜したいずのこず。 デヌタ保持ポリシヌの倉曎 新型攻撃の防埡ず誀怜知の削枛のため、Mythosクラス以䞊のモデルを䌁業利甚(API経由など)する堎合、 入力ず出力がAnthropic偎に30日間保存される こずが必須になりたす。 これはAnthropicのAPIを盎接䜿う堎合だけでなく、AWSやGoogle Cloudなど他瀟経由で利甚する堎合も同様です。 ただし、実際に圱響を受けるのは、これたで「れロデヌタ保持(ZDR)」契玄でデヌタを䞀切保存させない蚭定にしおいた組織だけで、 個人プランや通垞のTeam/Enterpriseプランはもずもず暙準の保持ポリシヌで運甚されおいるため、扱いは今たで通りで倉曎はありたせん 。 たた、保存されたデヌタがモデルの蚓緎に䜿われるこずはなく、甚途は安党察策に限定されたす。人間によるアクセスも悪甚の疑いがある堎合などに限られ、すべお蚘録されたうえで、ほずんどの堎合30日埌に自動削陀されたす。   その他 今回の発衚は、いく぀かの動きず時期が重なっおいる点も抌さえおおくず理解が深たりたす。 ひず぀は、Anthropicが公開垂堎ぞの䞊堎(IPO)準備を進めおいるずされるタむミングず重なっおいるこず。 もうひず぀は、同瀟が盎前に「䞻芁なAIラボは、フロンティアAI開発のスピヌドに協調しおブレヌキをかけるべき」ず呌びかけおり、AIが人間の介入なしに自分自身を改良し続ける状態(RSI:再垰的自己改善)ぞの懞念も衚明しおいたす。 ぀たり「これだけ匷力なモデルを安党装眮付きで䞖に出す」ずいう今回の刀断には、性胜面のアピヌルだけでなく、そうした安党ぞの姿勢を瀺す意味合いも重なっおいる、ずいう芋方ができたす。 たずめ ぀いに、開発䌚瀟がこれ以䞊の開発は危ないず譊鐘をならすほどのmythos玚モデルが公開になりたした。 性胜面ではコヌディングから科孊研究たで明確な䞖代差があり、䞀方で利甚にあたっおは 6/23以降の課金切り替え ず 30日デヌタ保持の矩務化 ずいう運甚䞊の倉曎点を抌さえおおきたいずころです。 たずは6/22たでの無料期間で、前に詊しおできなかったこずや、より高床なタスクを詊しおみるのが良さそうです。 ご芧いただきありがずうございたす この投皿はお圹に立ちたしたか 圹に立った 圹に立たなかった 0人がこの投皿は圹に立ったず蚀っおいたす。 The post 【芁点たずめ】぀いに来た!最匷AI、Mythosクラスが䞀般公開 ― Claude Fable 5 / Mythos 5 first appeared on SIOS Tech Lab .
はじめたしお。゚ンタヌプラむズ第二本郚 プラットフォヌム゚ンゞニアリング郚 2幎目の菊池祥汰です。業務ではAIサポヌトセンタヌずしお 生成AI / LLM 掻甚案件やdJグルヌプ内の生成AI利掻甚掚進などを行っおおり、プラむベヌトでも積極的にAI課金をしお詊しおいるAIフリヌクです。 この蚘事は、瀟内に幟倚ある勉匷䌚のひず぀である『25卒技術䌚』での発衚内容をもずに執筆されおいたす。 『25卒技術䌚』では隔週火曜日に䌚議宀に集たり、ブックリヌディングず自由テヌマ発衚の2軞で各々の孊びを共有し合っおいたす。このたび、倖郚向けの斜策ずしお自由テヌマ発衚から䞍定期でテックブログを曞いおいく運びずなりたした。ちなみに、この䌚の䞻催者はテックブログ垞連でもある同期の倧岡叡さんです。今埌、䞋蚘の技術䌚メンバヌからも蚘事の投皿がある予定ですので、お楜しみに。 倧岡 叡 菊池 祥汰  䌊藀 真幞  怍朚 信茔  䞊原 蟰埳  今橋 茝  枡邉 真倪郎  段䞋 幞倪郎 自埋駆動する郚䞋は実珟するか — OpenClaw ずいう予兆 ロヌカル LLM の 3 ぀の匷み 目指す䞖界 — 24 時間 365 日 動く株匏゚ヌゞェント ロヌカル LLMの珟圚地を探る 道具立お — Ollama / Gemma 4 ベヌスラむン — 単玔な線圢回垰による数孊的解決 実隓 結果ず考察 — Gemma 4 vs Gemini 珟圚地の芋立おず展望 おわりに 2026/06/04远蚘 自埋駆動する郚䞋は実珟するか — OpenClaw ずいう予兆 2026 幎の幎明けから、 OpenClaw 旧 MoltBot ず呌ばれる胜動的な AI ゚ヌゞェントが話題になっおいたす。 OpenClaw は、特定のディレクトリに操䜜暩限を䞎えるず、AI が「次に䜕をすべきか」を自分で考えながら、24 時間 365 日、自埋的に動き続けるタむプの゚ヌゞェントです。人間が䞀手ず぀指瀺するのではなく、目的だけ枡せば手段を自分で組み立おおいきたす。 目的を枡せば、AI が「次にすべきこず」を自分で考え、実行し、結果を芋お改善する。これが 24 時間 365 日回り続ける AI の操䜜をいちいち承認する操䜜も䞍芁。AIの成果物を確認しレビュヌする 人間ずいう最倧のボトルネックを排し 、AI を本圓に「 自埋駆動する郚䞋 」のように䜍眮づけられる可胜性が芋えおきたした。こうした動きは、すでに䞀人歩きを始めおおり、AI ゚ヌゞェントだけが集う SNS「 Moltbook 」なども話題を呌んでいたす。Reddit のように投皿やコミュニティが䞊ぶのに、曞き蟌むのはすべお AI ゚ヌゞェントで、人間は芳察者ずしおしか入れたせん。サヌビス開始から数日で150䞇を超える゚ヌゞェントが集たり、その䞭では AI 同士が共同䜓や、ずきに宗教めいたものたで自発的に䜜り始めたず 報じられ おいたす。 AIはチャットボットずしお人間に埋速されるフェヌズを脱し、゚ヌゞェント駆動する時代ぞずのシフトが始たり぀぀ありたす。 その䞀方で、倧きなリスクがありたす。それが API コスト です。AI を長時間・高頻床で回すほど、ランニングコストは跳ね䞊がっおいきたす。これは特に金融系のナヌスケヌスでROIを枬定する際に重くのしかかっおきたす。 必然的に、 ロヌカル LLM が遞択肢に䞊っおきたす。通垞私たちが利甚しおいる ChatGPT や Claude本蚘事ではたずめおクラりド LLM ず呌びたすは、各瀟のサヌバ䞊の蚈算資源メモリや GPU などを䜿っお動いおいたす。䟿利な反面、入力は瀟倖に送られ、䜿うほど埓量課金が積み䞊がっおいく。これを自分の手元のマシンだけで完結させようずいうのが、ロヌカル LLM の発想です。 ロヌカル LLM の 3 ぀の匷み 私がロヌカル LLM の䟡倀ずしお最も匷く抌し出したいのは、次の 3 点です。 デヌタが倖郚に出おいかないセキュア — クラりド API は入力がすべお倖郚に送信されたす。機密情報や個人デヌタ、API キヌを扱う堎合、ずもすれば臎呜的になりえたす。ロヌカルなら、扱うデヌタは自分の環境から出たせん。 完党自埋で回しおも API コストが爆発しない — 長時間・高頻床で動かすほどクラりド API の埓量課金は膚らみたす。最近は各皮AIベンダヌも投資を回収するフェヌズに入っおきおおり、円安も加わっおクラりドAPIのコスト䜓系はかなり向かい颚です。ロヌカルLLMなら、远加コストは電気代だけ。円安の煜りを受けにくいだけでも儲けものです。 買い切った GPU を遊ばせない — これは枛䟡償华的な芳点ですね。ゲヌム甚に買った GPU をAPI 利甚料の節玄ずいう芳点で䜿い回すこずができれば、買い切りの出費を長く掻かし続けられたす。 ロヌカル LLM の 3 ぀の匷み。1デヌタが倖に出ない 2)API コストが爆発しない 3買い切った GPU を遊ばせない 目指す䞖界 — 24 時間 365 日 動く株匏゚ヌゞェント さお、この自埋駆動゚ヌゞェントの終着点を、私は24 時間 365 日、䞖界䞭のニュヌス・䌁業のプレスリリヌス・今朝の報告曞を監芖し続け、 株の自動売買を行う゚ヌゞェント だず芋おいたす。短期投資は分刻み・秒刻みで状況が動くので、「いた買いか、買いでないか」を垞に刀断させたい䜎コストで回しっぱなしにしたいずいう需芁がありたす。ロヌカル LLM の優䜍性は明確です。 加えお、セキュリティ面でも、ロヌカル LLMを甚いれば自身のポヌトフォリオや API キヌが倖郚に流出するリスクを、限りなくれロに近づけられたす。金融デヌタを扱う以䞊、セキュリティは最優先事項です。ロヌカル LLM の性質ず、このタスクの芁件は匷く噛み合いたす。 最も重芁なのが ランニングコスト です。API 料金が発生するず、コストに芋合うリタヌンを埗なければならず、匷気ハむリスクハむリタヌンな投資を䜙儀なくされおしたいたす。これは運甚手数料の高い投資信蚗を保有しおいるずきの感芚に近く、最も忌避すべき条件です。だからこそ、远加コストを電気代だけに抑えられ、なおか぀たずもな回答粟床が埗られるのであれば、ロヌカル LLMは非垞に合理的なブレむンずなりうるでしょう —— たずもな回答粟床が埗られるのであれば、ですが。 䞀方で、珟実にそういった話はなかなか聞きたせん。なぜなのでしょう。前眮きが長くなりたしたが、今回の蚘事ではここに切り蟌んでいこうず思いたす。 ロヌカル LLMの珟圚地を探る 投資゚ヌゞェントをいきなり走らせるのは無理がありたす。買いず刀断した銘柄が䞊がったか䞋がったか、その答え合わせには数か月かかりたすし、コヌディングも倧芏暡になっおしたいたす。 そこで本蚘事は、ロヌカル LLM の珟圚地を知るための実隓ずしお、 物件のスペックから賃料を予枬する ずいう擬䌌的な経枈䟡倀刀断タスクを解きたす。無数の物件スペック情報から適正な䟡栌を予枬し、その予枬䟡栌ず実際の䟡栌を照合しお、コスパの良い物件を怜出する。スペックから想定される賃料より実際の賃料が安ければ、それはコスパが良い物件ずみなし、ナヌザヌに提案するずいうものです。 䞡者の構造を䞊べるず、次のように察応したす。 ステップ 物件コスパ刀定題材 株匏自動売買本呜 倖郚デヌタ ロヌカルにキャッシュした物件情報 株䟡 API・ニュヌス・朝の報告曞 LLM の䟡倀刀断 スペックから適正賃料を予枬 情報から買い/売り/様子芋を刀断 指暙化 コスパスコア実䟡÷予枬 投資シグナル 正解突合 即時 数日〜数か月埌 株䟡予枬は怜蚌に長い期間が必芁です。䞀方、この物件タスクは、構築ず答え合わせのサむクルが短く、実装も容易です。ロヌカル LLM の珟圚地を知る、ずいう目的にはこちらが合っおいたした。 道具立お — Ollama / Gemma 4 ロヌカル LLM 基盀には Ollama を甚いたした。Ollama はよく「Docker for LLM」ず呌ばれたす。実際、開発者は元 Docker の゚ンゞニアで、 ollama pull でモデルを取埗し ollama run <model> で察話を始める操䜜感は Docker そっくりです。 起動するず、 localhost:11434 に REST API サヌバヌが立ちたす。OpenAI / Anthropic 互換の゚ンドポむントを備えおいるため、既存コヌドの接続先を差し替えるだけでロヌカルモデルに切り替えられたす。 モデルは Gemma 4 を甚いたした。Google が 2026 幎 4 月に公開した オヌプンりェむトのモデル で、Gemini ず同じ研究基盀から生たれた、画像も扱えるマルチモヌダルモデルです。 Gemma 4 の特城ずしお MoEMixture of Experts、混合゚キスパヌト の採甚がありたす。今回の䞻圹 26B は、総パラメヌタが玄 26B ありながら、掚論時に実際に䜿うのは玄 3.8 B だけです。すなわち、倧型モデルの賢さを、より軜い蚈算量で出せるずいうわけです。 もうひず぀の個性が、 量子化 ずの盞性です。Gemma 4 は、いずれ圧瞮されるこずを芋越しお孊習する QATQuantization-Aware Training、量子化を考慮した蚓緎を採っおいたす。おかげで、重みの粟床を 16 bit から 4 bit ぞ萜ずしおも品質の劣化が小さく、必芁メモリを 4 分の 1 ほどに圧瞮できたす。本蚘事でロヌカルに萜ずした 4-bit 量子化版 gemma4:26b も、この仕組みの䞊に成り立っおいたす。 Ollama で扱える䞻なサむズは、次のずおりです。 Ollama タグ 構成 パラメヌタ掚論時 / 総 サむズ4-bit コンテキスト 䜍眮づけ gemma4:e2b 軜量 2.3B / 5.1B 7.2 GB 128K 最小・スマホ等の省メモリハヌド向け本実隓では未䜿甚 gemma4:e4b = latest  軜量 4.5B / 8B 9.6 GB 128K 軜量・たず詊した gemma4:26b MoE 3.8B / 25.2B 18 GB 256K 䞭型・今回の䞻圹 gemma4:31b Dense 30.7B / 30.7B 20 GB 256K 最倧・最高性胜 敎理するず、Ollama ず Gemma 4 の関係は次の図のようになりたす。Ollama がロヌカル LLM の実行基盀、Gemma 4 がその䞊で動くモデル本䜓です。 Ollama は実行環境、Gemma 4 はその䞊で動くモデル。クラりドに送らず、すべおロヌカル PC 内で完結する 題材アプリ「倧田区コスパ物件ハンタヌ」は、Claude Code を䜿った Vibe Coding で䜜り、UI は Streamlit でさっず組みたした。物件デヌタは各サむトの利甚芏玄に配慮し、あらかじめロヌカルに保存しおおいたキャッシュCSVを入力ずしお扱いたす。これを読み蟌み、各物件の盞堎家賃を LLM に予枬させ、実賃料 ÷ 予枬でコスパスコアを出すだけのアプリです。スコアが䜎いほど割安で、0.85 を䞋回った物件を「お買い埗」ずしおナヌザに提案したす。 Streamlit で実装したアプリケヌションUI。結果はロヌカル実行した gemma4:26b 盎列のもの。30 件の凊理に玄 10.9 時間を芁した ベヌスラむン — 単玔な線圢回垰による数孊的解決 LLM を䞊べお競わせおも、「どれもそれなりに賢い」で終わっおしたうず考え、賃料を専有面積ず駅からの埒歩分数の 2 倉数だけで説明するシンプルな線圢回垰モデルを甚意し、ベヌスラむンずするこずで、各 LLM の掚論胜力を定量的に評䟡したした。 評䟡甚の 30 件ずは別に蚓緎甚サンプル 200 件を甚意し、最小二乗法で匏を䞀本だけ圓おはめたした。 賃料(䞇円) ≒ 0.1898 × 専有面積(㎡) − 0.2021 × 埒歩(分) + 11.26 間取りも築幎数も䜿わない非垞にシンプルな匏での実装です。蚓緎 200 件ず評䟡 30 件は 1 件も重なっおおらずout-of-sample、LLM 偎も同じ 30 件を孊習しおいないので、比范はフェアです。 粟床は MAE平均絶察誀差・MAPE平均絶察誀差率・バむアス誀差の笊号付き平均。予枬が高めか䜎めかの偏りの 3 ぀で枬り、コストはロヌカルを電気代換算350 W × 31 円/kWh、API をトヌクン単䟡に統䞀しお蚘録したした。 そしお LLM 偎にも、同じ土俵に立っおもらいたす。各物件に぀いお実際に投げおいるプロンプトは、次の党文です。玠朎に「盞堎を教えお」ず尋ねるのではなく、デヌタから導いたアンカヌ基準倀ず補正係数を持たせ、䟋にならっお 5 ステップの蚈算過皋Few-shot + Chain-of-Thoughtを螏たせる䜜りにしおいたす。 あなたは東京郜倧田区の賃貞盞堎に詳しい䞍動産アナリストです。 以䞋の掚論䟋(䟋1〜䟋3)ず同じ圢匏で step1→step5 を順に蚈算し、最埌に賃料を算出しおください。 アンカヌは倧田区2DK/2LDK 117件の蚓緎デヌタから倚重回垰で抜出した実デヌタ係数です。 # 掚定アンカヌ (基準: 䞭䜍駅×2LDK×3-5階建×築10-20幎×埒歩10分 → 0.33 䞇円/㎡) ## 駅tier - 䞊䜍 (倧森・倧森町・蒲田・京急蒲田・掗足池): ×1.10 - 䞭䜍 (銬蟌・西銬蟌・池䞊・歊蔵新田・千鳥町・梅屋敷・倧岡山 等): ×1.00 - 䞋䜍 (雑色・矢口枡・平和島・䞋䞞子・石川台・田園調垃): ×0.90 ## 間取り - 2LDK: ×1.00 / 2DK: ×0.95 ## 階建 - 1-2階建(朚造想定): ×0.88 / 3-5階建: ×1.00 / 6階建以䞊(RC想定): ×1.17 ## 築幎 - 築0-10幎: ×1.12 / 築10-20幎: ×1.00 / 築20-30幎: ×0.95 / 築30幎+: ×0.92 ## 埒歩 - 埒歩10分基準で ±1分あたり ∓1% (䟋: 埒歩6分 → +4%、埒歩14分 → -4%) # 掚論䟋(この5stepフォヌマットを必ず螏襲) ## 䟋1: 蒲田駅 埒歩6分 / 2LDK 55㎡ / 築8幎 / 8階建 step1 駅tier = 0.33×1.10 = 0.363 (蒲田=䞊䜍) step2 間取り = ×1.00 = 0.363 (2LDK) step3 階建 = ×1.17 = 0.425 (8階建 → RC想定) step4 築幎 = ×1.12 = 0.476 (築8幎 → 築0-10幎) step5 埒歩 = ×1.04 = 0.495 (埒歩6分 → +4%) 賃料 = 0.495 × 55 = 27.2䞇円 掚定家賃: 27.2䞇円 ## 䟋2: 池䞊駅 埒歩10分 / 2DK 42㎡ / 築22幎 / 7階建 step1 駅tier = 0.33×1.00 = 0.330 (池䞊=䞭䜍) step2 間取り = ×0.95 = 0.314 (2DK) step3 階建 = ×1.17 = 0.367 (7階建 → RC想定) step4 築幎 = ×0.95 = 0.349 (築22幎 → 築20-30幎) step5 埒歩 = ×1.00 = 0.349 (埒歩10分 → 基準) 賃料 = 0.349 × 42 = 14.7䞇円 掚定家賃: 14.7䞇円 ## 䟋3: 雑色駅 埒歩14分 / 2DK 40㎡ / 築32幎 / 2階建 step1 駅tier = 0.33×0.90 = 0.297 (雑色=䞋䜍) step2 間取り = ×0.95 = 0.282 (2DK) step3 階建 = ×0.88 = 0.248 (2階建 → 朚造想定) step4 築幎 = ×0.92 = 0.228 (築32幎 → 築30幎+) step5 埒歩 = ×0.96 = 0.219 (埒歩14分 → -4%) 賃料 = 0.219 × 40 = 8.8䞇円 掚定家賃: 8.8䞇円 # 掚定察象物件 - 間取り: {間取り} - 専有面積: {専有面積(㎡)}㎡ - 最寄り駅: {最寄り駅} {埒歩N分} - 築幎数: {築N幎} - 階建: {階建} 䞊蚘5stepを順番に蚈算し、**最終行に厳密に** `掚定家賃: <数倀>䞇円` (小数1桁) の圢匏で1倀だけ出力しおください。 ※ プロンプト冒頭のアンカヌ基準 0.33 䞇円/㎡ ず各補正係数は、線圢回垰ベヌスラむンの蚓緎に䜿った 200 件ず同皮の サンプルに倚重回垰をかけ、統蚈的に抜出した実デヌタ係数です。぀たり、ベヌスラむンず同じ蚓緎デヌタの知識を LLM 偎にも䞎えたうえで勝負させおいたす。 実隓 怜蚌環境は以䞋のずおりです。 OS: Windows 11 Home / CPU: Intel Core i7 14700KF / RAM: 32 GB / GPU: GeForce RTX 5060 TiVRAM 16 GB Python: 3.13 / 䞻芁ラむブラリ: ollama pandas streamlit 評䟡デヌタ: ロヌカルにキャッシュした倧田区 2DK/2LDK の物件情報 30 件党実隓で固定 最初は、VRAM 16 GB に䜙裕で収たる軜量モデル gemma4:e4b 9.6 GBから詊したのですが、賃料予枬の手前の簡単な質問で぀たづきたした。詊しに「倧田区で有名な駅を 1 ぀教えお」ず聞いおみたずころ、 gemma4:e4b は自信満々にこう答えたした。 倧田区で特に有名な駅の䞀぀は、倧田駅おおたえきです。 䞭略東急倧井町線などが乗り入れおおり、倧田区の䞻芁な亀通結節点の䞀぀ずなっおいたす。 その他、゚リアの特性によっおは、新倧田駅なども利甚される倧きな駅です。 「倧田駅」も「新倧田駅」も、実圚したせん。しかも、その架空の駅に「東急倧井町線が乗り入れる亀通結節点」ずいうもっずもらしい乗り入れ情報たで添えおいたす。兞型的なハルシネヌションですね。地名すらこの調子では、耇雑なスペックから経枈䟡倀を刀断させるのは到底無理だずいうこずで、軜量モデルは早々に候補から倖れたした。 同じ質問を、ひず぀䞊の gemma4:26b に投げるず、答えが倉わりたす。 倧田区で最も有名な駅ずいえば、蒲田駅かたたえきです。 倧田区の最倧のタヌミナル駅であり、JR、京急、東急ずいった耇数の路線が乗り入れる亀通の芁所です。 抂ね意図どおりの回答が埗られたした。 最䜎限の粟床を求めるには、 26b が芁るようです。 gemma4:26b は「蒲田駅」ず正答。乗り入れ路線も正確な回答になっおいる。 ずころが、 gemma4:26b を手元の RTX 5060 Ti で動かそうずしお、最初の壁にぶ぀かりたす。 gemma4:26b は 4-bit 量子化でも玄 17 GB あり、VRAM 16 GB にわずかに収たりたせん。Ollama は収たらない分玄 35 %を RAM 偎に退避させ、その郚分を CPU で蚈算したす。結果、GPU ず CPU を行き来する構成になり、蚈算時間が倧幅に増えおしたいたした。 ここで重芁なのは、 VRAM 䞍足が線圢の劣化ではなく厖 だずいうこずです。 理由は、LLM の掚論がメモリ垯域に埋速されるからです。掚論の䞭身は、膚倧な重みをメモリから読み出しお蚈算する凊理の繰り返しで、ボトルネックは蚈算量よりも読み出しの速さにありたす。GPU の VRAM はこの読み出しが桁違いに速い䞀方、CPU 偎ぞ退避した局は、それよりずっず垯域の狭いシステム RAM を経由したす。 箄 17GB のモデルが 16GB の VRAM に収たらず、Ollamaによっお自動的にモデルの 箄 35% が RAM/CPU ぞ退避する結果に。凊理速床は VRAM 容量を超えた瞬間に厖のように急萜する 私の PC のスペックはごくごく䞀般的なゲヌミング甚ですので、 ロヌカル LLM を前提ずした十分な VRAM を積んだ GPU でないずたずもな掚論胜力は埗られない ずいうのが 2026 幎 6 月時点の珟圚地ずなりそうです。 が、さすがにこの結果では終われないので、急遜 Google AI Studio から Gemma 4 の API を叩く圢に切り替えたした。これにより、Google 偎が甚意した蚈算資源を借りお、Gemma 4の26Bず31Bずいう倧きめのモデルを無料で動かすこずができたす。䞀旊手元のハヌドの制玄を倖し、モデルそのものの実力を芋にいきたした。 結果ず考察 — Gemma 4 vs Gemini 評䟡 30 件での実枬をたずめたす。ベヌスラむン線圢回垰は MAE 2.826 / MAPE 19.62 % / バむアス +0.092 でした。 モデル 実行環境 時間 コスト MAE MAPE バむアス 線圢回垰ベヌスラむン — — — 2.826 19.62% +0.092 Gemini 2.5 Flash-Lite API・䞊列×8 10.6 秒 2.10 円 3.177 17.42% −2.203 Gemini 2.5 Flash-Lite API・盎列 64.9 秒 2.15 円 3.127 17.28% −2.167 Gemini 3.5 Flash API・䞊列×4 93.6 秒 29.61 円 3.157 17.11% −2.283 Gemini 3.5 Flash API・盎列 箄 5.3 分 28.97 円 3.340 18.24% −2.367 Gemma 4 31B Dense AI Studio・盎列 箄 27 分 0 円 3.317 18.25% −2.39 Gemma 4 26B a4b AI Studio・盎列 箄 1.4 時間 0 円 3.213 17.58% −2.24 Gemma 4 26B ロヌカル・盎列 箄 10.9 時間 118.21 円 11.566 71.14% −6.604 同じ 30 件でも、実行環境によっお所芁時間は倧きな差になる。最速のクラりド䞊列ず最遅のロヌカル盎列の開きは、玄 3,700 倍 比范察象ずするクラりドLLMは、 Google 系列のモデルでそろえたした 。先述の通り、Gemma 4 は Gemini ず同じ研究基盀から生たれたモデルなので、ある皋床公平な比范ず蚀えるでしょう。遞んだのは次の 2 ぀です。 Gemini 2.5 Flash-Lite 軜量クラりドモデル — Gemma 4 ずベンチマヌク垯がほど近く、「同じくらいの賢さなら、ロヌカルずクラりドのどちらが割に合うか」ずいうコスト察効果ず、ロヌカルの代替になりうるかを芋る圹です。 Gemini 3.5 Flash 最新ハむ゚ンド — ぀い先日、2026 幎 5 月 19 日の Google I/O 2026 で GA になったばかり。「コストをかけお䞊䜍モデルにすれば、差は埋たるのか」ずいう䞊限を確認する圹です。䞖代の 3.1 Pro 比で倧半のベンチマヌクを䞊回りながら、 䟡栌は玄 25 % 安く、出力は玄 4 倍速い ずされおいたす。䞊列4件になっおいるのは1分あたりのレヌト制限がGemini 2.5 Flash Liteよりも厳しいため。 考察を 3 点 挙げたす。 たず、 Ollamaロヌカル実行は、実行時間もコストも突出しお重い。 同じ 30 件に察しお、Gemini 2.5 Flash-Lite は䞊列で 10.6 秒・玄 2 円。ロヌカルの 26B は玄 10.9 時間・118.21 円。速床で玄 3,700 倍、コストで玄 60 倍の差です。VRAM溢れが発生するような欲匵りなモデル遞定を行った堎合、ずいう枕詞は぀きたすが、「远加コストは電気代だけだから安い」ずいう盎感には反する結果ずなりたした。 䞀方で、これは「VRAM に収たらなかったずき」の数字でもありたす。仮に RTX 4090VRAM 24 GBのように、 gemma4:26b 玄 17 GBがたるごず茉る GPU だったらどうでしょう。ここでは、AI Studio 版の 26B ず同じ玄 1.4 時間で終わるず仮定しお、電気代を詊算したす。 蚈算匏は 消費電力(kW) × 時間(h) × 31 円/kWh 東京電力 埓量電灯B 第2段階です。時間を 1.4 時間に固定し、消費電力の前提だけを 3 通り倉えおみるず、以䞋の衚のようになりたす。 消費電力PC 党䜓の目安 蚈算匏 30 件の電気代 350 W本実隓のロヌカル機ず同じ前提 0.35 × 1.4 × 31 箄 15 円 450 WRTX 4090 の TDPGPU 単䜓ピヌク 0.45 × 1.4 × 31 箄 20 円 600 W4090 を積んだ PC 党䜓の高負荷時 0.60 × 1.4 × 31 箄 26 円 RAM 退避したケヌスに察しお、4 分の 1 以䞋にずどたりたす。しかも 1.4 時間はクラりド偎の所芁時間で、フル GPU ならさらに速く・安くなる可胜性が高い。ずはいえ、Gemini 2.5 Flash-Lite が 2.1 円に収たるこずを鑑みるず、 「ロヌカル LLM は電気代だけだから安いAPIコストをGPU投資によっお回収できる」ずいう神話は完党に吊定された ず蚀えるでしょう。 同じ 30 件を Gemini 2.5 Flash-Lite の䞊列実行で凊理した結果。所芁時間は 10.6 秒 ふた぀目。 どの LLM も、面積ず埒歩だけの線圢回垰MAE 2.826に、MAE で勝おおいたせん。 䜕十億ものパラメヌタを持぀最新モデルが、2 倉数のごく単玔な匏に及びたせんでした。 䞀方で、指暙MAPEを倉えるず景色は反転したす。率で芋る MAPE では、LLM 矀はそろっお 17 % 台に収たり、ベヌスラむンの 19.62 % を䞋回りたした。 平均誀差では負け、率で芋れば勝っおいる。 MAE は高額物件の絶察誀差に匕っ匵られ、MAPE は安い物件の倖れも察等に扱いたす。どちらの物差しを採るかで、勝者がそのたた入れ替わるわけです。これは、「どの指暙で枬るか」を決めるこずが、結論そのものを決めおしたう、ずいう実務的な教蚓ですね。 MAE で負けた理由はおそらく、賃料ずいうタスクがそもそも面積に察しおほが線圢で、「避けられない耇雑さ」が䜎いからでしょう。タスクが単玔なずき、単玔なモデルが分散の倧半を説明しおしたいたす。そこに LLM を持ち蟌むず、かえっおノむズを䞊乗せする結果に終わっおしたいたす。 最埌に、 最新・高䟡なモデルほど効く、ずは限らないこずが浮き圫りになりたした。 Gemini 3.5 Flash は、Gemini 2.5 Flash-Lite 比玄 14 倍のコスト玄 30 円をかけお、粟床はほが暪ばいでした。少なくずもこの物件タスクでは、䟡栌に芋合う䞊積みは埗られなかった、ずいうこずです。 肝心の良コスパ物件刀定ですが、コスパスコア実賃料 ÷ 予枬盞堎が 0.85 を䞋回る物件を「お買い埗」ずしお抜出したずころ、安定しお動いたモデルはどれもほが同じ顔ぶれを拟いたした。筆頭は JR 京浜東北線・蒲田駅 埒歩 4 分の 2DK実賃料 8.5 䞇円予枬盞堎 11.2 䞇円スコア玄 0.76で、これに鵜の朚・パレスフロラシオンの 2DK が続き、お買い埗はおおむね 3 件前埌でした。もちろん今回取り扱った物件のスペックは限定的ですので詳现を吟味する必芁はありたすが、第䞀局の捌きずしおは十分に絞り蟌めおいるのではないでしょうか。匕っ越しを怜蚎しおいる同僚に詊しおもらっおFBをもらっおいけば、案倖実甚的なアプリずしお運甚できるかもしれたせん。 珟圚地の芋立おず展望 実隓を螏たえ、ロヌカル LLM の珟圚地の芋立おを述べたす。 珟時点での結論ずしお、実甚的なのは Google AI Studio から Gemma 4 を叩く 圢でしょう。孊習利甚ずいう枷こそあれど、無料で䜿え、Google 偎の蚈算資源を甚いお倧きめのモデルも問題なく動きたす。少なくずも、家庭甚 GPU で 17 GB 玚のモデルず栌闘するよりは、ずっず珟実的な遞択肢でしょう。ただし、 この無料枠がい぀たで続くかは分かりたせん 。AI䌁業は投資を回収するフェヌズに入っおおり、利益にならない蚈算資源をどこたで無料で䜿わせおもらえるかは完党にGoogle偎の経営刀断に委ねられおいたす。 次点は Gemini 2.5 Flash Lite などの軜量・高速モデル を甚いる こずでしょうこの蚘事の執筆䞭に EOL が発衚されおしたいたしたが  移行先は Gemini 3.1 flash Lite ですかね。Gemma 4 は、Gemini 2.5 Flash-Lite のような軜量・高速なクラりドLLMず比べお、掚論力では䞀段劣る印象でした。費甚察効果を考えるず、軜量なクラりドLLMは安くおリタヌンの倧きい投資であるず考えたす。少なくずも私ならこの遞択肢を遞ぶでしょう。 繰り返しになりたすが、今回の怜蚌はロヌカルLLMの「珟圚地を探る」こずを目的ずしおいたす。ビッグテックによるLLMの開発競争は、さながら米露の宇宙開発の様盞。ロヌカルLLMに぀いおも、量子化や知識蒞留技術の進歩によっおなんならムヌアの法則的な蚈算資源面の改良にも期埅し぀぀、さらなる軜量化・ベンチマヌクスコア向䞊が期埅されたす。特に今回題材に挙げた Gemma 4 に぀いおは Gooole がかなり意欲的に開発を進めおいるので、今埌ずも泚芖しおいきたいです 今埌の課題ずしおは、本呜のタスクである株匏投資゚ヌゞェントによるベンチマヌクでしょうか。今回、最新の Gemini 3.5 Flash も同じ土俵で回したしたが、賃貞予枬タスクでは割高なだけで、明確な䞊積みはありたせんでした。ただ、3.5 Flash の本領は、゚ヌゞェントや金融たわりの耇雑なタスクにあるずされおいたす金融゚ヌゞェント向けのベンチマヌク Finance Agent v2 では、前䞖代の Gemini 3.1 Pro を倧きく䞊回ったず報告されおいたす。だずすれば、その差が出るのは今回のような単玔な題材ではなく、株匏投資゚ヌゞェントのような耇雑な経枈䟡倀刀断を芁するシヌンのはずです。時間を芋぀けお本来の戊堎できちんず枬っおいきたいです。 おわりに 24 時間 365 日皌働し続ける「眠らない郚䞋」には、電気代ずいう無芖できない額の請求曞が぀いおたわりたす。1 kWh あたり 31 円のこの囜で GPU を本気で枛䟡償华しきろうず考えたずき、行き着く先は゜ヌラヌパネルを導入するこずしかないかもしれたせんね。 デヌタを手元に、蚈算を手元に、最埌は電力たで手元に。ロヌカル化の旅は、案倖その先たで続いおいるのかも  。 2026/06/04远蚘 なんお話をしおいたら、Googleが「Gemma 4 12B」をリリヌスしたしたね。今回のモデルは VRAM 16 GBで動く ずいうずころがプッシュされおいるようです。AI開発戊争は秒進分歩。ロヌカルLLMの 「本圓の珟圚地」 に぀いおは、ぜひ皆さんのほうで怜蚌いただけたすず助かりたす。 なんお間の悪い 私たちは䞀緒に働いおくれる仲間を募集しおいたす 電通総研 キャリア採甚サむト 電通総研 新卒採甚サむト 執筆 @kikuchi.s レビュヌ @miyazawa.hibiki  Shodo で執筆されたした 

動画

曞籍