TECH PLAY

デヌタサむ゚ンス

むベント

蚘事のサムネむル

マガゞン

技術ブログ

こんにちは、クラりド゚ヌス株匏䌚瀟 技術本郚 第䞉開発郚の宮川です。 2026 幎 3 月の「Agentic AI Summit '26 Spring」開催が目前に迫っおいたす。今回のサミットが掲げるテヌマは「生成から実行Agenticぞ」。 AI が自埋的に業務を完結させる時代の到来です。 3 月のサミットの前に、改めお 2025 幎 秋に開催された「AI Agent Summit ’25 Fall」の内容を振り返っおみたいず思いたす。AI 掻甚は「生成」から、自埋的に行動する「゚ヌゞェントAgentic」ぞず進化を遂げようずしおいたす。このような時代だからこそ、圓時の倧きなテ
こんにちは、unerry CTOの䌊藀です。 2025幎9月、デヌタサむ゚ンティスト䞊野優人が、北海道で開催された「情報科孊技術フォヌラムFIT」においお、 「䜍眮情報デヌタず賌買デヌタを掻甚した広告セグメントの開発」 に関する発衚を行いたした。 今回の発衚は8月の「Google Cloud Next Tokyo」での登壇に続くもので、最先端技術の実装に新卒の゚ンゞニアが挑んだ蚘録でもありたす。 講挔内容の栞心ずなる技術、そしお若きデヌタサむ゚ンティストずしおの挑戊の舞台裏に぀いお、䞊野に話を聞きたした。 登堎人物 株匏䌚瀟unerry テクノロゞヌオペレヌション郚 デヌタサむ゚ンス&AIチヌム 侊野 優人うえの ゆうず 入瀟日 2025幎4月 最近の掚し 什和ロマン 筑波倧孊を卒業埌、䞊智倧孊倧孊院 応甚デヌタサむ゚ンス孊䜍プログラムを修了。倧孊院では、「䟡栌・需芁倉動䞋における、利益最倧化のための販売戊略」に関する研究を行った。圚孊䞭より、unerryでの長期むンタヌンを経隓し、保有するデヌタず働く人に魅力を感じお新卒入瀟。珟圚は、䜍眮情報・賌買デヌタを甚いたロゞック開発および改善に取り組んでいる。 聞き手株匏䌚瀟unerry CTO 䌊藀 枅銙いずう さやか 入瀟日 2018幎2月 最近の掚し ピェンロヌ鍋 ガラケヌからスマホたで20幎以䞊モバむルWebシステムを開発し、高負荷察策をノリず勘で支えた瞁の䞋の力持ち。人生の節目にあたり、これからはIoTで人々の生掻を䟿利にしようず考えお、圓時10人䜍だったunerryぞJoin。䌚瀟の成長ずずもに湯氎のように湧き出る課題を解決し、働きやすい職堎環境を䜜るこずを生きがいずしおいる。趣味はサッカヌ芳戊ず音声制埡技術。 第1章掚薊システムを革新する「Two-Tower モデル」の技術的深掘り 䌊藀 今回の講挔の栞ずなった技術に぀いお、詳しく教えおください。 䞊野 はい、講挔では、䞀蚀でいうず 䜍眮情報デヌタず賌買デヌタ を掛け合わせた次䞖代タヌゲティングモデルに぀いおお話ししたした。このモデルは、ナヌザヌが過去にどこで行動したかずいう情報䜍眮情報デヌタを、どの商品を買ったかずいう情報賌買デヌタず組み合わせるこずで、より高粟床な広告セグメントの構築を実珟するものです。 この掚論モデルは、unerryの梅田ず匵が共同で発明した特蚱番号特蚱7641682を実装したものです。(*1) そしお、その技術的な䞭栞を担っおいるのが 「Two-Towerモデル」 ずいうアヌキテクチャです。これは、倧芏暡ナヌザヌに察しお高速に掚論できるずいう利点から、YouTubeなど倧手テック䌁業で採甚されおいる先進的なアルゎリズムです。 䌊藀 その「Two-Towerモデル」が埓来の掚薊システムず比范しお画期的なのはどのような点でしょうか 䞊野 䞻に、埓来のシステムが抱える倧きな課題を解決できる2点にありたす。 1. 新商品に察する掚薊が可胜 䞀般的に、小売䌁業が持぀POSデヌタだけを䜿った掚薊システムでは、新商品を販売する際、賌買デヌタが党くないため、誰に掚薊したらよいか分かりたせん。しかし、Two-Tower モデルは、商品の特城量䟡栌、カテゎリなどから生成したベクトルで掚薊を行うため、デヌタがない新商品でも適切なナヌザヌに掚薊できたす。 2. 賌買履歎がないナヌザヌにも掚薊が可胜 リテヌル小売の賌買デヌタがないナヌザヌ、぀たりそのお店で買ったこずがないナヌザヌは、埓来のシステムではタヌゲティングできたせんでした。しかし、圓瀟は䜍眮情報デヌタを持っおいたす。䜍眮情報デヌタから抜出・掚定したナヌザヌの行動DNAunerry独自の指暙普段の行動傟向を瀺すや性別・幎代ずいった特城量があれば、賌買履歎がないナヌザヌに察しおも、「この商品を買いそうだ」ずいう可胜性を予枬できたす。 䌊藀 その高速な凊理を実珟するアヌキテクチャに぀いお、具䜓的に解説いただけたすか 䞊野 Two-Tower モデルは、名前の通り、 ナヌザヌの特城量ず商品の特城量ずいう2぀のタワヌ で構成されおいたす。 ナヌザヌの性別や幎代ずいった特城量、そしお商品の䟡栌やカテゎリずいった特城量を、それぞれ深局孊習DNNで凊理するこずで、意味のある 「ベクトル」 埋め蟌み衚珟、゚ンベディングを生成したす。 掚薊のスコアは、この 「ナヌザヌベクトル」ず「商品ベクトル」の内積 で算出されたす。内積が倧きいほど、ナヌザヌがその商品に興味を持っおいるず刀断できたす。 高速化の肝は、 オフラむンずオンラむンの凊理を分けおいる点 です。 ●オフラむン凊理 商品のベクトルは頻繁に倉わらないため、事前に蚈算し、デヌタベヌスに保存しおおきたす。 ●オンラむン凊理 ナヌザヌのベクトルだけをリアルタむムで蚈算し、保存しおおいた商品ベクトルず照合近䌌最近傍探玢するこずで、瞬時に掚薊結果を出すこずができたす。 YouTubeなどのテック系䌁業で採甚されおいるのも、この「倧芏暡ナヌザヌに察しお瞬時に結果を出せる」ずいうスケヌラビリティず速床が最倧の芁因です。ちなみに、今回採甚したベクトルの次元数は128次元で、䞀般的なシステムで䜿われる700次元や1000次元ず比范しおも、 軜量でリヌズナブルな蚈算資源 で枈むずいう利点もありたす。 第2章実装を阻む壁ず300回超のトラむ゚ラヌ 䌊藀 この最先端の技術を実装する過皋で、特に倧倉だったのはどのようなこずでしょうか 䞊野 非垞に倚岐にわたりたしたが、最倧の困難は 「実装の難しさ」 でした。Two-Tower モデルは抂念はシンプルですが、適切なベクトルを生成するための深局孊習レむダヌの孊習が非垞にデリケヌトで難しいず蚀われおいたす。実際に手を動かすず、なかなか期埅通りの粟床が出たせんでした。 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 補足 Two-Towerモデルに぀いお Google の YouTube 掚薊アルゎリズムなど、倧手テック䌁業で採甚されおおり、倧芏暡ナヌザヌに察しお高速に掚論できるずいう点で革新的。ただし扱いが難しくただ広く浞透しおいない。 参考動画 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 私のログを確認したずころ、モデルの詊行回数は300回以䞊に及びたした。最初はもちろん、コヌドの曞き間違いコヌディングミスも倚くありたしたが、その埌は䞻に「ベクトルの粟床をどう䞊げるか」ずいう詊行錯誀の連続でした。 䌊藀 ベクトルの粟床向䞊は、具䜓的にどのように進めたのでしょうか 䞊野 粟床を䞊げるためには、モデルに「正解」を教えお孊習させる必芁がありたす。私たちは、ナヌザヌIDに䜍眮情報デヌタの行動パタヌンから掚定した属性を特城量性別、幎代などずし、実際の「賌買デヌタ」ず玐づけたした。「このナヌザヌがこの商品を買った」ずいうデヌタには「1」正解を、「買っおない」ずいうデヌタには「0」䞍正解を䞎えたす。 そしお、モデルが算出した内積スコアが、この正解1か0に近づくように、深局孊習レむダヌを孊習させおいくんです。適圓なベクトルだず意味のないスコアが出おしたうので、「ここは1ですよ」ずいう正解を䞎えるこずで、ベクトルの粟床を䞊げおいきたした。 䌊藀 講挔の登壇準備ず、このモデル開発を同時䞊行で進めるのは、盞圓な負荷だったず想像したす。 䞊野 おっしゃる通りです。登壇の締め切りに远われる䞭で、コヌドを倧量に曞き、詊行錯誀を繰り返す日々でした。しかし、その結果ずしお、 YouTube や他のビッグテック䌁業が採甚しおいるのず「同じレベルの技術」を、圓瀟のビゞネスに組み蟌むこずができたのは、倧きな達成感 でした。たさに「困難を乗り越えたからこそ、䟡倀がある」ず実感しおいたす。 第3章孊䌚の独特な雰囲気ず、2床の囜際的な登壇経隓 䌊藀 䌚堎の雰囲気はいかがでしたか 䞊野 孊䌚の雰囲気は、䞀般の技術カンファレンスずは異なり、独特の緊匵感がありたした。リアル䌚堎には20名皋床の参加者がいたかず思いたす。 䌊藀 質問はありたしたか 䞊野 はい、お䞀人の方から質問をいただきたした。登壇内容ずいうよりは、圓瀟の事業領域である「人事領域のAI掻甚」に関する盞談でした。これは、技術広報ず採甚ずいう今回の登壇目的にも合臎しおおり、意矩のある亀流ずなりたした。 䌊藀 実は、このFITを含めお、䞊野さんは短期間で連続しお登壇されおいるず聞きたした。 䞊野 はい、プラむベヌトも含めるず5ヶ月で4回ずなりたす。 ① 5月日本経営工孊䌚囜内孊䌚 卒業埌に参加。倧孊院での研究テヌマ䞭叀スマヌトフォンの販売先最適化を発衚。 ② 7月ICPR囜際䌚議、コロンビア 指導教員の蚈らいで、単身コロンビアぞ枡航。経営工孊に関する研究を発衚したした。治安や蚀語の面で非垞にタフな環境でしたが、貎重な経隓でした。 ③ 8月Google Cloud Next Tokyo囜内クラりド技術倧芏暡カンファレンス ④ 9月FIT今回の登壇 䌊藀 コロンビアでの単身登壇は驚きです。短い準備期間での挑戊も倧倉だったず思いたすが、䜕か゚ピ゜ヌドはありたすか 䞊野 FIT登壇の準備期間は1週間ほどしかありたせんでした。特に倧倉だった゚ピ゜ヌドずしお、飛行機の機内で発衚緎習をしおいたこずがありたす。 飛行機が遅延し、時間ができたため、PDF資料を読み蟌みながら、頭の䞭でプレれンを再生し、タむマヌで時間を蚈るずいうスタむルで緎習を続けおいたした。ブツブツず声に出すこずはしたせんでしたが、頭の䞭ではひたすら時間を調敎しおいたした。 たた、登壇党䜓を通しお、先茩から非垞に手厚いフィヌドバックをいただきたした。 ●「短い蚀葉で蚀い切るこず」 ●「初芋の専門甚語をいきなり䜿っおしたうず、聎衆が぀いおいけなくなる」 ずいった、スラむド䜜成術から話し方たで、実戊を通じお孊ぶこずができたした。特にGoogle Cloud Nextの際は、他の登壇者ずの兌ね合いで持ち時間が短くなるずいう裏事情もありたしたが、孊んだ技術を掻かし、説明の栞を倖さずにコンパクトにたずめるこずができたず思いたす。 第4章未来の仲間ぞ。「亀流」の堎ずしおの孊䌚の䟡倀 䌊藀 孊䌚党䜓を通しお、䞊野さんが最も重芁だず感じたこずは䜕でしょうか。 䞊野 それはやはり 「亀流」 です。 発衚者偎ずしおは、質問を1人からしか埗られなかった反省から、いかに盞手に興味を持っおもらえる発衚をするかずいう難しさを痛感したした。䞀方で、聎衆偎ずしお、自瀟のビゞネスに関連のあるセッションには積極的に質問しに行きたした。䟋えば、 自然灜害時に避難堎所を教えるチャットボット に関する研究は、圓瀟のビゞネスずも関連しそうで、非垞に興味深く、質問を通しお発衚者の方ず有益な関わりを持぀こずができたした。 孊䌚は、最新の技術動向を知るだけでなく、普段関わるこずのない研究者や孊生ずコネクションを䜜り、自分では気づかなかった新しい芳点での気づきを埗られる堎です。 䌊藀 最埌に、同じようにデヌタサむ゚ンスを深く突き詰めたい孊生、そしお未来の仲間たちにメッセヌゞをお願いしたす。 䞊野 私は倧孊院で数理最適化を孊び、その専門性が珟圚のデヌタサむ゚ンスの仕事にダむレクトに掻きおいたす。入瀟埌わずか数ヶ月で、䞖界的にも先進的な技術であるTwo-Tower モデルの実装に挑戊し、それをビゞネスに組み蟌むずいう経隓ができたした。 「孊んできたこずを、瀟䌚の珟堎で盎線的に掻かしたい」、「困難な技術に果敢に挑戊し、その成果を䞖の䞭に矜ばたかせたい」ずいう熱意 を持った方にずっお、unerryは非垞に恵たれた環境です。 私たちず共に、最先端のデヌタサむ゚ンスを深掘りし、䞖の䞭を動かす技術を生み出しおいく仲間になりたせんか *1 Google Cloud Next Tokyo ‘25の登壇蚘事もありたすので参照ください。 Vertex AIで実珟賌買デヌタ x 箄1億IDの人流デヌタによる次䞖代広告タヌゲティング / 「 Google Cloud Next Tokyo 」登壇レポヌト https://www.unerry.co.jp/blog/google-cloud-next... 「Google Cloud Next Tokyo」はGoogle Cloudが幎に1回開催するむベントの日本版で、クラりド技術の最新情報や事䟋の玹介に加え倚圩なワヌクショップなどを含み、今幎は2025幎8月5日(火)ず6日(æ°Ž)の2日間、東京ビッグサむトで開催されたした。 本蚘事は8月5... unerryでは、行動デヌタの可胜性を共に切り拓くデヌタサむ゚ンティストや゚ンゞニアを募集しおいたす。挑戊できる環境で䟡倀創造に取り組みたい方は、ぜひお問い合わせください。 株匏䌚瀟unerry 採甚ペヌゞぞ The post 300回超の詊行錯誀を経お新卒デヌタサむ゚ンティストが開発に挑む「人流×賌買デヌタによる広告タヌゲティング手法」 first appeared on 株匏䌚瀟unerry .
.table-of-contents > li > ul > li > ul { display: none; } はじめに こんにちは、デヌタサむ゚ンス郚コヌディネヌトサむ゚ンスブロックの 倧川 です。私たちは、WEARにおける「䌌合う」をナヌザヌに届けるため、LLMやマルチモヌダルAIを掻甚しおコヌディネヌトの特城抜出や䌌合うに関する独自の刀定凊理のR&Dを行っおいたす。 LLMが台頭しお以降、LLMに構造化出力を芁求するタスクは増えおいたす。数癟件のテストでは問題なく動いおいたシステムが、本番運甚で10䞇件・100䞇件芏暡の掚論を回すず思わぬ゚ラヌに盎面するこずがありたす。 本蚘事では、ファッション画像から柄の特城を抜出するタスクを本番運甚する過皋で盎面した課題ず、その解決策を共有したす。具䜓的には、゚ラヌ内容をプロンプトにフィヌドバックしおリトラむする手法により、87の゚ラヌ削枛を達成したした。この手法はLLMの構造化出力タスク党般に応甚可胜です。 目次 はじめに 目次 サマリヌ 前提条件 発生した問題 問題1: 䞍正な出力68件 問題2: トヌクンが繰り返される出力9件 原因分析 原因1: 䞍正な出力 原因2: トヌクンが繰り返される出力 解決策 解決策1: バリデヌションリトラむの远加 解決策2: プロンプトぞの゚ラヌフィヌドバック远加 ValueErrorの堎合 JSONDecodeErrorの堎合 GoogleAPIErrorAPI゚ラヌの堎合 結果 ゚ラヌ削枛効果 性胜ぞの圱響 たずめ おわりに サマリヌ LLMの構造化出力で発生する「䞍正な倀の出力」ず「トヌクン繰り返し」問題に察し、バリデヌション゚ラヌフィヌドバックプロンプトで87の゚ラヌ削枛を達成68件→9件 ゚ラヌ内容だけでなく、リトラむ回数ずtemperatureもフィヌドバックに含めるず効果が倧きい21件→9件 F1スコアぞの圱響は玄0.02の䜎䞋にずどたり、安心しお導入できる 前提条件 前提条件を揃えるため、タスク内容ずLLMの仕様を共有したす。 項目 内容 タスク ファッション画像から耇数の柄の特城を抜出するタスクマルチラベル分類 掚論芏暡 箄10䞇件の党身コヌディネヌト画像 䜿甚モデル gemini-2.5-flash-lite 出力圢匏 JSON蚱可された倀のリストから遞択 リトラむ 最倧3回 構造化出力では、柄の皮類 pattern_type などの特城に察しお、事前定矩された倀のみを出力するようLLMに指瀺しおいたす。䟋えば、ニュアンス柄 nuance_pattern やグレンチェック柄 glen_check_pattern などが定矩枈みの倀です。この制玄の実装にはGemini APIの response_schema パラメヌタを利甚しおいたす 1 。 ただし、 response_schema はJSONの 構文的な正しさ型やフィヌルド名は保蚌したすが、倀の意味的な正しさは保蚌したせん 。公匏ドキュメントでも「最終的な出力は、䜿甚する前に必ずアプリケヌションコヌドで怜蚌しおください」ず明蚘されおいたす 2 。この仕様䞊の限界が、埌述する「䞍正な出力」問題の背景にありたす。 LLMにより画像から抜出されたpattern_typeのマルチラベル分類䟋 発生した問題 箄10䞇件の画像を掚論したずころ、以䞋の2぀の問題が発生したした。 問題1: 䞍正な出力68件 定矩倖の倀が出力されるケヌスです。䟋えば pattern_type に察しお、 logo 、 patchwork_pattern 、 graphic_pattern のような、あらかじめ指定したリストに含たれない倀が返っおきたした。 䞍正な倀 件数 logo 26 patchwork_pattern 17 graphic_pattern 14 camouflage_pattern 6 その他 5 これらの䞍正な倀は、いずれもファッション領域では実圚する抂念です。LLMが持぀䞀般知識から「もっずもらしい倀」を生成しおしたったず考えられたす。 問題2: トヌクンが繰り返される出力9件 同じトヌクンが無限に繰り返され、JSONパヌスに倱敗するケヌスです。Gemini API公匏ドキュメントでも「トヌクンの繰り返しに関する問題」ずしお同様の事象が取り䞊げられおいたす 3 。 実際のトヌクン繰り返し゚ラヌのログLangfuse この問題が厄介なのは、JSONパヌス゚ラヌでリトラむしおも同様の事象が繰り返される点です。その結果、以䞋の圱響が生じたす。 出力が埗られない : 3回リトラむしおも正垞な結果を取埗できない レむテンシヌの悪化 : 1件あたり10分皋床かかるケヌスも発生 コストの増加 : 無駄なトヌクンを倧量に消費する この問題をスケヌルで考えるず深刻さが分かりたす。10䞇件䞭9件の発生率0.009は䞀芋小さく芋えたすが、本番の党件掚論で400䞇件を凊理する堎合、玄360件でこの問題が発生する蚈算です。1件あたり10分の遅延ずするず、トヌクン繰り返し問題だけで 箄60時間2.5日分の遅延 が発生したす。 原因分析 原因1: 䞍正な出力 䞍正な出力の原因は、出力倀のバリデヌションずリトラむの仕組みが䞍十分だったこずです。前述のずおり、Geminiの response_schema はJSONの構文を制玄するものであり、enum倀の完党な制玄たでは保蚌したせん。埓来の実装ではこれを怜知しおリトラむする機胜がなく、䞍正な出力がそのたた通過しおいたした。 原因2: トヌクンが繰り返される出力 この問題の背景には、 再珟性ずトヌクン繰り返しのトレヌドオフ がありたす。分類タスクでは temperature=0 で出力を安定させたい䞀方、それがトヌクン繰り返し問題を匕き起こしたす。実際、Gemini API公匏のトラブルシュヌティングガむドでも、temperatureを䜎く蚭定するず「ルヌプや性胜劣化などの予期しない動䜜を匕き起こす可胜性がある」ず譊告されおいたす 4 。 技術的には、 temperature=0 の貪欲デコヌディングにより、特定の入力に察しお同じ出力トヌクンが延々ず遞ばれ、適切にEOSトヌクンで終了できない状態に陥りたす。この問題に察凊するため、リトラむ時にtemperatureを0.1ず぀増やす斜策を導入しおいたしたが、それだけでは完党には回避できたせんでした。 解決策 2぀のアプロヌチを組み合わせお改善を図りたした。 解決策1: バリデヌションリトラむの远加 䞍正な倀が出力された際に、蚱可された倀のリストず照合しおバリデヌションし、倱敗時はリトラむする機胜を远加したした。 解決策2: プロンプトぞの゚ラヌフィヌドバック远加 単にリトラむするのではなく、前回の゚ラヌ内容をプロンプトの末尟にフィヌドバックしお再詊行させるこずでLLMの泚意を問題点に向けさせたした。このずき、゚ラヌの皮類によっおフィヌドバック内容を倉えるように蚭蚈したした。 ValueErrorの堎合 ValueErrorの堎合、問題1䞍正な出力の発生が予想されたす。どの倀が䞍正で、どの倀が蚱可されおいるかを゚ラヌメッセヌゞずしおそのたたフィヌドバックするようにしたした。 前回の掚論で以䞋のような゚ラヌが発生したしたので泚意しおください。 ** 前回のConfig・゚ラヌ情報 ** - 詊行: {N} 回目 - temperature: {current_temp} - 前回゚ラヌ: ValueError: invalid result for feature=pattern_type: 'logo' (allowed: ['ethnic_pattern', 'geometric_pattern', ...]) JSONDecodeErrorの堎合 JSONDecodeErrorの堎合、トヌクンが繰り返されおいる可胜性が高いず刀断し、通垞のプロンプトの末尟に以䞋のフィヌドバックを远加したした。この問題は公匏ドキュメントでも蚀及されおおり、「同じこずを繰り返さないでください」ずいう指瀺を远蚘するこずが掚奚されおいたす 5 。 前回の掚論で以䞋のような゚ラヌが発生したしたので泚意しおください。 ** 前回の Config・゚ラヌ情報 ** - 詊行: {N} 回目 - temperature: {current_temp} - 前回゚ラヌ: JSONDecodeError: ... 無限にトヌクンが繰り返される問題が発生しおいる可胜性がありたす。**同じこずを繰り返さないでください。** GoogleAPIErrorAPI゚ラヌの堎合 GoogleAPIErrorAPI゚ラヌの堎合、レヌト制限やネットワヌク゚ラヌが䞻な原因ずなるため、プロンプトを改善しおも解決したせん。この堎合はフィヌドバックを远加せず、指数バックオフによるリトラむのみずしたした。 結果 ゚ラヌ削枛効果 解決策の効果を怜蚌するため、䞍正な出力を起こした68件を評䟡デヌタずしお甚い、斜策前埌での改善床合いを比范したした。なお、トヌクンが繰り返される問題に぀いおは、゚ラヌの再珟ができなかったため今回は評䟡デヌタから陀倖しおいたす。 3぀の条件を甚意しお比范実隓を行いたした。 解決策1: バリデヌションのみを远加 解決策2-1: バリデヌションず゚ラヌフィヌドバック゚ラヌ内容のみ 前回の掚論で以䞋のような゚ラヌが発生したしたので泚意しおください。 - 前回゚ラヌ: ValueError: invalid result for feature=pattern_type: 'logo' (allowed: ['ethnic_pattern', 'geometric_pattern', ...]) 解決策2-2: バリデヌションず゚ラヌフィヌドバック゚ラヌ内容 + リトラむ数 + temperature 前回の掚論で以䞋のような゚ラヌが発生したしたので泚意しおください。 ** 前回のConfig・゚ラヌ情報 ** - 詊行: {N} 回目 - temperature: {current_temp} - 前回゚ラヌ: ValueError: invalid result for feature=pattern_type: 'logo' (allowed: ['ethnic_pattern', 'geometric_pattern', ...]) 斜策 バリデヌションの有無 ゚ラヌFBの有無 ゚ラヌ件数 削枛率 ベヌスラむン ✗ ✗ 68ä»¶ — 解決策1 ✓ ✗ 40ä»¶ 41 解決策2-1 ✓ ✓ 21ä»¶ 69 解決策2-2 ✓ ✓ 9ä»¶ 87 実隓結果ずしお、 87の゚ラヌ削枛 68ä»¶ → 9件を達成したした。 重芁な発芋ずしお、 ゚ラヌ内容だけでなく、リトラむ数ずtemperatureも付䞎したほうが効果的である こずを確認したした解決策2-1の21件→解決策2-2の9件。これらの情報を付䞎するこずで、LLMが「䜕回目の詊行で、どのような生成条件なのか」を把握でき、前回ず異なる出力を生成しやすくなったず掚察されたす。 トヌクンが繰り返される問題に぀いおも、定量的な評䟡には至っおいないものの、定性的には出珟頻床の䜎䞋ず出力の安定化を確認しおいたす。 性胜ぞの圱響 ゚ラヌフィヌドバックを远加するこずで性胜ぞの悪圱響がないか怜蚌したした。柄の評䟡デヌタセットを甚意し、゚ラヌFBの有無で3回ず぀実行した平均倀を比范したした。リトラむ時にtemperatureを0.1ず぀増やす運甚を想定し、temperature 0.0〜0.2の範囲で怜蚌しおいたす。 モデル temperature ゚ラヌFBの有無 F1スコア gemini-2.5-flash-lite 0.0 ✗ 0.8417 gemini-2.5-flash-lite 0.0 ✓ 0.8208 gemini-2.5-flash-lite 0.1 ✗ 0.8434 gemini-2.5-flash-lite 0.1 ✓ 0.8208 gemini-2.5-flash-lite 0.2 ✗ 0.8425 gemini-2.5-flash-lite 0.2 ✓ 0.8217 性胜ぞの倧きな圱響はないこずを確認したした 。数倀䞊ではF1スコアに玄0.02の䜎䞋が芋られたすが、゚ラヌフィヌドバックが適甚されるのはバリデヌション倱敗時のリトラむのみです。正垞に出力された倧倚数のケヌスではフィヌドバックが付䞎されないため、システム党䜓ぞの圱響は軜埮です。 たずめ 本蚘事では、LLMの構造化出力で発生する゚ラヌを87削枛した手法を玹介したした。 本蚘事の貢献は以䞋のずおりです。 バリデヌション゚ラヌフィヌドバック をプロンプトに含めるこずで゚ラヌ件数を87削枛できる ゚ラヌ内容だけでなく、 リトラむ数ずtemperatureも付䞎するず効果が高い フィヌドバックを远加しおもF1スコアぞの倧きな悪圱響はなく、安心しお導入できる この手法はGeminiに限らず、 LLMの構造化出力タスク党般 に応甚可胜 LLMの構造化出力や、Gemini APIの出力の安定化トヌクン繰り返し問題の回避に悩む゚ンゞニアの方々にずっお、本手法が䜕らかのヒントになれば幞いです。 おわりに ZOZOでは、䞀緒にサヌビスを䜜り䞊げおくれる方を募集䞭です。ご興味のある方は、以䞋のリンクからぜひご応募ください corp.zozo.com Generative AI on Vertex AI - 構造化出力 ↩ Gemini API - 構造化出力 ↩ トラブルシュヌティング ガむド - トヌクンの繰り返しに関する問題 ↩ 朗読に関する問題 ↩ トヌクンの繰り返しに関する問題 ↩

動画

曞籍