データマイニング

イベント

2026/08/09(日)

【無料】開発環境・言語選びの悩みを一気に整理！現場で求められるプログラミング...

オンライン

データ分析, プログラミング, Python, データマイニング, 人工知能

和から株式会社

2026/08/12(水)

【無料】「アイスが売れると溺れる人が増える」？因果と相関を読み解く因果推論の...

オンライン

データ分析, 初心者, デジタルマーケティング, データマイニング, DX

和から株式会社

2026/08/13(木)

【無料】口コミやレビューを数値化して見える化する自然言語処理入門；SNS・ア...

オンライン

初心者, Webマーケティング, データマイニング, DX, 人工知能

和から株式会社

2026/08/15(土)

【無料】レビュー・口コミ分析で一歩差がつく！現場で使えるテキストマイニング超...

オンライン

データ分析, 自然言語処理, DX, データマイニング, ノーコード/ローコード

和から株式会社

2026/08/23(日)

【無料】口コミやレビューを数値化して見える化する自然言語処理入門；SNS・ア...

オンライン

初心者, Webマーケティング, データマイニング, DX, 人工知能

和から株式会社

技術ブログ

2026年07月07日

Amazon Redshift RG: Graviton 搭載でより高速、より低コスト

本記事は 2026 年 7 月 2 日に公開された「 Amazon Redshift RG: Faster and lower cost, Graviton-powered 」を翻訳したものです。 Amazon Redshift は、Graviton プロセッサを搭載した新しいインスタンス RG の一般提供を開始しました。Amazon 独自の Graviton プロセッサ上に構築された RG は、以下を実現します。データウェアハウスワークロードで RA3 と比較して最大 2.2 倍高速なパフォーマンス統合されたベクトル化データレイクエンジンにより、Iceberg クエリで最大 2.4 倍、Parquet クエリで 1.5 倍高速データレイククエリに対する TB あたりのスキャン料金が不要。RA3 クラスターに適用されていた Amazon Redshift Spectrum のコストを排除 RA3 と比較して vCPU あたりのコストが 30% 低減 RG はより高速かつ低コストです。一般的にクラウドベンダーは高速なパフォーマンスや新世代ハードウェアに対してより高い料金を設定しますが、Amazon Redshift はより高いパフォーマンスをより低いコストで提供します。本記事では、RG インスタンスが高速な理由を説明します。また、RG が他の主要データウェアハウスと比較して最大 4.2 倍優れたプライスパフォーマンスを実現するベンチマーク結果も紹介します。 RG が高速な理由新しい RG インスタンスは、Graviton プロセッサの性能を最大限に活用するためにゼロから設計されています。Amazon Redshift のベクトル化エンジンは Graviton ベースの SIMD (Single Instruction, Multiple Data) カーネルで最適化されており、分析ワークロードに対して高速で並列化された実行を実現します。Parquet エンコーディングに対する述語評価などの操作では、Graviton のベクトル比較、テーブルルックアップ、ベクトル操作のインストリンシクス（組み込み命令）を活用しています。処理速度の向上を支えるため、RG インスタンスはカスタムビルドの Nitro SSD を使用します。高速なローカルストレージをキャッシュレイヤーとして活用し、 Amazon Redshift Managed Storage (RMS) やデータレイクスキャン、メモリに収まらない計算の中間結果セットに対応します。また、RG の JIT (Just-In-Time) Analyze 機能は、クエリの実行中にデータレイクファイルの統計情報を自動的に収集・保存するため、オプティマイザが大幅に優れたクエリプランを生成できます。ハードウェアアクセラレーション (Graviton)、ベクトル化実行 (SIMD カーネル)、高速ストレージ (Nitro SSD)、適切なクエリプランニング (JIT Analyze) と、スタック全体で最適化を実現しています。上記の最適化と、RG 専用に構築された高性能ベクトル化データレイクエンジンの組み合わせにより、Amazon Redshift の RG インスタンスは分析ワークロードで RA3 と比較して最大 2.2 倍高速に動作し、コストも 30% 低く抑えられます。専用の高性能ベクトル化データレイクエンジン RA3 では、データレイククエリのスキャンを Amazon Redshift Spectrum と呼ばれる別のコンピュートフリートにオフロードしていました。データレイククエリが別のコンピュートで実行されるため、RA3 クラスターと Spectrum フリート間でクエリメタデータや結果を転送する際に追加の負荷が発生していました。Amazon Redshift RG インスタンスには、データレイク向けにゼロから設計された、まったく新しい組み込みスキャンレイヤーが含まれています。新しいスキャンレイヤーには、データレイテンシーを削減するスマートプリフェッチ機能を組み込んだ専用 I/O サブシステムが含まれます。また、Iceberg で最も一般的に使用されるファイル形式である Apache Parquet の処理に最適化されており、Graviton 向けに最適化された SIMD カーネルによる高速なベクトル化スキャンを実行します。スキャンレイヤーには、パーティションレベルとファイルレベルの両方で動作する高度なデータプルーニングメカニズムが含まれており、スキャンが必要なデータ量を大幅に削減します。プルーニング機能はスマートプリフェッチシステムと連携して動作し、データ取得プロセス全体の効率を最大化します。新しい専用ベクトル化データレイクエンジンは、Iceberg クエリで RA3 と比較して最大 2.4 倍、Parquet クエリで 1.5 倍高速です。新しいベクトル化データレイクエンジンは Amazon Redshift のコア実行エンジンに直接統合されているため、RA3 と比較して新たなパフォーマンス最適化が可能です。この統合アーキテクチャにより、RG でのデータレイククエリは高速なローカルデータキャッシュ、改良されたブルームフィルタ、ベクトル化 Parquet スキャン、高度なフィルタリングとプルーニングの恩恵を受けられます。 RG は、データレイクのクエリでお客様が直面する一般的な問題も解決します。Amazon Simple Storage Service (Amazon S3) 上の Iceberg などのオープンフォーマットファイルには有用なメタデータや統計情報が不足していることが多く、SQL クエリを最適に実行することが困難でした。統計情報とは、個別値の数、最小値/最大値、分布パターン、行数などのデータに関するメタデータです。クエリオプティマイザはこの情報を使用して、クエリの最も効率的な実行方法を選択します。たとえば、2 つのテーブルを結合する際、オプティマイザは適切な結合戦略を選択するために各側が生成する一意の値の数を把握する必要があります。統計情報がなければ推測に頼ることになり、多くの場合、結合が遅くなりノード間で不要なデータ移動が発生します。ここで Amazon Redshift の新機能 JIT (Just-In-Time) Analyze が役立ちます。RG インスタンスはクエリの実行中に Iceberg ファイルの統計情報を自動的に取得・保存するため、Amazon Redshift は統計情報がない場合と比較してはるかに最適化されたクエリ実行戦略を選択できます。 Iceberg や Parquet データのスキャンが RA3 よりも大幅に高速になります。Amazon Redshift Spectrum のコンピュートが不要になったことで、RG インスタンスではデータレイククエリの $5/TB のコストも排除されます。データレイククエリがより安価になり、コストの予測も容易になります。パフォーマンスの向上、コンピュートコストの低減、TB あたりのスキャンコストの撤廃という 3 つのメリットにより、データレイクのプライスパフォーマンスが大幅に改善します。データロードの高速化によるインサイト取得の迅速化 Amazon Redshift RG の高速 I/O と Graviton 最適化エンジンにより、RA3 と比較してデータロードが高速化されています。パフォーマンス改善を測定するため、同等サイズの RA3 と RG クラスターで 10TB TPC-DS および TPC-H のデータ取り込みステップを実行しました。RG は TPC-DS データセットを 2 倍高速に、TPC-H データセットを 1.4 倍高速に取り込みました (次の図を参照)。新しい Graviton ベースの RG インスタンスは、RA3 インスタンスと比較してデータロードが最大 2.0 倍高速です。ワークロードはより早く最新データを取得でき、ユーザーやエージェントはより迅速に最新のインサイトを得られます。RG でのデータ取り込み高速化は RA3 と比較して 30% 低いコストで実現されており、データロードのプライスパフォーマンスは RA3 インスタンスと比較して最大 2.9 倍です。お客様の声 Amazon Redshift のお客様は、RG への切り替えによるパフォーマンスとコストのメリットをすでに実感しています。Southwest Airlines と tombola はビジネスクリティカルなワークロードでテストを行い、パフォーマンスの向上とコスト削減を確認しました。 Southwest Airlines 「Amazon Redshift RG インスタンスは、Southwest Airlines に大きなビジネスインパクトをもたらす可能性があります。開発環境での初期テストでは、データウェアハウスワークロードが 50〜60% 高速化し、データレイク分析は 45% 高速化しました。チームはより早くインサイトを得て、運用状況に迅速に対応し、低レイテンシーでデータドリブンな意思決定を行えるようになります。これらの初期結果は期待が持てるもので、本番環境での検証とスケールアップが楽しみです。さらに、TB あたりの Spectrum スキャン料金が不要になり、燃料価格が業界のマージンを圧迫し続ける中、RA3 と比較して 30% のコスト削減を実現しています！」 — Sean Lynch、Vice President, Data and Architecture、Southwest Airlines tombola 「Graviton ベースの Amazon Redshift RG インスタンスは、バッチジョブと分析ジョブの多様なセットで、RA3 と比較して 1.8〜2 倍の書き込みスループットと最大 2.2 倍の読み取り速度を実現しました。同じ時間枠で 40% 多くの処理が可能になりました。ETL サイクルが短縮され、インサイト取得までの時間が加速し、パイプラインによる意思決定のボトルネックがなくなりました。これらの改善により、アナリストやビジネスチームにより新鮮なデータがより早く届くようになりました。さらに魅力的だったのは、パフォーマンス向上と同時にコンピュート費用が 30% 削減されたことです。より少ないコストでより多くを実現するのは稀な成果であり、強調する価値があります。クエリレイテンシーとコストがスケールに伴い複合的に影響する tombola のような大量データを扱うゲーム業界では、今年最もインパクトのあるプラットフォーム決定の一つとなりました。」 — Akshay Srinivasan、Data Engineer、tombola Qoala 「Amazon Redshift クラスターを RA3 から Graviton ベースの RG インスタンスに移行した結果、BI および分析ワークロード全体でクエリ処理時間が 60〜70% 高速化しました。数百万件の保険契約トランザクションを処理する成長中のインシュアテックプラットフォームとして、インサイト取得までの時間短縮は、データチームがダッシュボードやレポートをより早くビジネスに届けられることを意味します。将来の成長に対応するためにより大きなノード構成に移行しましたが、パフォーマンスの向上は追加投資をはるかに上回り、今年最もインパクトのあるインフラストラクチャ決定の一つとなりました。」 — Umar Abdul Aziz、VP of Data、Qoala パフォーマンス結果 RG の実力を確認するため、業界標準の TPC-DS および TPC-H ベンチマークをベースとしたベンチマークを 10TB スケールで、新しい Amazon Redshift RG インスタンスおよび主要な代替データウェアハウスで実行しました。ベンチマークは、アドホック、レポーティング、反復的なオンライン分析処理 (OLAP)、データマイニングなど、さまざまな運用要件と複雑性を持つクエリを実行するよう設計されています。各データウェアハウスをほぼ同じオンデマンドコスト ($32/時間) でサイジングし、特別なチューニングやカスタマイズなしにそのままの状態で 3 回のパワーランを実行しました。結果は以下のチャートのとおりです。新しい RG インスタンスが大差をつけてリードしています。プライスパフォーマンスが優れているということは、パフォーマンスが高く、かつコストが低いことを意味します。まとめ Amazon Redshift RG インスタンスは次世代の分析エンジンであり、データウェアハウスとデータレイクワークロードに高いパフォーマンスを提供します。RG は RA3 と同じワークロードと機能をすべてサポートしているため、利用開始は簡単です。アップグレードして、より低コストでより高いパフォーマンスを得る方法については、移行ガイドを参照してください。ワークロードに最適なプライスパフォーマンスを見つける本記事で使用したベンチマークは、業界標準の TPC-DS および TPC-H ベンチマークをベースとしており、以下の特徴があります。 TPC-DS および TPC-H のスキーマとデータを変更せずに使用しています。クエリは公式の TPC-DS および TPC-H キットを使用し、キットのデフォルトのランダムシードで生成されたクエリパラメータで生成されています。デフォルトクエリの SQL ダイアレクトをサポートしていないデータウェアハウスでは、TPC 承認済みのクエリバリエーションを使用しています。テストには TPC-DS の 99 個の SELECT クエリと TPC-H の 22 個の SELECT クエリが含まれます。メンテナンスとスループットのステップは含まれません。 3 回のパワーランを実行し、各データウェアハウスで最も良い結果を採用しています。プライスパフォーマンスは、時間あたりのコスト (USD) を 1時間あたり 3,600 秒で割り、ベンチマークの幾何平均 (秒) を掛けて計算します。これはクエリあたりの幾何平均コストに相当します。すべてのデータウェアハウスで最新の公開オンデマンド料金を使用しています。 Cloud Data Warehouse ベンチマークと呼ばれるこのベンチマークの結果は、 GitHub リポジトリで公開されているスクリプト、クエリ、データを使用して再現できます。本記事で説明したとおり TPC-DS ベンチマークをベースとしていますが、公式仕様に準拠していないため、公開済みの TPC-DS 結果とは比較できません。著者について Stefan Gromoll Amazon Redshift チームのプリンシパルエンジニアで、Redshift のパフォーマンスを担当しています。プライベートでは料理、4 人の息子たちとの遊び、薪割りを楽しんでいます。 Ankit Sahu データ製品やサービスの構築に 18 年以上の経験を持ち、プロダクト戦略、Go-to-Market 実行、デジタルトランスフォーメーションの幅広い経験があります。現在は Amazon Web Services (AWS) のシニアプロダクトマネージャーとして、Amazon Redshift のビジョンと戦略を推進しています。 Mohammed Alkateb Amazon Redshift のエンジニアリングマネージャーで、クエリ最適化、データレイクアクセス、パフォーマンスエンジニアリング、新しいインスタンスの検証にわたるソフトウェアエンジニア、アプライドサイエンティスト、Amazon Scholar のチームを率いています。Amazon 入社前は Teradata のオプティマイザチームに 12 年以上在籍。バーモント大学で博士号を取得し、主要なデータベースカンファレンスでの論文発表や米国特許を多数保有しています。 Yousuf Hussain Amazon Redshift のシニアソフトウェアエンジニアで、大規模クラウドデータウェアハウスシステムの構築と運用に 11 年の経験があります。分析に情熱を持ち、Amazon Redshift のお客様に高パフォーマンスな体験を提供するためにインスタンス戦略、可用性、信頼性に注力しています。 Nita Shah ニューヨーク拠点の AWS シニアアナリティクススペシャリストソリューションアーキテクトです。20 年以上にわたりエンタープライズデータプラットフォーム、データウェアハウス、分析ソリューションを構築しており、Amazon Redshift を専門としています。エンタープライズ規模の Well-Architected な分析・意思決定支援プラットフォームの設計と構築を支援しています。 Sanket Hase Amazon Redshift チームのエンジニアリングマネージャーで、データレイク分析、ハードウェア・ソフトウェア協調設計、ベクトル化クエリ実行に焦点を当てたクエリ実行チームを率いています。カーネギーメロン大学でコンピューターサイエンス修士号を取得し、データベースシステム分野で複数の米国特許を保有しています。 Jingbo Zhang Amazon Redshift のデータエンジニアで、新しいインスタンスの検証とパフォーマンスバリデーションを担当しています。RG、r8gd、r7gd を含む複数の Graviton ベース Redshift インスタンスファミリーの検証とローンチに貢献し、ベンチマーク、パフォーマンス分析、自動化に注力しています。カーネギーメロン大学でデータアナリティクス修士号を取得しています。この記事は Kiro が翻訳を担当し、Solutions Architect の Kenji Hirai がレビューしました。

AWS, SQL, データマイニング, インフラ, テスト, ゲーム, データベース, ハードウェア, 設計, DX

AWS

2026年05月18日

本邦中古スマートフォン市場における価格形成に対する機種ブランドと為替レートの影響

第35回人工知能学会金融情報学研究会（SIG-FIN）発表レポートリードデータサイエンティストの市川です。今回は、昨年10月に発表した内容について説明させていただきます。第35回人工知能学会金融情報学研究会（SIG-FIN）発表レポートイベントの概要本邦中古スマートフォン市場における買取価格形成の分析概要 1. 発表の位置づけ 2. 研究の目的 3. 使用データ 4. 分析方法 4.1 発売からの経過時間と買取価格の関係 4.2 為替変動の影響分析 4.3 XGBoostによる予測分析 5. 分析結果 5.1 経過時間は最も重要な価格形成要因 5.2 Apple製品は高い価格維持力を持つ 5.3 為替変動の影響は限定的ですが、iPhoneでは遅れて表れる可能性がある 5.4 XGBoostモデルは高い予測精度を示す 5.5 ストレージ容量の影響は非線形 5.6 モデルタイプの影響は相対的に小さい 6. 実務上の示唆 7. 社会的意義 8. 今後の課題 9. まとめイベントの概要人工知能学会金融情報学研究会（SIG-FIN）は、人工知能学会の第二種研究会です。SIG-FIN は、ファイナンス分野における人工知能技術の応用を促進する研究会であり、機械学習、データマイニング、テキストマイニング、市場シミュレーション、投資支援、行動ファイナンスなど、金融に関わる幅広い研究テーマを対象としています。詳細は上記リンクに譲るのですが、金融市場や金融実務に関わる課題に対して、人工知能分野の研究者と金融市場の現場で活躍されている方々が交流する、かなりユニークな研究会という認識です。近年、ファイナンス分野におけるAI活用への関心が高まっていることもあり、発表テーマもかなり幅広くなってきている印象です。スケジュールは以下の通りでした。日時：2025年10月11日（土）～12日（日）開催形式：会場およびオンライン（Zoom使用）のハイブリッド開催会場：慶應義塾大学日吉キャンパス来往舎1階シンポジウムスペース今回の第35回研究会は、土日の2日間にわたって開催されました。参加人数はおおよそ200人程度で、J-STAGE上では第35回金融情報学研究会として25件の研究会資料が公開されており、かなり発表数が多かったです。こちらの研究会はありがたいことに、各発表の研究会資料がJ-STAGEで公開されています。第35回は、人工市場、投資戦略、テキストマイニング、データマイニング、機械学習、生成AI・LLM活用など、金融とAIの接点にある多様な研究が発表されていました。全体としては、従来からSIG-FINらしい人工市場・市場制度設計に関する研究に加えて、有価証券報告書、適時開示、決算説明、J-REIT物件情報などの金融テキストを対象にした研究が目立っていた印象です。また、LLMを用いた利益予測や決算サプライズ抽出、サステナビリティ記述の分類など、生成AI・LLMを金融データ分析に応用する研究も複数あり、金融分野でもLLM活用がかなり広がってきていると感じました。本邦中古スマートフォン市場における買取価格形成の分析概要今回発表してきました、「本邦中古スマートフォン市場における価格形成に対する機種ブランドと為替レートの影響」の概要を以下の通りまとめさせていただきます。 1. 発表の位置づけ本発表は、日本の中古スマートフォン市場において、端末の買取価格がどのような要因によって形成されているのかを、実データに基づいて定量的に分析した研究です。特に、機種ブランド、とりわけApple製品とその他メーカー製品の違い、さらに米ドル／円為替レートの変動が中古スマートフォンの買取価格に与える影響に焦点を当てています。スマートフォンは、現在では日常生活や家計に欠かせないインフラとなっています。個人保有率や世帯保有率はいずれも高い水準にあり、多くの人にとってスマートフォンは生活必需品となっています。一方で、近年は半導体価格の上昇、円安、インフレなどを背景に、新品スマートフォンの価格が上昇しています。その結果、消費者にとって端末購入にかかる負担は大きくなっており、新品の代替手段として中古スマートフォン市場の重要性が高まっています。中古スマートフォン市場の拡大は、消費者に安価な端末選択肢を提供するだけではありません。企業にとっては、買取価格の設定、在庫評価、リース会計、将来価格の見積りなどの実務に関わる重要なテーマでもあります。また、端末が中古市場で再流通することで製品寿命が延び、新品製造や廃棄に伴う環境負荷の低減にもつながります。そのため、中古スマートフォンの買取価格がどのように推移し、またその価格がどのような要因によって変動するのかを明らかにすることには、実務面でも社会面でも大きな意義があります。 2. 研究の目的本研究の目的は、日本の中古スマートフォン市場における買取価格の形成要因を明らかにすることです。具体的には、次のような問いに答えることを目指しています。発売からの経過時間は、中古スマートフォンの買取価格にどのような影響を与えるのか。 Apple製品とその他メーカー製品では、買取価格の維持傾向にどのような違いがあるのか。米ドル／円為替レートの変動は、中古スマートフォンの買取価格に影響を与えるのか。 iPhoneの買取価格を予測する際、どのような特徴量が重要になるのか。先行研究では、中古スマートフォン価格の形成要因として、製品ランク、ストレージ容量、SIMロック、ネットワーク利用制限などの影響が分析されてきました。また、販売サービス間の価格差や、海外市場における中古スマートフォンの再販価値に関する研究も行われています。しかし、日本市場を対象に、業者の買取価格を中心に据え、複数ブランド・複数機種を横断的に分析し、さらに為替レートのようなマクロ経済要因を組み込んだ研究は十分ではありませんでした。そこで本研究では、業者の月次買取価格を主な分析対象とし、ブランド、発売からの経過時間、為替変動、ストレージ容量、モデルタイプなどが買取価格にどのような影響を与えるのかを検証しています。 3. 使用データ分析に用いられたデータは、一般社団法人リユースモバイル・ジャパンが公表した「主要端末の買取平均額の推移」です。対象期間は2018年1月から2024年6月までで、正会員9社の実績に基づく月次の平均買取価格が用いられています。対象となる端末は、A・B・Cランクの使用済みかつ使用可能な個人向け買取端末です。未使用品や破損品は除外されています。元データにはスマートフォン以外のタブレットやウェアラブル端末も含まれていますが、本研究では端末名に基づいてスマートフォンのみを抽出しています。また、同一モデルであってもストレージ容量が異なる場合は、別系列として扱っています。為替レートについては、FREDのデータを用いて、同期間のUSD/JPY月次平均レートを取得しています。これにより、端末ごとの月次買取価格データと、為替レートの時系列データを組み合わせて分析しています。本研究では、中古スマートフォンの価値を把握するために、対象月の平均買取価格に注目しています。買取価格は、中古端末事業者が実際の需給、端末状態、在庫回転、検品基準、保証コストなどを踏まえて決定する価格であり、中古市場における実勢を反映しやすい指標です。小売価格やオークションの掲示価格と比べても、事業者側の実務的な判断が反映されている点に特徴があります。そのため、買取価格の分析は、中古スマートフォン市場の価格形成を理解するうえで有用です。 4. 分析方法本研究では、大きく三つの観点から分析が行われています。 4.1 発売からの経過時間と買取価格の関係第一に、発売からの経過月数と買取価格の関係を分析しています。各端末について、発売年月から対象年月までの経過月数を計算し、経過時間が長くなるほど買取価格がどのように変化するのかを可視化しています。また、製品特性による違いを確認するため、Apple製品とその他メーカー製品を分けて比較しています。これにより、ブランドによって買取価格の維持傾向に差があるかどうかを検証しています。 4.2 為替変動の影響分析第二に、米ドル／円為替レートの変動が買取価格に与える影響を分析しています。ここでは、単純に為替レートと買取価格を比較するのではなく、月次の買取価格の変化に注目しています。これは、新製品の投入によって平均的な価格水準が見かけ上変動する影響を取り除くためです。具体的には、連続する2か月の両方に存在する製品群のみを対象とし、その製品群における平均買取価格の変化を算出しています。この方法により、製品構成の変化ではなく、既存製品の価格変化そのものを捉えようとしています。為替については、過去1か月から6か月までの変化量を計算し、それが1か月から4か月のラグを置いて買取価格の変化にどのように関係するのかを検証しています。 4.3 XGBoostによる予測分析第三に、iPhoneの買取価格を対象として、XGBoostによる予測分析を行っています。説明変数には、発売からの経過月数、3か月前の1か月間の為替変動、ストレージ容量ダミー、モデルタイプダミーが用いられています。さらに、SHAPを用いることで、予測モデルにおいて各特徴量がどの程度重要であり、どの方向に影響しているのかを解釈しています。これにより、単に予測精度を確認するだけでなく、買取価格形成のメカニズムを説明することも試みています。 5. 分析結果 5.1 経過時間は最も重要な価格形成要因発売からの経過月数と買取価格の関係を可視化した結果、全体として明確な右肩下がりの傾向が確認されています。これは、発売から時間が経過するほど、中古市場における端末の買取価格が低下することを示しています。スマートフォンも一般的な製品と同様に、時間の経過とともに市場価値が減少していくことが確認されています。したがって、中古スマートフォン市場における最も基本的な価格形成要因は、発売からの経過時間であると考えられます。 5.2 Apple製品は高い価格維持力を持つ Apple製品とその他メーカー製品を分けて比較すると、両者の間には明確な違いが見られています。同じ経過月数で比較した場合、Apple製品はその他メーカー製品よりも高い買取価格を維持する傾向が示されています。つまり、Apple製品、特にiPhoneは中古市場において価格が下がりにくく、高い価格維持能力を持っています。この背景には、Appleブランドの強さ、iPhoneに対する中古需要の安定性、OSアップデート期間の長さ、周辺アクセサリやエコシステムの充実などが関係している可能性があります。 5.3 為替変動の影響は限定的ですが、iPhoneでは遅れて表れる可能性がある為替変動の影響については、Apple製品とその他メーカー製品で異なる結果が得られています。 Apple製品については、「3か月ラグ×1か月為替変化」および「3か月ラグ×2か月為替変化」において、5％水準で有意な正の相関が確認されています。これは、為替の直近1〜2か月の変動が、約3か月後のiPhoneの買取価格変化に弱い正の相関を持つことを示しています。言い換えると、円安方向への為替変動はすぐに中古価格へ反映されるわけではありませんが、一定の遅れを伴って中古iPhoneの買取価格を押し上げる可能性があります。一方、Apple以外の製品については、有意な相関は確認されていません。相関係数も全体的に小さく、Apple製品に比べて為替変動の影響を受けにくいことが示されています。この違いの背景としては、Apple製品はグローバルな価格体系や米ドル建ての価格設定の影響を受けやすい一方で、Android端末では国内メーカーや多様な価格戦略が混在していることが考えられます。そのため、為替変動の影響がApple製品ほど明確には表れにくいと考えられます。 5.4 XGBoostモデルは高い予測精度を示す iPhoneの買取価格を対象として構築したXGBoostモデルは、高い予測精度を示しています。テストデータに対する決定係数R²は0.898、平均二乗誤差MSEは0.0020となっています。これは、発売からの経過月数、為替変動、ストレージ容量、モデルタイプといった特徴量によって、iPhoneの買取価格を高い精度で説明できることを示しています。 SHAPによる特徴量重要度の分析では、最も重要な特徴量は経過月数となっています。経過月数は他の変数を大きく引き離しており、スマートフォンの中古価格を決める最大の要因が発売からの時間であることを改めて裏付けています。次に重要な特徴量は為替変動であり、その後にストレージ容量、特に64GBであることが続いています。一方で、Pro、Pro Max、SE、mini、Plus、無印といったモデルタイプの影響は、経過月数や為替、容量に比べると限定的です。 5.5 ストレージ容量の影響は非線形ストレージ容量については、単純に容量が大きいほど買取価格が高くなるわけではないことが示されています。 64GBのような低容量モデルは、現在のアプリや写真・動画利用に対して容量不足と見なされやすく、中古市場での評価が低くなりやすい傾向があります。一方で、512GBや1TBのような高容量モデルも、買取価格という観点では必ずしも有利ではありません。発売時価格が高いため、絶対的な買取価格は高くても、購入時の価格差に見合うほど中古市場で高く評価されるとは限らないためです。中古市場の購入者は、高容量に対して新品時と同じだけの価格プレミアムを支払うとは限りません。そのため、128GBや256GBのような中容量モデルが、中古市場において需要と価格のバランスが取りやすい容量帯として機能している可能性があります。 5.6 モデルタイプの影響は相対的に小さいモデルタイプについては、ProやPro Maxは買取価格にやや正の影響を与える一方、SEはやや負の影響を与える傾向が見られます。ただし、モデルタイプの影響は全体として小さく、iPhoneの中古価格形成においては、モデル名の違いよりも、発売からの経過時間、為替、容量の方が重要であると考えられます。 6. 実務上の示唆本研究の結果は、中古端末事業者、消費者、制度設計のそれぞれにとって有用な示唆を持っています。中古端末事業者にとっては、買取価格の設定や在庫評価を行う際に、発売からの経過時間、ブランド、為替変動、ストレージ容量を考慮することの重要性が示されています。特に、Apple製品は価格維持力が高く、為替変動の影響も一定の遅れを伴って表れる可能性があるため、価格改定や在庫管理において注意すべき要素となります。消費者にとっては、購入・売却のタイミングや機種選択を考える際の判断材料になります。たとえば、iPhoneは中古市場で価格が下がりにくい傾向があるため、購入後の売却価値を重視する消費者にとって有力な選択肢となり得ます。また、ストレージ容量については、必ずしも大容量モデルが中古市場で有利とは限らないため、価格と需要のバランスを考慮した選択が重要です。制度設計の観点では、リース会計や端末購入プログラムにおいて、市場実勢に基づく価格見積りの重要性が示されています。中古端末の買取価格は、実際の市場で形成される価格を反映しているため、将来価格を見積もるうえで有用な参照情報となります。 7. 社会的意義中古スマートフォン市場の拡大は、単に安価な端末を提供するだけでなく、循環型経済の推進にもつながります。端末が中古市場で再流通することで、製品寿命が延び、新品製造や廃棄に伴う環境負荷の低減が期待できます。その意味で、本研究は金融、会計、消費者行動、環境政策の接点に位置づけられるものです。中古端末の価格形成メカニズムを明らかにすることは、事業者の価格設定や消費者の意思決定を支援するだけでなく、持続可能な資源循環を促進するうえでも意義があります。 8. 今後の課題今後の課題としては、より詳細なデータを用いた精緻な分析が挙げられます。たとえば、端末状態、販売チャネル、地域差、在庫状況、需要動向などを組み込むことで、より実態に即した価格形成メカニズムを明らかにできる可能性があります。また、本研究ではiPhoneを中心に詳細な予測分析を行っていますが、今後はAndroid端末に特化した分析も重要です。Android端末はメーカーやモデルの多様性が高く、価格形成の構造もApple製品とは異なる可能性があります。さらに、スマートフォンは中古端末として再販売されるだけでなく、部品や材料としてリサイクルされる経路もあります。そのため、将来的には再販売市場とリサイクル市場の双方を含めた価値形成メカニズムの分析へ発展していくことが期待されます。 9. まとめ本研究により、日本の中古スマートフォン市場における価格形成について、次の点が明らかになっています。第一に、買取価格は発売からの経過時間によって強く規定されています。発売から時間が経過するほど買取価格は低下し、経過時間は中古スマートフォンの価格形成における最も重要な要因です。第二に、ブランドの影響も大きく、Apple製品はその他メーカー製品よりも高い買取価格を維持しています。特にiPhoneは中古市場において価格が下がりにくく、高い価格維持能力を持っています。第三に、為替レートの影響は存在するとしても限定的です。ただし、iPhoneについては、為替変動が約3か月程度の遅れを伴って買取価格に影響する可能性があります。第四に、ストレージ容量は単純な線形関係ではなく、中容量帯が相対的に安定した価値を持ち、低容量・超高容量では価格が低下しやすいという非線形な構造があります。以上の結果から、中古スマートフォン市場の買取価格は、発売からの経過時間を中心に、ブランド、為替、容量といった複数の要因によって形成されていることが示されています。これらの知見は、中古端末事業者の価格設定、消費者の購買・売却判断、制度設計、さらには循環型経済の推進において有益な情報となります。

Android, 機械学習, データ分析, 人工知能, データマイニング, インフラ, ネットワーク, テスト, 設計, 半導体

株式会社Insight Edg...

2025年12月07日

第35回人工知能学会金融情報学研究会（SIG-FIN）参加レポート

はじめまして！Data Scientistの白井と市川です。今回は、先日第35回人工知能学会金融情報学研究会（SIG-FIN）に行ってきましたので、そのレポートをさせて頂ければと思います。イベントの概要発表の概要人工市場(4件) (01) 人工市場を用いた取引単位の違いが裁定取引に与える影響の分析 (03) 人工市場を用いた決済期間が異なる市場間での裁定取引が各市場に与える影響の分析 (04) 人工市場を用いたサーキットブレーカーの性能調査投資戦略(4件) (05) 米国経済指標の集団的変動と産業セクター間の関係性の分析 (06) 多資産ネットワーク分析が示す暗号資産の独立性とポートフォリオ分散効果 (07) 長期相関を持つ成行注文流と価格インパクトのミクロモデル化に基づく株価の予測困難性の説明 (08) 戦略多様性と平方根則を取り入れた一般化LMFモデルテキストマイニング(5件) (09) 金融テキストごとの特徴分析とポートフォリオ評価 (10) 有価証券報告書テキストを用いた配当政策データの構築と分析 (11) LLMsによる利益予測の分析とアウトオブサンプル評価 (12) 適時開示テキスト埋め込みを用いたイベントスタディにおける累積異常リターンの予測 (13) 大規模言語モデルを用いたアンサンブル手法による J-REIT物件情報データセットの効率的な構築方法データマイニング(4件) (14) トランザクションレンディングにおける法人のデフォルト分析 (15) Fiedlerベクトルと情報エントロピーを用いた株式ネットワークの構造変化検知 (16) 暗黙の政府保証を加味した国内地方債スプレッドの評価 (17) 本邦中古スマートフォン市場における価格形成に対する機種ブランドと為替レートの影響機械学習(5件) (18) 事前エクスポージャー情報を活用した部分空間正則化付き主成分分析 (19) 財務諸表監査のための逐次検定：試査手続の統計学的な定式化と理論保証 (20) 学習期間が異なる株価予測機械学習モデルのアンサンブル学習による投資戦略の構築 (21) マルチモーダルデータを用いた機械学習モデルによる企業の業績修正予測 (22) 生成AIを用いた決算説明サプライズの定量化手法の提案機械学習/テキストマイニング(4件) (23) 指値配分を連続確率分布化した深層学習によるマーケットメイキング (24) 3値ポートフォリオ最適化に対するQAOAミキサーの性能比較 (26) LLM-PEAD.txt：日本株式市場におけるLLMを用いたサプライズ抽出と決算後ドリフトの実証分析 (27) 有価証券報告書のサステナビリティ記述に関する分類および体系化雑感この記事は、 Insight Edge Advent Calendar 2025 7日目の記事です。イベントの概要人工知能学会金融情報学研究会（SIG-FIN）は人工知能学会の第二種研究会です。詳細は上記リンクに譲るのですが、近年より広い方々の金融市場への関心が高まっています。このような背景で、ファイナンス分野への人工知能技術の応用を促進するための研究会になります。人工知能分野の研究者や金融市場の現場の技術者が参加する、大変ユニークな研究会になっています。余談ですが、今回も別業界の方がいらっしゃるなど、なかなか出会えない方とお話しすることができました。最近、かなり発表量が増加傾向にあり、聴いているだけでも忙しい研究会です。例年、土曜日の1日のみの開催でしたが、発表数の増加に伴い、土日を両方使う研究会となりました。概要は以下の通りです。 * 日時：2025年10月11日(土) および 10月12日(日) * 開催形式：会場およびオンライン（Zoom使用）のハイブリッド開催 * 会場：慶應義塾大学日吉キャンパス来往舎1階シンポジウムスペース第35回研究会発表の概要こちらの研究会はありがたいことに各発表の概要pdfが公開されています。以下、著者の敬称略とさせて頂きます。人工市場(4件) (01) 人工市場を用いた取引単位の違いが裁定取引に与える影響の分析則武誉人 (三井住友DSアセットマネジメント), 八木勲 (工学院大学), 水田孝信 (スパークス・アセット・マネジメント) 取引単位が異なる2つの先物市場間で行われる裁定取引について、小さい単位で取引できるミニ先物の取引単位の大きさが、裁定取引の発生にどのような影響を与えるかを、人工市場モデルを用いて分析した研究です。研究の背景と目的現実の金融市場では、同じ資産を対象としながら取引単位の異なる複数の先物市場が存在します。これら市場間で価格差が生じた際に、裁定取引が行われることが指摘されていますが、取引単位の小口化が裁定取引に与える具体的な影響は十分に解明されていません。これは、現実の市場では裁定取引の観測が困難であることや、多くの外部要因が価格に影響を与えるため、取引単位の違いだけを分離して分析することが難しいことが理由です。そこで本研究では、マルチエージェント型の人工市場を構築し、ミニ先物の取引単位を変化させることで、その影響を明らかにすることを目的としています。分析モデルこの研究では、取引単位が大きい「ラージ市場」と、小さい「ミニ市場」の2つの市場をモデル化しています。それぞれの市場には注文を出す「標準エージェント」が存在し、さらに両市場間で裁定取引を行う「裁定エージェント」を1体設定しています。裁定エージェントは、以下の2つの要件が満たされた場合にのみ取引を実行します。価格要件: 一方の市場の最良買い気配価格が、他方の市場の最良売り気配価格を上回る。利益要件: 実際に売買を行った際に、売却代金が買い付け代金を上回る。 →　成行注文で成立することのみを考えているラージ市場の取引単位を1に固定し、ミニ市場の取引単位（）を9段階に変化させてシミュレーションを行いました。分析結果シミュレーションの結果、以下の点が明らかになりました。取引単位の小口化と発注行動の変化: ミニ市場の取引単位（）が小さくなると、価格要件は満たしても、ミニ市場側の最良気配の注文数量がラージ市場の取引単位に満たないため、利益要件を満たさずに裁定エージェントが発注を見送るケースが増加しました。図1は、の例で、ラージ市場の最良買い気配（価格104）がミニ市場の最良売り気配（価格103）を上回っていますが、ラージ市場の取引単位1に合わせてミニ市場で買い付けると、次の価格帯（105）からも調達する必要があり、結果的に損失が出るため利益要件が成立しない状況を示しています。利益要件を満たす機会の増加: 一方で、の小口化はミニ市場のビッドアスクスプレッド（売値と買値の差）を縮小させる効果がありました。これにより、利益要件を満たす機会が相対的に増加し、結果として裁定取引の発注割合はの小口化とともに緩やかに増加し、一定の水準で収束することが示されました。具体的には、の場合と比較して、が小さくなるほど、価格要件と利益要件の両方を満たして発注される数量の割合が増加する傾向が見られました。結論取引単位の小口化が裁定取引に与える影響を明らかにしました。取引単位が小さくなると、最良気配の数量不足から裁定取引が見送られるケースが増える一方で、ビッドアスクスプレッドの縮小により利益機会が増え、全体としての裁定取引の割合はわずかに増加して安定することが示されました。この結果は、取引単位という制度設計が市場間の裁定取引の量に影響を与えることを示唆するもの。 (03) 人工市場を用いた決済期間が異なる市場間での裁定取引が各市場に与える影響の分析著者：福家緋莉（工学院大学）、水田孝信（スパークス・アセット・マネジメント）、八木勲（工学院大学）目的／背景 T+N（遅延決済）と即時決済が併存する環境では、両市場間の裁定には株式借入が必要となるパターンがあり、貸株コストや供給制約があると裁定が働きにくい。そこで、人工市場で外生要因を排し、借株コストが価格水準・流動性・裁定取引回数に与える影響を定量評価する。アプローチ - 即時決済市場とT+N市場の2市場を仮定し、各市場にエージェントでの売買を発生させて、連続ダブルオークションでシミュレーション環境を構築。 - 各市場に一般投資家エージェントをそれぞれ1000体配置し、市場横断の裁定エージェントを配置してシミュ - 裁定パターン（6種）： - i. 即時決済市場で買い、T+N市場で売りが発生。 - ii. T+N市場で買い、即時決済市場で売り（借株コストC: 価格×係数α）。 - iii/iv T+N側に指値で買いと売りを発生。 - v/vi 即時決済側に指値で買いと売りを発生。 - 実験設定 - コスト係数 α ∈ {0, 1e-4, 1e-3, 1e-2, 0.1} - 各条件30試行。 - 評価指標は各市場の平均的な最良気配/価格乖離/板の厚み（Depth：最良気配±100ティックの累計）/裁定発注回数（パターン別）。価格水準の固定化：αが大きいほど、T+Nは割安・即時決済は割高に固定化。例：平均最良売り— T+Nの SF はα上昇で低下（10,005.26→9,998.19）、即時市場の SL は上昇（10,005.26→10,012.97）。価格乖離は |SF−SL|, |BF−BL| ≈ 0.05→14.7 付近まで拡大、α≥0.01 で頭打ち。板構造の非対称化： T+N市場：SellDepth > BuyDepth へ（売り厚↔下押し＝割安化）。即時市場：SellDepth < BuyDepth（買い厚↔上押し＝割高化）。裁定機会の蒸発：α上昇で全パターンの発注回数が減少。特にコスト付き（(ii),(v),(vi)）は α≥0.01 でほぼ消滅。結果、価格乖離を修正するはずのフローが細り、価格偏りが固定化。所感／示唆 - 「速さ」の陰のコスト：即時決済を極端に推し進めると、借株依存の裁定が詰まりやすく、価格水準のバイアスが残存・固定化する。制度設計では、決済短縮と貸株市場の厚みをセットで議論すべき。 - 実務アルゴへの示唆：コストを内生化した条件式（式(3)(5)(7)）での発注可否判定は必須。α感応度が高いパターン（特に(ii),(v),(vi)）は在庫・貸株の確保やヘアカット前提でロジックを分岐させるのが良い。 - ポリシー面：T+1 移行や即時化の議論では、「裁定の自己修復力」を損なわないために、貸株供給や清算インフラ（在庫移動・担保受渡）の整備が鍵。 (04) 人工市場を用いたサーキットブレーカーの性能調査著者：早瀬竜希（工学院大学大学院）、水田孝信（スパークス・アセット・マネジメント）、八木勲（工学院大学）目的／背景サーキットブレーカー（CB）の「参照期間（過去価格を参照する窓）」Tr1 と「停止期間（取引停止の長さ）」Tr2 を切り分け、誤発注ショック下での価格下落抑制と回復スピードへの影響を人工市場で定量評価する。アプローチ - シミュレーションに使う環境は、ザラバ方式の連続ダブルオークションを利用。 - ノーマルエージェント n=1000 が、ファンダメンタル／テクニカル／ノイズの3戦略を重み付きで発注。 - ティックサイズ δP=1、ファンダメンタル価格 Pf=10000と設定。 - 誤発注ショック：期間 tms=30000〜tme=60000、確率 pm=15% で成行売りに置換。 - CBルール：過去 Tr1 の価格から Pr=100 以上の下落（または上昇）で発動し、Tr2 の間は新規注文・キャンセル停止。 - パラメータ走査：Tr1∈{1000,2000,5000,10000}、Tr2∈{2000,5000,10000,20000} などの組合せで20試行平均。 - 評価指標は「最大下落幅」と「Pf への回復時刻」。実験＆結果 - 下落抑制：Tr1・Tr2 を大きくするほど最大下落幅は縮小した。（例：小さめ設定の Tr1=1000, Tr2=2000 で約955、対して大きめ設定の Tr1=20000, Tr2=10000 で約203）。 - 回復スピード：一般に Tr1・Tr2 を大きくすると Pf への回復は遅延（例：Tr1=1000, Tr2=2000 で約86,410時刻後、Tr1=20000, Tr2=2000 で約117,122時刻後に復活）。 - 参照期間Tr1を拡大するだけでも、下落は抑制された。ただし Tr1 がある閾値を超えると、初回発動タイミングはほぼ同じになり、効果は頭打ち。 - Tr1>>Tr2 だと連続発動が発生する。(停止期間終了後の判定が「下落前の高い価格」を参照し続けるため、実質的な停止が長引く)。 - 組合せ最適化の兆し：Tr1=5000 の列では Tr2=2000→5000 にすると、下落抑制と停止回数の減少が両立し、Pf への回復時刻が短縮するケースが観察された。所感／示唆 - 設計トレードオフ：Tr1/Tr2 を大きくすれば下落は抑えられるが、回復は遅くなる。 - 初動抑制と回復スピードのバランス設計が要点。 - 実務の指針： - 短すぎる Tr2 は反動・連続発動を招きやすい一方、長すぎる Tr2 は回復遅延を招く。 - ショック終了見込みや清算工程を踏まえ、イベント窓に整合する中庸の Tr2 を探索する必要がある。 - Tr1 は「発動感度」を決めるダイヤルの役割を果たしている。そのため、市場のノイズ水準や誤発注頻度に合わせて、発動感度の頭打ち領域を超えない範囲で調整するのが重要。 - 監視・運用面では、Tr1>>Tr2 の連続発動リスクを常時モニタし、非常時は一時的にパラメータを切替えられる運用ルールが有効。投資戦略(4件) (05) 米国経済指標の集団的変動と産業セクター間の関係性の分析著者：北浦崇弘（旭化成）、稲垣祐一郎（旭化成ホームズ）、松浦大将（みずほリサーチ&テクノロジーズ）、越山祐資（みずほリサーチ&テクノロジーズ）、西野洋平（みずほリサーチ&テクノロジーズ）、家富洋（立正大学）目的／背景米国の主要な産業セクターレベルの経済指標とマクロ経済指標を対象に、複素ヒルベルト主成分分析（CHPCA）と多因子分析（MFA）を組み合わせた新しい分析フレームワークを提示。目的は、経済指標群が示す集団的な変動と景気循環の関係を明らかにすること、そして産業セクター間や指標間の先行・遅行関係を定量的に把握することである。アプローチ - 複素ヒルベルト主成分分析（CHPCA）とMultiple Factor Analysis（MFA）を統合し、集団モードと位相を同時に推定。 - データ：FRED等から82指標（NAICS上位10セクター＋マクロ指標）、期間1993/02〜2024/12。 - 有意モード判定にRRS（Rotational Random Shuffling）を採用。 - 安定性：特徴量のランダム削除、15年ウィンドウのスライディングで検証。実験＆結果 - 有意モードは3つ。寄与率は第一0.31、第二0.07、第三0.06。第一モードは景気後退期と整合し、累積強度はGDP下落率と近い関係。 - 安定性が高く、第一モードは特徴量9割削除でもcos類似度の中央値>0.9。 - 位相関係：労働時間（AWH）が雇用者数（AE）に先行／在庫売上比（ISR）→売上（SA）→在庫（TI）の順。 - セクター：小売（RT）が先行し、総合（TOT）が続く傾向。 - イベント別：ドットコムは集団運動が限定的、リーマンとCOVID-19は広範な波及。リーマンは後半で集団性が顕在化。所感／示唆 - 第一モードは「景気の集団運動」の実用的proxy。景気後退の規模感比較や産業別波及の把握に有効。 - 実務では、雇用・在庫関連の合理的順序（AWH→AE／ISR→SA→TI）を前提に、サプライチェーンの先行把握と在庫調整のタイミング設計に活用可能。 - 分析は長期データとセクター網羅性に依拠するため、他国・最新系列への継続適用で頑健性をモニタリングしたい。 (06) 多資産ネットワーク分析が示す暗号資産の独立性とポートフォリオ分散効果著者：水門善之（慶應義塾大学）目的／背景暗号資産（ビットコイン）が伝統的資産（株・債券・コモディティ・為替）と比べてどの程度独立しているかをネットワークで可視化し、分散投資の有効性（Sharpe／Sortino）を検証する。アプローチ - 週次リターンの相関行列からネットワークを構築（相関0.2〜0.3で閾値化）。 - 中心性（Degree／Eigenvector／Betweenness／Closeness）で構造把握。 - 主要株価指数・コモディティ先物・主要通貨・暗号資産を対象。 - モンテカルロで9資産（主要ETF群＋BTC）の無空売りポートフォリオを1万通り生成し、Sharpe／Sortino最大点を探索（2020/01〜2025/04）。実験＆結果 - ネットワークではBTCが周縁に位置し、中心性が総じて低い＝独立性が高い。相関閾値0.3ではBTCは他資産から切断されるケースも。 - 銅（Copper）は異市場を含めても中心性が一貫して高い（景気指標性）。 - Sharpe ratio：Sharpeが0.086→0.160に改善、BTCウエイト約0.29。 - Sortino ratio：0.19→0.32に改善、BTCウエイト約0.13（下方リスク配慮で比率は抑制）。所感／示唆 - BTCは「低相関な衛星資産」として、総合リスク当たり収益を押し上げ得る。ただし下方リスク耐性を重視する運用では配分抑制が妥当。 - マクロ連動性が相対的に薄い局面で寄与が期待できる一方、制度・流動性イベントへの感応度が高いため、ガバナンス・流動性管理とセットで配分設計したい。 - コモディティでは銅の中心性が高く、景況変化の早期把握に有用なモニタ対象となる。 (07) 長期相関を持つ成行注文流と価格インパクトのミクロモデル化に基づく株価の予測困難性の説明著者：佐藤優輝、金澤輝代士（京都大学）目的／背景成行注文流は長期記憶性により予測可能だが、価格は予測困難というパラドックスを、ミクロモデルで説明する。アプローチ - Lillo–Mike–Farmer（LMF）型の注文分割行動モデルと、価格インパクトの平方根則 I(Q)=c√Q を結合した理論モデルを構築。 - 注文符号の自己相関 C(τ)∝τ^{-γ}(0<γ<1) を前提に、価格ダイナミクスの厳密解を解析。実験＆結果 - トレーダが分割執行を継続することで注文流は長期記憶を示し、平均的なインパクトは√Qに比例。 - その一方で、価格系列は拡散的（ランダムウォーク状）になりやすく、注文流の予測可能性と価格の予測不可能性が同居する条件を理論的に提示。 - モデルは市場横断で観測される経験則（長期記憶の符号系列、普遍的な平方根インパクト）と整合。所感／示唆 - 注文流シグナルの活用は、インパクト・流動性制約を踏まえた実装でなければ超過収益に直結しにくい。 - 最良執行や最適発注（POV／TWAP等）の設計では、平方根インパクトと分割行動が生む自己相関を同時に考慮すべき。 - マーケットメイク／リスク管理では、長期記憶を前提にヘッジ頻度・在庫上限の調整が有効。 (08) 戦略多様性と平方根則を取り入れた一般化LMFモデル著者：藤原俊太（京都大学）、佐藤優輝（京都大学）、金澤輝代士（京都大学）目的／背景価格インパクトの平方根則は普遍的とされる一方、比例係数 c の解釈・無次元化の妥当性が十分に整理されていない。本研究は、近年の理論モデルを基に c の定義付けと統計解析手法の妥当性を検証し、取引コスト指標としての c の位置づけを明確化する。アプローチ - 価格インパクトの定義を再確認し、出来高 VD・ボラティリティ σD による無次元化を前提に理論整備。 - 近年提案モデルを採用し、日次出来高・日次ボラの解析計算および数値計算を併用して c と無次元化の関係を導出。 - 既往研究（各市場で δ≈0.5 の検証）との差分整理：指数 δ と係数 c の役割分担を明確化。 - 実務上の取引コスト（流動性・板厚・スプレッド等）との対応づけを検討。実験＆結果 - べき指数 δ は既報通り 0.5 付近で安定。一方で c は市場横断に一定ではなく、無次元化の前提に依存して変動。 - モデルから、c は「価格応答の強さ＝実効的な取引コストに比例」する関係が定量化され、銘柄・日付を跨いだ比較可能性の条件（VD・σD によるスケーリングの前提）を提示。 - 統計手法の検証：従来の無次元化に理論的根拠を与えつつ、過度な一律適用には注意が必要という結論。所感／示唆 - 係数 c は「市場インパクトのコスト・メーター」とみなせる。運用実装では c の時系列推定（流動性レジーム検知）を組み込むと良い。 - 監視指標としては δ よりも c のドリフト／レジーム転換が重要。板厚・ボラ・回転率と併せた多次元モニタリングが有効。 - 企業横断や市場横断の比較では、無次元化の条件充足（VD・σD の安定性）を確認してから指標化すべき。テキストマイニング(5件) (09) 金融テキストごとの特徴分析とポートフォリオ評価著者：高野海斗（野村アセットマネジメント）目的／背景ファンドマネージャーが投資判断に用いる決算短信やアナリストレポートなどの金融テキスト情報について、その定性的な情報を定量的な数値に変換し、資産運用戦略への活用可能性を探ることを目的とする。特に、従来のセンチメント分析が抱える課題（センチメント定義の曖昧さ、分類タスクによる限界など）を踏まえ、「将来の見通し」に焦点を当てた独自のセンチメント分析モデルを構築し、テキストの種類による特徴の違いを明らかした。アプローチ - 対象テキスト：バイサイド／セルサイドのアナリストレポート、ニュース、四季報（業績記事コメント・材料記事コメント）。 - センチメント推定：辞書法と BERT ベース（回帰タスク、-2〜+2 の連続値）。同日複数文は平均化し、過去90日・半減期20日で時間加重。 - 検証： - イベントスタディ：テキスト公開日を起点に ±60 営業日で累積リターンとの相関。 - 分位ポートフォリオ：月末に5分位（Strong Neg.〜Strong Pos.）、等ウェイト／時価総額ウェイトで評価（AR/TE/IR/MaxDD/TR）。実験＆結果 - カバレッジ：四季報は銘柄数ベースほぼ常時100%、セルサイドは時価総額ベースで高水準。 - 事前の値動きとの整合：t 時点のセンチメントと t−60 営業日のリターンに正相関（事前の上昇＝ポジ、下落＝ネガが多い）。 - 公開後 60 営業日の相関は総じて小さい。 - アナリスト系は公開直後の短期で差が出やすい。 - ニュースは当日に反応するが持続は弱い。 - 四季報の公開後10営業日超で、ネガティブ分位が相対的に切り返す「リバーサル」傾向が見られた。 - ポートフォリオ： - アナリスト（Strong Pos.）で良好な ARが観測された。 - ニュースは Neutral を除き概ねプラスに寄与している。 - 四季報はネガ側の AR がプラス、売買回転率は低水準となっていた。所感／示唆将来の見通しに着目したセンチメント分析モデルを用いることで、金融テキストの種類ごとに異なる特性を明確化し、資産運用への実用的な示唆を与えました。特に、一般的に避けられがちな四季報のネガティブコメントが、逆張りの投資戦略において有効なシグナルとなり得る可能性を示した点は、大きな発見。今後は、本研究で得られたセンチメントスコアと財務指標などを組み合わせた、より高度な投資戦略の検討が期待される。 (10) 有価証券報告書テキストを用いた配当政策データの構築と分析著者：竹下蒼空（成蹊大学）、高野海斗（野村アセットマネジメント）、仁科慧（成蹊大学）、酒井浩之（成蹊大学）目的／背景企業の配当政策に関する方針が主に有価証券報告書などのテキスト情報として記述されている点に着目し、これを自然言語処理技術（BERTやLLM）を用いて体系的にデータ化することを目的とする。手作業での分析や単純なキーワード検索では困難だった、大規模かつ高品質な配当政策データの構築手法を提案し、そのデータを用いて、企業の配当政策が投資パフォーマンスにどのような影響を与えるかを分析・検証した。アプローチ - 文抽出：BERTopic＋ModernBERT を組み合わせ、配当政策に有益な文を段階的に抽出する。 - マルチタグ付与：LLM few-shot で「増配（INC1〜9）」「減配（RED1〜6）」を文単位に多重ラベル化。(structured outputs で一貫性確保)。 - 評価：各タグで人手適合率を測定。 - 投資検証：2017/04〜2025/03、TOPIX500 対象。 - 増配系（increase）、非減配系（no reduction）、両方（progressive）のポートフォリオを月次で構築（等ウェイト／時価総額ウェイト）。実験＆結果 - タグ頻度：近年は増配志向が強まり、とくに「増配の意図（INC7）」と「累進配当採用（INC3）」が増加。 - コロナ期に一時的な減配言及（RED5/RED6）が増。 - 文分類性能：一部の時点判定タグ（当期導入・当期減配）は文単体では難しく適合率が低下するが、他は概ね良好な結果であった。 - パフォーマンス（例）： - 等ウェイト：progressive の AR≈+4.1%、increase の AR≈+3.5%。 - 時価総額ウェイト：progressive の AR≈+3.3%。回転率は年1回の開示反映が中心で比較的低位。 - 特性：DY/DOE の中央値は True/False 間でたびたび交差し、単純な高配当指標では代替困難＝テキスト固有情報を含む。所感／示唆 - 開示テキストは「将来の配当方針」を直接反映するため、数値財務だけでは拾いにくいシグナルを提供。 - 実装の肝は「抽出→多ラベル化→保守的集計（月次）」の一貫パイプライン化。タグの時点解釈は企業内時系列（例年文）を併置して精度向上を図りたい。 - 運用面では、progressive/increase/no reduction を補助シグナルとしてバリュー・クオリティ因子と組み合わせると頑健化が見込める。 (11) LLMsによる利益予測の分析とアウトオブサンプル評価著者：白井祐典（Insight Edge, Inc.）、市川佳彦（Insight Edge, Inc.）、中川慧（大阪公立大学）目的／背景 EDINET-BENCH を用いて、日本上場企業の「次期純利益の増減方向」予測における LLM の特性を検証。どの企業・業種で精度が出やすいか、また学習後に出現した未知データに対して汎化（アウトオブサンプル：OOS）できるかを評価する。アプローチ - 予測方法：EDINET-BENCHを流用。 - モデル：Claude 3.7 Sonnet／カットオフ 2024-10-31を利用。 - インサンプルデータ：EDINET-BENCH の利益増減ラベル（テストは 2021–2024 年が中心）。 - OOSデータ：2025-06-01〜2025-08-31 に EDINET 提出の有報（学習後公開）を対象。 - 指標：ROC-AUC を「売上規模四分位」「東証17業種」別に算出し、インサンプル（IS）と OOS を比較。 - 事前検証：カットオフ後の自然現象を問うプロンプトで「後知識混入」兆候の有無をチェック。実験＆結果 - IS 全体 ROC-AUC：0.6075。売上下位 25%で低め（例：0.5330）など規模依存が示唆。業種間ばらつき大。 - OOS 全体 ROC-AUC：0.6327とインサンプルに対して減少せず。 - 業種差：銀行は OOS で大幅改善（+0.2899）、一方で「金融（銀行除く）」「鉄鋼・非鉄」などは低下。所感／示唆 - LLM の利益予測は OOS でも一定の汎化を確認。ただし業種・規模で異質性が大きく、追加特徴の導入（業種特化のテキスト・数量情報）が鍵。 - 実務利用は「銘柄横断の一律モデル」より、業種別や規模別のハイブリッド設計（テキスト＋数値＋事前分布）でのチューニングが有効なのではないかとの示唆。 - 正真正銘の OOS を厳密化するため、評価ウィンドウとカットオフ設計（予測対象の1年前基準など）の標準化が望ましい。 (12) 適時開示テキスト埋め込みを用いたイベントスタディにおける累積異常リターンの予測著者：伊藤央峻（日興リサーチセンター）目的／背景企業の適時開示情報（TDnet）の「タイトル」から生成した高次元のテキスト埋め込み（テキストの数値ベクトル表現）が、開示直後の短期的な株価下落リスクを予測する上で有効な情報となるかを検証することを目的とする。従来のセンチメント分析など、テキスト情報を少数の指標に集約する手法では失われがちな微妙なニュアンスを、高次元の埋め込みを直接利用することで捉え、予測精度が向上するかを評価した。アプローチ - データ：2020/04〜2025/04 の開示約69万件（タイトル・公開項目コード）を利用。 - 特徴量：日本語特化埋め込み ruri-v3-310m（768次元）、価格系ベース特徴、業種ダミー、公開項目コード。 - モデル・検証：LightGBM／Purged K-fold（K=5）、PR-AUC 最適化。クラス不均衡はアンダーサンプリングで調整。目的変数を「CAR(0,3)が分布の下位5%に入るか（＝短期的な下落リスクの発生）」とする二値分類問題と設定。 - 可視化：PCA＋クラスタリングで埋め込み空間の整合性と季節性を確認。SHAP で特徴寄与を解釈。実験＆結果 - 性能：Base（価格＋業種）の F1=0.235・PR-AUC=0.164 → 埋め込み追加で F1=0.265・PR-AUC=0.192 に改善。 - 単独比較：Emb 単独は Code 単独より全指標で優位。Base+Emb と Base+Emb+Code は同水準＝埋め込みがコード情報を内包。 - 構造：PCA 可視化で決算／ガバナンス／PR 等の意味的分離と季節パターンを確認。SHAP では直近リターンと埋め込み成分が上位に並ぶ。所感／示唆 - タイトル埋め込みは「短期下落リスクの早期検知」に有効。 - 公開項目コードの事前カテゴリを超える情報を保持。 - 運用では、価格モメンタム／リバーサル系の簡便特徴に埋め込みを重ねる構成が費用対効果良。 - 次の改善は、本文・添付資料の統合、分位回帰など連続予測化、埋め込み次元の安定化の検討。 (13) 大規模言語モデルを用いたアンサンブル手法による J-REIT物件情報データセットの効率的な構築方法著者：田中麻由梨（日本取引所グループ）、土井惟成（日本取引所グループ）目的／背景 J-REIT 有報の物件情報は表・テキストが混在し自動構造化が難しい。報告書に記載される物件情報は、フォーマットが統一されておらず、テキストと表が混在しているため、自動でのデータ化が困難。複数 LLM の Few-shot 出力をアンサンブルし、高精度な JSON 変換と人的修正の最小化を目指す。アプローチ - 対象：J-REIT の「保有資産」等の HTML 断片（表＋注記テキスト）。 - 前処理：style系の削除で構造を保持しつつトークン削減。Few-shot で JSON 仕様と注記取扱いを明示。 - モデル：ChatGPT-4o／Gemini 2.5 Pro／Claude 3.7 Sonnet、temperture=0で実施。 - アンサンブル方法：複数モデルの予測結果の3/3一致なら「採用」、2/3一致なら「多数決」、不一致なら単体精度最大モデルを採用。 - 改変検知：キー>20文字や値の過長などをルールで警告し、修正箇所を特定。実験＆結果 - Few-shot 効果：Zero→One→Two-shot で Accuracy が 32.7%→96.9%→98.37% に向上。 - LLM 単体（Two-shot）：Accuracy は 98.37〜99.03%。 - 一致度別：3/3一致は 99.991%、2/3一致は 98.350%、全不一致は各モデル 86〜89%。 - 最終アンサンブル：全体 Accuracy 99.222%。不一致は約5%のみで人的確認対象を大幅に圧縮。所感／示唆 - 「3/3または2/3一致は自動確定、0/3のみ人手確認」の運用が現実解。注記の表記揺れは正規化ルールで吸収可能。 - データセット拡張時も Few-shot 事例の管理とルール検知をセットにすれば、精度と省力化を両立できる。 - 表＋注釈の混在ドキュメントにおける汎用的な構造化パターンとして他ドメインへの横展開が期待できる。 - 作成されたデータセットは、GitHubで公開される予定。データマイニング(4件) (14) トランザクションレンディングにおける法人のデフォルト分析著者：小林司（東京大学）、山本竜也（GMOあおぞらネット銀行）、成末義哲（東京大学）、森川博之（東京大学）目的／背景従来の財務諸表に基づく融資とは異なり、口座の取引履歴を基に審査を行う「トランザクションレンディング」における法人のデフォルト（債務不履行）要因を分析した。インターネット専業銀行の実際の融資データを用いて、法人の属性や取引情報がデフォルト率にどう影響するかを検証している。アプローチ - 対象データ：インターネット専業銀行の契約18,199件（契約後1年のデフォルトを評価）。 - 属性軸：設立年数（3年未満／以上）、代表者の事業経験（初回／法人設立経験／個人事業主経験）、業種。 - 取引軸：入金先の集中度（顧客依存の強さ）をハーフィンダール・ハーシュマン指数(HHI)で定義。 - 比較：各セグメントのデフォルト率（LOW／MEDIUM／HIGH）と統計的有意性を検証。実験＆結果 - 設立3年未満の法人は、3年以上よりデフォルト率が有意に低い。 - 代表者が個人事業主経験・法人設立経験を持つ場合は相対的に低水準。 - 業種：デザイン／教育など“ソフト面”依存の業種で低水準、食品・飲料や小売・製造で高水準の傾向。 - 顧客集中：HHIが高いほどデフォルト率上昇。年数に依存せず一貫。所感／示唆 - 「若い×経験あり」プロファイルを過度に抑制せず、顧客集中の分散度を厳格モニタする設計が有効。 - スコアリングは属性（年数・経験）×取引集中（HHI）の二軸で早期に差別化。与信額より行動指標に着目。 - 業種の“ソフト依存度”を補助変数化し、審査・モニタリングの優先順位に反映したい。 (15) Fiedlerベクトルと情報エントロピーを用いた株式ネットワークの構造変化検知著者：星野知也（株式会社三井住友銀行）目的／背景相関に基づく株式ネットワークの“構造変化点”を頑健に捉え、レジーム転換の早期兆候を検出。Minimum Spanning Tree(最小全域木)の、ショック時の不自然連結の限界を補う枠組みを提示。アプローチ - 提案：階層的Fiedler疎性化（Hierarchical Fiedler Sparsification;HFS）で疎グラフ構築（Fiedlerベクトル×二分割×交差エッジ選択）。 - 指標：Fiedlerエントロピー[均質性]とワッサースタイン距離[構造差異]で変化点検知。 - データ：米国S&P500の49業種（日次、直近12週ロール、週次更新）。MST・Absorption Ratioと比較。実験＆結果 - 構造表現：コロナ期（2020/3）はHFSで業種クラスタが明瞭、MSTは直感に反する隣接が散見。 - 変化点：2020/2上旬（下落前）、3月後半（底形成期）、11月（選挙・ワクチン報）で検知が整合。 - 収益との関係：エントロピー↑の週は平均超のリターン、距離↑の週は低下傾向。上昇/下落トレンド別でも意味ある差分。所感／示唆 - リスク上昇の前兆は「エントロピー低下＋距離上昇」の組み合わせで早期拾い。監視ダッシュボードに組込みやすい。 - 相関ノイズに強く、業種構造の解釈性が高い。日本市場や個別銘柄粒度にも横展開が期待できる。 - 運用ではMST等との併用で“ショック依存の誤配線”を回避し、レジーム検知の信頼度を底上げ可能。 (16) 暗黙の政府保証を加味した国内地方債スプレッドの評価著者：石原龍太（みずほ第一フィナンシャルテクノロジー）目的／背景一般的に、日本の地方債は地方財政制度を通じた政府の支援により、信用リスクは低いと認識される。しかし、この政府保証は法的な根拠を持つものではなく、その信頼度（市場の信認度）を観測することは困難。過去には、国の補助金削減などを背景に地方財政への懸念が高まり、スプレッドが拡大した事例もあった。本論文では、国内地方債の発行スプレッドに内在する「暗黙の政府保証」の強さを定量推計し、説明力の向上と市場整合性を検証した。投資家・引受側・政策当局の判断材料を提供。アプローチ - モデル：スプレッド＝α＋β₁×{実質公債費比率×(1−政府保証信頼度)}＋β₂×{国債マイナス金利幅}。 - 推計：遺伝的アルゴリズムで「政府保証信頼度（月次）」を同月の都債との差分二乗誤差と平滑化で最適化。 - データ：2006/4–2024/3の市場公募地方債（10年）、都道府県の実質公債費比率、国債利回り。実験＆結果 - 信頼度の時系列：2006–2008年に低下局面（制度改革・スプレッド拡大と整合）、以降は高水準で安定。 - 当てはまり：政府保証信頼度を入れると決定係数R²が0.169→0.308に改善。 - 係数解釈：保証が消滅した極端仮定では、実質公債費比率20%の団体でスプレッドがおおよそ+20bp拡大。所感／示唆 - 地方債の“準安全資産”性は制度と市場信認の産物。信認低下シナリオのストレス計測に有用。 - 実務では、保証信頼度のモニタ（時系列）×団体別ファンダ（実質公債費比率）で相対価値評価を高度化。 - 将来の制度変化や人口動態ショックに対し、信頼度推計を早期警戒指標として活用できる。 (17) 本邦中古スマートフォン市場における価格形成に対する機種ブランドと為替レートの影響著者：市川佳彦（Insight Edge, Inc.）、平野友貴（住友商事）、居村裕平（住友商事）、中條悠介（住友商事）、桑本奈緒（住友商事）、堤鴻志郎（住友商事）、中川慧（大阪公立大学）目的／背景中古スマホ市場の価格形成メカニズムを、実勢に近い「買取価格」を用いて定量検証。ブランド差や米ドル/円の為替変動が残価率にどう効くかを明らかにする。アプローチ 2018–2024年の機種・容量別の月次買取価格（RMJ）から残価率（RVr）を定義し、①経過月数とRVrの関係（線形回帰/可視化）、②為替変動のラグ効果（1–6か月ウィンドウ×1–4か月ラグの相関）、③iPhoneを対象にXGBoost＋SHAPで特徴量重要度を評価。実験＆結果 - 価格を最も規定するのは「発売からの経過月数」。Appleは他社に比べ減価が緩やか。 - 為替は短期の同時点では効きにくいが、iPhoneでは「過去1–2か月の為替変化が約3か月後のRVr変化と弱い正相関」。 - XGBoostの予測精度は高水準（R²≈0.898、MSE≈0.0020）。SHAPでは「経過月数」が圧倒的に重要。容量は非線形で、64GBはマイナス寄与、128/256GBは中立、512GB/1TBは相対的に不利。所感／示唆経過月数とブランド差（特にApple優位）を前提に、在庫評価や買取価格のガイド可。為替は即時反映ではなく遅行気味のため、為替ショック観測後の数か月先を見た在庫ポジション調整が有効。容量ミックスは「中容量を主軸」に設計するのが合理的。機械学習(5件) (18) 事前エクスポージャー情報を活用した部分空間正則化付き主成分分析著者：中川慧（大阪公立大学・MONO Investment）、加藤真大（みずほ第一フィナンシャルテクノロジー・大阪公立大学）、今村光良（筑波大学）目的／背景資産運用で広く用いられる主成分分析（PCA）の安定性を向上させる新しい手法「部分空間正則化付き主成分分析」を提案。株式や債券など複数の資産（マルチアセット）の価格変動を説明するために、マクロ経済指標と関連付けられるリスクファクター（マクロファクター）が利用される。このファクターを抽出する代表的な統計手法が主成分分析（PCA）となる。しかし、過去の一定期間のデータを用いて分析を逐次的に繰り返す「ローリングPCA」では、推定される主成分（ファクターへの各資産の感応度を示すエクスポージャー）が時間とともに大きく変動してしまう問題がある。この不安定性は、ファクターの経済的な解釈を一貫して行うことを困難にし、分析の信頼性を損う。この課題を解決するため、本研究では「部分空間正則化付き主成分分析」を提案。この手法は、標準的なPCAの最適化問題に、利用者が経済的知見に基づいて事前に設定した「望ましいエクスポージャー構造（事前エクスポージャー情報）」を正則化項として加えるものである。アプローチユーザが与える「事前エクスポージャー（US）」の張る部分空間への射影を正則化項として導入し、標本共分散との凸結合S_LS＝λ(USUSᵀ)+(1−λ)Sに対するPCAとして解く。実証では6資産（月次、1997–2025）でk=3因子、Procrustes距離で安定性を評価し、リスク分解で説明力を確認。実験＆結果 - λを上げるほど主成分空間の時系列安定性が大幅改善（平均Procrustes距離：λ=0で2.46 → λ=0.9で0.12）。 - 説明力（Adj.R²やリスク分解の寄与）はおおむね維持され、安定性と説明力の両立を確認。 - 事前因子は「成長/リスクオン・実質金利・インフレ」に対応する構造で解釈可能。所感／示唆 - 「解釈可能な因子構造を維持したまま」戦術配分やリスク管理に使える因子を安定抽出できる。 - 運用現場ではλをハイパラとして運用目的に合わせて調整し、安定性重視のモニタリングやアロケーション説明に有効。 (19) 財務諸表監査のための逐次検定：試査手続の統計学的な定式化と理論保証著者：加藤真大（大阪公立大学・みずほ第一フィナンシャルテクノロジー）、中川慧（大阪公立大学）目的／背景財務諸表監査における「試査」と呼ばれるサンプリング調査の慣行に、統計学的な理論保証を与えるための新しい手法を提案している。現代の財務諸表監査では、膨大な量の勘定科目を全て調査する「精査」は非現実的であるため、一部を抜き出して調査する「試査」が行われている。実務では、一度のサンプリングで判断できない場合、判断がつくまで追加でサンプリングを続ける慣行があるが、これは経験則に頼っており、誤った判断を下す確率（誤判断確率）が数学的に保証されていなかった。本研究では、統計的保証のある逐次検定として整備し、誤判断確率（第一種・第二種）を管理可能にする。アプローチ有限母集団からの非復元抽出（超幾何分布）を前提に、停止・決定ルールを閾値列（上限κᵣ(t)、下限κᵣ_(t)）で定義。最悪母逸脱率（r±θ）でモンテカルロにより閾値を逐次的に設計し、所望のα・βを満たすよう誤判断確率を制御。拡張として片側検定、検出力制約つき片側、二段階検定、打ち切り付き逐次検定を提示。実験＆結果 - 無関心領域外で誤判断確率が目標（例：α=β=0.05）以内に制御されること、想定レンジで期待停止時刻が算定可能であることを数値実験で確認。 - 現場フローに合わせた設計（初回サンプル後の追加試査や打ち切り）にも対応可能。所感／示唆「どこで止めるか／どちらと判定するか」を事前に設計できるため、監査品質の説明責任を強化。許容逸脱率や無関心領域、α・βを文書化しておくと、監査計画・レビュー時の合意形成がスムーズになる。 (20) 学習期間が異なる株価予測機械学習モデルのアンサンブル学習による投資戦略の構築著者：西村征馬（三井住友トラスト・アセットマネジメント）目的／背景機械学習による株式リターン予測では「学習期間（履歴の長さ）」が結果に大きく影響するが、最適期間は一意に決めにくい。本研究は、学習期間だけが異なる複数モデルをアンサンブルし、期間選択を機械化して予測力と運用成績を高めることを目指す。アプローチ - ベースモデル：LightGBM（回帰、損失はMSE）。学習期間を36〜120か月まで12か月刻みで8本作成。 - 検証設計：将来/同時点情報漏洩を避ける時系列交差検証でvalidationを統一化。 - アンサンブル： - スタッキング（線形回帰／Elastic Net） - ブレンディング（逐次二次計画法[SLSQP]で非負・和=1の重み最適化でのブレンド） - バックテスト：TOPIX採用のうち時価総額上位60%、2015/07–2025/06。予測に基づく分位（5分位・10分位）およびロングショートを評価。実験＆結果 - 損失：Validation最小化で得た重みはTest lossも概ね改善。OLSスタッキングは過学習傾向、Elastic Netとブレンディングが安定。 - 収益性：アンサンブル由来のポートフォリオが単体モデルより一貫して高い超過リターン（5分位・10分位、ロングのみ/ロングショートの別を問わず）。 - ロバスト性：学習期間差に依存せず、重み学習により未知データでの標準偏差（test_std）も抑制。所感／示唆 - 学習窓の最適化は“選ぶ”より“混ぜる”が実務的。Elastic Net系や非負和=1ブレンドは過学習を抑えつつ汎化に寄与。 - 年次リバランス等の軽量更新でも効果が出る設計で、既存のファクターモデルに期間多様性アンサンブルを上乗せする価値が高い。 (21) マルチモーダルデータを用いた機械学習モデルによる企業の業績修正予測著者：田代雄介（MTEC）、鈴木彰人（MTEC）、山口流星（MTEC）、宮澤朋也（データアナリティクスラボ）、亀田希夕（データアナリティクスラボ）目的／背景企業の財務報告書（決算短信）のテキストデータと、株価の時系列データを組み合わせた「マルチモーダルな機械学習モデル」を構築し、将来の業績修正を予測するタスクに取り組んだもの。長文テキストと時系列情報を統合した機械学習フレームワークを構築し、企業の業績修正（上方修正、下方修正、修正なし）を予測するモデルの有効性を検証することを目的とする。アプローチ - テキスト：ModernBERT（長文対応、最大4096トークンで学習）。 - 時系列：Transformerエンコーダ（過去250営業日の対TOPIX超過リターン）。 - 結合：単純結合／Gated Fusion／Cross Attention を比較。 - データ：東証プライムの2018年以降。クラス不均衡は1:1:1のアンダーサンプリング。Train=2018–2022、Test=2023–。指標：AUROC, F1。実験＆結果 - ベースライン：テキスト単独 AUROC=0.656, F1=0.458；時系列単独 AUROC=0.555, F1=0.345。 - マルチモーダル：Cross Attentionが最良（AUROC=0.671, F1=0.493）、Gated Fusion/単純結合もテキスト単独を僅かに上回る。 - 長文効果：4096 vs 512トークンで大差なし（重要情報は先頭に集中する可能性）。 - 実務適合性：予測確率に基づく10分位分析で、最上位分位の上方修正率53.2%とシグナル妥当性を確認。所感／示唆 - テキストが主、時系列は補助。ただし結合部の設計（Cross Attention等）で安定改善。 - 運用では、確率スコアの分位連動でアナウンス前のポジショニングや監視銘柄選定に転用可。モデルの軽量化・更新性と併せて実装のしやすさが高い。 (22) 生成AIを用いた決算説明サプライズの定量化手法の提案著者：辻晶弘（DaNeel Insight株式会社）目的／背景従来のサプライズ指標SUE（EPS実績−予想）だけでは説明会の質やIR文脈が捉えにくい。生成AIによるペア比較＋GlickoレーティングでEarnings Callの相対評価（rating）を構築し、価格反応（day1）とその後のドリフト（day2–5）への説明力を検証する。アプローチ - ユニバース：日本上場企業（SCRIPT Asia等のコール要約／トランスクリプトを整備）。 - 指標：SUE_cs（コンセンサスEPS変化）、SUE_cb（会社ガイダンス変化）を定義。 - 生成AI：LLMでコール要旨をペア比較し、Glicko法で一体化スコア（rating）へ。 - 目的変数：TOPIX超過のday1（reaction）とday2–5（drift）。単回帰・重回帰でp値/R²・標準化係数を評価。実験＆結果 - day1反応：SUE_csが最も強い（R²≈0.093、p<0.001）。SUE_cb, ratingも有意だが相対的に小。 - day2–5ドリフト：説明力はratingが優位で、日を追うごとにR²は逓減しつつも正の寄与を維持。数値サプライズのみでは説明しきれない質的情報の寄与を示唆。 - 相関・面回帰のクロスチェックでも、即時は数値、持続は質という役割分担が概ね一貫。所感／示唆 - 決算説明会の質（言語情報）は短期の方向づけより継続リターンに効く。イベント後のフォローではratingの活用が有効。 - 実務実装は、SUE（数値）×rating（質）の二軸でイベント選別とエントリー/エグジットを設計。トランスクリプト整備と時点合わせが精度のカギ。機械学習/テキストマイニング(4件) (23) 指値配分を連続確率分布化した深層学習によるマーケットメイキング著者：久保健治（東京大学・株式会社松尾研究所）、中川慧（大阪公立大学・株式会社松尾研究所）目的／背景深層学習（DL）を用いた効率的なマーケットメイキング手法を提案するもの。特に、価格変動が大きい市場において複数の指値注文を管理する際の、行動空間の爆発的な増大という課題に対処している。指値の数量配分を離散的なものではなく、連続確率分布を用いて緩和する点が研究の中心。具体的には、複数の正規分布を混合した混合正規分布を使い、指値数量の分布を表現した。これにより、ニューラルネットワークが出力すべきパラメータの数を大幅に削減し、高次元の行動空間の問題を回避して効率的な学習を可能にする。アプローチ指値数量の「配分」を連続確率分布（混合正規の切断・再正規化）で緩和し、行動空間を圧縮。StockMixerに時刻特徴量とポジションを拡張して方策ネットを構成し、CARA効用で学習。約定は高値/安値と分布の積分で近似し、離散化との誤差を検証。データ／実験設定米国上場の主要ETF5銘柄（GLD, IWM, QQQ, SPY, TLT）・5分足（2021–2024）。Nm=3の混合正規、ラグL=78、T=24、γ=1。学習は前半期間の7-fold、テストは後半期間でバックテスト。結果テストで年率リターン約5%、ASR≈1.62、MDD≈2.98%、CR≈1.52。連続緩和は収益をやや過大評価するが、離散実装との差は限定的。ポジションは各銘柄・合計ともに偏り小さくリスク管理が機能。所感／示唆複数価格・複数銘柄のマーケットメイクで「数量配分を連続化」する設計は、RL実装の安定化と可搬性（離散実装への落とし込み）を両立する実務的トレードオフ。今後は緩和誤差の制約化とネットワーク設計の最適化（例：執行コスト・流動性制約の内生化）が有効。 (24) 3値ポートフォリオ最適化に対するQAOAミキサーの性能比較著者：山村真太郎（東京理科大学）、渡邉聡（KDDI総合研究所）、國見昌哉（東京理科大学）、斉藤和広（KDDI総合研究所）、二国徹郎（東京理科大学）目的／背景量子コンピューティングの一分野であるNoisy Intermediate-Scale Quantum（NISQ）デバイス向けの量子アルゴリズム、Quantum Approximate Optimization Algorithm（QAOA）を金融工学の重要課題であるポートフォリオ最適化問題に応用した研究。現実の運用では「保有・非保有・空売り」の3状態が自然。3値（−1,0,1）のポートフォリオ最適化をQAOAで解き、ミキサー選択が性能に与える影響を比較する。アプローチ 2量子ビット/資産で3値を符号化し、Standard/XY系（Ring, Parity Ring, Full, QAMPA）を比較。 p層の初期値設計・古典最適化（SLSQP/Nelder-Mead）を工夫し、ノイズ（depolarizing）環境でも評価。データ／実験設定 DAX30からn=5/8のサブセット（主にn=5, B=2を提示）。 Statevector/Qasm/DensityMatrix Simulator、ショット数3,000/8,192、p=1,3,5,7。評価は平均近似率rと最適解確率P。結果無ノイズではXY Full/QAMPAが高水準（r>99%級、Pも高い）。一方、ノイズ下ではパラメータの頑健性と探索容易性の差が顕在化し、層数pの増加は必ずしも有利に働かない。初期値・古典最適化設定が品質に与える影響も大きい。所感／示唆 3値最適化では、ノイズ環境を前提としたミキサー選定＋初期化戦略が鍵。小規模問題でも層数の過剰増加は避け、頑健性重視のハイパラ設計で実運用への橋渡しが現実的。 (26) LLM-PEAD.txt：日本株式市場におけるLLMを用いたサプライズ抽出と決算後ドリフトの実証分析著者：種村賢飛 (東京大学/松尾研究所), 久保健治 (東京大学/松尾研究所), 中川慧 (大阪公立大学/松尾研究所) 目的／背景近年の日本株式市場を対象に、企業の決算発表後に株価がサプライズの方向に継続して動く「決算後ドリフト（Post Earnings Announcement Drift;PEAD）」という現象を再検証したもの。特に、従来からの数値情報に基づくサプライズと、大規模言語モデル（LLM）を用いてテキスト情報から抽出したセンチメント（市場心理）を組み合わせることで、この現象がどのように変化するかを分析。アプローチ - 決算資料から、数値に基づくサプライズ指数 SUE と、LLM によるテキストベースのサプライズ指数 LES を構築。 - PEAD の検出：決算発表後の超過リターンがサプライズ方向に継続するかを検定。 - LES は辞書極性ではなく LLM により文脈を評価し、“数値では拾えない含意”を抽出。データ／実験設定 - 日本上場企業の決算発表（TDnet/決算短信等）を対象。 - 発表当日以降の短期〜数日スパンの超過リターンでドリフトを評価。 - SUE 単独、LES 単独、SUE×LES の条件別に比較。結果 - SUE 単独・LES 単独では一貫したPEADを確認できず。 - SUE×LES の組合せ条件下（例：SUE 高×LES 低など）では、サプライズ方向へのドリフトを観測。 - LES は辞書極性とは独立に、発表後リターン変動の一部を追加説明。所感／示唆 - 「数値×言語」の相互条件でPEADが表れやすい。 - 決算イベントのシグナル設計は、SUEとLLMテキスト要約（LES）の同時利用が有効。 - 実装面では、LESを単独スコアとして使うより、SUEで事前に候補を絞りLESで精緻化する二段構えがコスト対効果良。 - モデル監査の観点では、LESが辞書法以上の“文脈”を捉えていることを前提に、説明変数の直交性チェックとリーク検証を継続すべき。 (27) 有価証券報告書のサステナビリティ記述に関する分類および体系化著者：梅原武志 (総合研究大学院大学/日経リサーチ), 武田英明 (国立情報学研究所/総合研究大学院大学) 目的／背景有価証券報告書に記載された企業のサステナビリティに関する具体的な取り組みを抽出し、分類・可視化することを目的とする。さらに、抽出した重要語とSDGsオントロジー（SDGsの目標や関連用語を体系化した知識ベース）を関連付けることで、企業の活動がどのSDGs目標に貢献するのかを体系化することを試みている。アプローチ - テキストマイニングでサステナビリティ施策の記述を抽出し、カテゴリ分類とキーターム抽出を実施。 - 企業・業種別に分布を集計し、可視化（マップ化）で取り組みの差異を分析。 - 義務化以後の開示様式に合わせ、比較可能性を高めるための構造化ルールを設計。データ／実験設定 - 日本企業の有価証券報告書（「サステナビリティ関連財務情報」欄）。 - 産業分類・企業属性（規模など）で層別し、記述の濃淡や用語の出現頻度・共起を分析。結果 - 企業横断での共通語彙と業種固有語彙が抽出され、E（環境）・S（社会）・G（ガバナンス）の重点の置き方に業種差。 - 義務化以降の開示では、定型表現が増える一方で施策の具体性にはばらつきが残存。 - 体系化（分類＋用語辞書）により、多社比較の自動集計・可視化が可能に。所感／示唆： - レポーティングは「定型＋自由記述」の二層で運用されるため、用語辞書と分類スキーマのガバナンスが重要。 - 投資家向けには、業種ごとの“力点”の違いを踏まえたベンチマーク・指標化が有効。 - 企業実務では、次年度以降の継続改善に向け、社内KPIと開示テキストの紐づけ（用語統一・具体性の担保）を進めたい。雑感 Sig-finではテキスト分析が完全に定着しました。会場で様々な方と話をしましたが、今後もこの流れが継続するものと考えています。暗号資産や量子コンピューターのテーマまで幅広く扱われているのが印象的で、実際に来場された方も金融業界に限らず多くの方がいらっしゃっていました。