【データ分析コンペ】第1回 金融データ活用チャレンジ 開会式
アーカイブ動画
動画リンクはこちら
プログラム
1.オープニング
(一社)金融データ活用推進協会 代表理事 兼 デジタル庁 プロジェクトマネージャー 岡田 拓郎 氏
2.開催挨拶
(一社)金融データ活用推進協会 顧問 兼 みずほ第一フィナンシャルテクノロジー 代表取締役社長 安原 貴彦 氏
3.コンペルール・表彰説明
データコンペ委員長代行 兼 みずほ第一フィナンシャルテクノロジー 永山 恒彦 氏
4.応援メッセージ
自民党デジタル社会推進本部長 初代デジタル大臣 平井 卓也 氏
5.詳細説明会
-5-1.データ説明
SBI新生銀行 グループデジタル戦略部 部長代理 臼井 宏毅 氏
-5-2.データ分析環境説明・チュートリアル紹介
データブリックス・ジャパン シニア パートナー ソリューション アーキテクト 竹下 俊一朗 氏
MILIZE AI開発部 AIエンジニア 小野 宏史 氏
-5-3.Slack説明
MILIZE 営業企画部 兼 AIコンサルティング部 妹尾 奈々 氏
-5-4.中間イベント案内
データコンペ委員長 兼 Japan Digital Design平山 元清 氏
6.閉会挨拶
SIGNATE 代表取締役CEO 齊藤 秀 氏
司会:広報委員長 兼 三井住友信託銀行・Trust Base 田中 慶亮 氏
1.オープニング
動画リンクはこちら
(一社)金融データ活用推進協会 代表理事 兼 デジタル庁 プロジェクトマネージャー
岡田 拓郎 氏
オープニングで登壇した金融データ活用推進協会(以下、FDUA) 代表理事の岡田氏は、協会活動の3本柱として、「金融AIの教科書作り」、今回の「金融データコンペティション開催によるデジタル人材の育成」、「金融データ活用の在るべき組織の標準化」を掲げ、官民、金融業界、スタートアップとのHubとして様々なイベントを行なっていると説明した。
協会会員は1月20日時点で108社、金融業界・パートナー企業・デジタル庁等が参加している。
「金融業界を盛り上げたいという熱いパッションを持ったメンバーで設立した非営利団体で、今回のコンペも各会員の知を結集して開催に至った。」
続いて、岡田氏は、データ分析コンペに至った想いを語った。
「一つ目は、金融業界のNew Heroの誕生。
金融業界は年功序列のイメージが強いかもしれないが、これからの金融業界、尖った「個人」の活躍が必要不可欠です。データコンペティションでは、年齢・職種・役職を問わず、ゲームのように定量的な結果が出る。新入社員、学生、他の業界 からNewHeroが誕生することを期待している。
二つ目は、金融の明るい未来を創ること。
金融業界は閉鎖的なイメージがあるかもしれない。金融で働いている方からしても、金融業界はオワコンだと思っている方もいるかもしれない。ただ、私はそうは思っておらず、そして、データコンペを運営している委員も、本気で金融業界の明るい未来を創りたいと考え、自身の金融機関に閉じて囲い込みをするような事なく、手を取り合って業界横断で開催することを決断した。
MUFG、みずほ、三井住友信託、SBIホールディングス、SBI新生銀行が金融業界横断で金融データの魅力、データ分析の面白をお伝えできるコンペになれば思っている。
今回の日本初の金融業界横断でのデータコンペティション開催、実は、構想はちょうど1年前からあった。その実現に向けて、運営メンバーの方、一人一人にお声がけし、開催に向けた熱いパッションを伝えて回った。嬉しいことに、運営メンバーにこれだけ多くの個人が共鳴頂き、会社を巻き込んで本日開会式まで至りましたこと、感激している。
1年間の間、当協会とコンペの運営は、プロボノ活動、つまりボランティア活動にも関わらず、毎日、少しずつ苦労しながら準備をしてきた運営メンバーには大変感謝している。運営側も初めてのチャレンジということもあり、行き届かない点が出てくるかと思うが、その点、ご理解いただきたい。
本コンペティションが、デジタル社会における金融人材の拡大に貢献できれば幸いである。」
2.開催挨拶
動画リンクはこちら
みずほ第一フィナンシャルテクノロジー 代表取締役社長
安原 貴彦 氏
みずほ第一フィナンシャルテクノロジー 代表取締役社長安原 貴彦 氏より開会挨拶をいただいた。
「岡田代表理事より先ほどパッションという言葉が出たが、私もそのパッションに共感し、FDUA 顧問に就任させていただき、本日挨拶をさせていただく。
これまで銀行こそがデータを活用してビジネスができる最たる業界と思って取り組んできたが、まだ道半ばでやるべきことが多くあると思っている。みずほでは、これまで色んなデータを分析することはやってきたが、みずほだけのデータでは中々よい分析ができず、銀行横断、更にはオールジャパンで取り組んでいかないと感じていた。その中で、FDUAの話があり、これは最高だと思い、今回のコンペには大変期待している。
コンペの参加者は1,000人を超えると思われ、大盛況が予感される状況にある。これまで金融機関は各社各社でコンペを行ってきたが、今回金融業界横断で行うコンペは非常に意義が高く、本邦初になる。金融業界のデータ利活用はややもすると少し遅れていたかもしれないが、ここから巻き返すぞと狼煙を上げるコンペと思っている。
金融機関も多数協賛、SIGNATE、データブリックス・ジャパン、MILIZE、ニッセイ情報テクノロジーや後援いただいているデジタル庁に多大なる協力をいただき、この場を借りて感謝申し上げる。そして、一番は参加者の皆さまに感謝申し上げる。ぜひ腕を試していただき、金融業界の発展に繋げていただければと考えている。」
3.コンペルール・表彰説明
データコンペ委員長代行 兼 みずほ第一フィナンシャルテクノロジー
永山 恒彦 氏
今回のコンペでは、住宅ローンの延滞予測というテーマを取り上げ,家計変調の予兆を捉えることに挑戦して頂く。
これは,顧客体験の向上、金融機関の収益向上や事務コスト削減という観点で、金融機関にとって重要なテーマである。
コンペでは、目的変数(予測したい対象)の値が既知の学習用のデータと目的変数が未知の検証用のデータが与えられる。学習用データでモデルを作成し、検証用データに対する予測値を提出し、評価される。
今回のコンペでは、精度(10位まで)に加え、特別賞を3種類用意している。MILIZE賞は本コンペの Slack ワークスペースでの活動を基に、MILIZE 賞はブログ投稿を基に、SIGNATE賞はコンペでの投稿アクティビティを基に選定される。
今回のコンペでは、データの目的外利用に関する制約など、注意されたい点が多くあるため、ご留意願いたい。
4.応援メッセージ
動画リンクはこちら
自民党デジタル社会推進本部長 初代デジタル大臣
平井 卓也 氏
自民党デジタル社会推進本部長 平井卓也議員より本コンペティションに対する応援メッセージをいただいた。
まず冒頭にて本コンペティションについて大変期待していると述べ、2016年に官民データ活用推進基本法を議員立法で通した当時の背景を語った。
「当時は、官民のデータが十分に使われていない現状があり、そしてオープンデータも進んでいないという状況の中で法律を作った。」
その後、約6年という月日を経て各地方自治体のオーブンデータの提供が進んでいると考えている。しかし、まだデータの流通について不十分と感じており、データフォーマットの標準化も進んでいないと指摘した。
データ利活用でパーソナルヘルスに関するデータに次いで期待したいのが金融データであるとも語った。
「この分野に関してはフィンテックや一部AIの活用も使われ始めているが実はより多くのデータをつなぐことによって行動変容をさせるような使い方ができると考えている。」
一例としてスマート家計を挙げた。生活を変えることによってお金をさらにより有効に使っていく将来像を語った。データを調べることでいろいろな生活者の行動もわかり、環境の分析にも使用できることを期待している。
今回は日本で初めて金融業界横断のデータコンペティションということで画期的である、と激励した。銀行のみならず若い企業、スタートアップも含めて金融業界横断でデータというものをいかに有効に使っていくかということをコンペで争うのはまさに時代の要請。
「デジタル社会を推進していく中において金融データの有効活用は国家の成長力や競争力に直結していく。」
最後に以下の通り本コンペティションの大成功を祈念いただくとともに以下のとおり、より一層の金融データ活用発展への期待もメッセージとしていただいた。
「期待が大きい分野であり、第1回目を契機に金融データの利活用についてはデジタル庁でも重要な分野だと考えている。皆さんと一緒にデータの有効活用によって新しい産業や新しい価値を創造できるようになればと心から願っている。」
5.詳細説明会
-5-1.データ説明
SBI新生銀行 グループデジタル戦略部 部長代理
臼井 宏毅 氏
次に株式会社SBI新生銀行の臼井宏毅氏が金融データ活用推進協会を代表して金融データ活用チャレンジで使用するデータについて説明した。
・出題内容は、住宅ローンの延滞予測でその予測精度を競うもの
・延滞予測に用いる説明変数データは、入出金や預金残高など金融業界特有のデータ項目で構成し作成
・このデータは一般的な住宅ローン利用者を想定して作成した架空のデータ
本コンペを通して、顧客理解がさらに深まり、顧客体験の向上につながると考えていると、参加者に伝えた。
-5-2.データ分析環境説明・チュートリアル紹介
データブリックス・ジャパン シニア パートナー ソリューション アーキテクト
竹下 俊一朗 氏
1.データブリックス社とは?
今回、データブリックス社の協力の元、コンペの基盤としてデータブリックスを利用するということのようだ。
日本初であるとのこと。データブリックスは竹下氏の指摘の通り、HSBCやJP Morgan Chaseなど、世界の名だたる金融機関に採用されており、世界最速でARR(年間定額収益) 1,300億円、時価総額5兆円超えを達成し、次世代のデータ&AI 基盤としての人気も世界的に鰻のぼりの模様。
2.データブリックスでできること?
データの収集、加工、分析、機械学習、可視化をEnd to Endで実現できる、オープンなクラウド型のプラットフォームである。
昨今でてきたクラウドデータウェアハウスと比較して、非構造データと構造データの一元的な処理、バッチ処理とリアルタイム処理の統合、高速なETL処理、効率的な機械学習モデルの開発と運用などに強みがあると、竹下氏は指摘する。
さらにデータカタログなどデータ活用を促進する辞書機能、外部のステークホルダーと効率的かつ安全にデータを共有する仕組みや、データガバナンスを担保する機能も同プラットフォームに備えられており、データ&AI プロジェクトに必要なものは全てがそろっている印象だ。
今回は、機械学習機能のみをコンペ内で提供する。実際に今回の与信ビジネスを業務に組み込むには下記の機能をフル活用することでより低コストで高速に実現できるようだ。
3.コンペのチュートリアル
今回、データブリックス社からもコンペを円滑に遂行するためのチュートリアルが提供される。
大まかに3つに分かれており、①データブリックスのデータ操作に慣れる、②データブリックスでの機械学習モデル訓練、③データブリックスでのモデル結果をSIGNATEサイトに登録する、で成り立っているようだ。1000人まで利用可能ということで、是非この機会にお使いくださいとのこと。
MILIZE AI開発部 AIエンジニア
小野 宏史 氏
データブリックス上でのモデルの作成方法から提出までの方法を解説し、初心者であっても参加しやすいようなチュートリアルを用意した。
また、一歩先に行くためのコンテンツとして、特徴量生成や次元圧縮(UMAP)の手法を通して、データサイエンスの理解を深めるようなものを目指した。
-5-3.Slack説明
MILIZE 営業企画部 兼 AIコンサルティング部
妹尾 奈々 氏
今回のコンペでは、さまざまの経験値のコンペ参加者の皆さまをサポートし、また参加者同士のコミュニケーション活性化のために、Slackのワークスペースを設置した。
当該Slackのチャンネルは、事務局からの連絡事項、Q&A、参加者同士のコミュケーション用の、大きく3つに区分される。
既にSlackの運用は始まっており、時にはご質問に対し動画解説をさせていただいたり、参加者からコンペやデータ分析に有益な情報も投稿いただいている。
ぜひSlackを各参加者のスキルアップのツールとして積極的に活用いただきたい。
なお、Slackにてコンペの運営円滑化や参加者への盛り上げに貢献いただいた方の中からMLIZE賞(賞金1万円)の選定もある。
-5-4.中間イベント案内
データコンペ委員長 兼 Japan Digital Design
平山 元清 氏
今回の金融データ活用チャレンジには、多くの協会会員金融機関に対して初めてデータ分析にチャレンジするという初心者の参加も促した。それが、金融機関のデータ活用人材の底上げに繋がるという協会の活動理念に繋がるからだ。
しかし、一方で、MUFGのグループ内コンペでの経験などから、そういった初心者に対してきっちりとサポートする必要があることも、コンペを運営するコンペ委員会の中で理解されていた、と言う。
まず、表示された資料には、コンペ参加者が持つであろう不安や直面する壁、それらを共有したいと願う想い、などが書かれていた。
そして、それらを解決すべく企画されている中間交流イベントについて発表された。
「コンペに取り組む仲間とレベルアップ・交流できる会」
より多くの人が参加できるオンライン開催、前半第1部はセミナー形式で金融知識や分析手法について紹介する会、第2部はテーマごとに様々な部屋を用意して双方向で交流する2部構成での開催であることが伝えられた。
最後に、「このコンペが皆様の良いご経験となることを運営一同願っております。」と参加者にエールを送った。
6.閉会挨拶
動画リンクはこちら
SIGNATE 代表取締役CEO
齊藤 秀 氏
最後にSIGNATE代表取締役社長齊藤社長より閉会挨拶をいただいた。
「皆さん、心の準備はできていますか?これから盛りあがっていきましょう。」
まず、世界最大のコンペティションプラットフォームKaggleでの日本人ユーザーの状況について以下の資料を示して語った。
ここ数年で日本のKaggle参加者が増えている。質も高く、プロフェッショナル・エキスパートと呼ばれる参加者がGMとMSとEXを合わせると日本は4位につけている。また、世界で400名ほどしかいないとされているGM(きわめて優秀なデータサイエンティスト)は米国に続く第2位になるため、非常に高いレベルの成績を残している。現時点のTOP100位までのランキングでは日本が最も多いという状況である。
「一般的には日本はデータ活用と技術面で遅れていると評価されることが多いが実際には優れた技術者が存在し、活躍している。自信をもってデータ活用を進めていけばよい。」
SIGNATEのプラットフォームにおいても過去様々な領域でコンペティションを開催している。歴代のSIGNATEのコンペティション参加者数のデータは以下の通り。開会式時点で956名が第1回金融データ活用チャレンジに参加しており、歴代12位の盛り上がりである。(2023年2月18日時点、1,629名)
「開幕前にこれだけの参加者数をいうのはいままでも経験がない。きわめて盛り上がっており、この取り組みが未来に向けて非常にインパクトのある取り組みになる予感を感じている。」
また最後に競うだけではなく、コンペティションに“参加”することの意義について3点語った。
1点目としてはデジタル人材のキャリア形成。コンペティションで腕におぼえがある人は実力を証明する絶好の機会であり、これをきっかけにいろいろなデータ活用・デジタルのキャリアを形成してほしい。
2点目としてデータ活用の実践的な学び。初学者の方やこれからデータサイエンスを学ぶような人においては実際に課題に取り組む過程においてたくさんの気づきが得られる場である。
3点目としては組織を超えた仲間づくり。今回は金融業界横断であるため、普段交流することがない人と同じ目的意識、同じ課題に向き合う中で議論を深めいていくことができる。また金融業界以外のエンジニアなどの知見を持つ人と交流することもでき、また違った角度でいろんな気づきが得られる。
最後に、次のメッセージを参加者に伝え、閉会挨拶を終えた。
「ぜひSlackに参加いただいて活発な議論をいただければと考える。中間イベントなども積極的に参加いただきたい。交流こそが最も価値があると考えている。」