MUFGデータサイエンスコンペとは
Pythonで予測モデルをつくり、精度を競う
データサイエンスコンペは、与えられたビジネス課題に対してモデルの精度(正解率など)を競うものであり、同一グループの10社以上が集まって開催されるのは、金融業界初の試みだった。具体的なテーマは、米国中小企業の貸倒リスク予測で、米国中小企業庁(SBA)のデータをもとにPythonを使って機械学習モデルを作成し、未知のデータを予測してその精度を競った。コンペ期間中、専用サイトに予測結果をアップロードすると、その精度が直ちにスコアとして表示され、ランキングに反映される。参加者は、作成した機械学習モデルをブラッシュアップしながら提出を繰り返し、より高スコアをめざした。なお、コンペ開始前にはPythonを用いた機械学習モデル開発について基礎的な理論を解説したe-ラーニングが提供され、Slackを使った講師とのQ&Aや中間段階でのセミナーもセットされた。
1位:磯川 弘基 三菱UFJ銀行 市場エンジニアリング室
「コンペで得たモデル作成の知識やノウハウを業務でも活かしたい」
ベストスコア0.98702(提出19回)
(三菱UFJ銀行 市場エンジニアリング室 磯川 弘基)
—参加した理由を教えてください
当時、入社1年目ということで自分のスキルを高めて業務の幅を広げたいと思い挑戦しました。また、大学・大学院や業務でデータを扱うということにはなじみがあったものの、今までコンペには参加したことがなく、個人で一般のコンペに参加するのはハードルが高いと思っていました。そんな中、今回社内コンペを開催するということで、これまで学んできたことを実践的な形で力試しをする良い機会だと思い、参加を決めました。
—コンペ期間中に感じたことを教えてください
コーディングやデータを扱うことに関しては学生時代や業務でもやっていることもあり、今までの経験によるアドバンテージは少しあったとは思います。ただ、機械学習モデルの作成においては、データを見るだけでは見つけきれない部分もたくさんあり、そこは直感や試行錯誤を繰り返し、数で勝負することも重要だと感じました。時間をかけて処理をしてもあまり効果がないこともあり、そこは承知の上ですが残念な気持ちになることもありました。試行錯誤を続ける中で、ある程度モデルに関する知識も必要だと思い、勉強もしましたし、コンペを通じて課題を解くことでデータ分析における知識はさらに高まったと思います。
—本コンペで得られた成果を教えてください
まず知識の面で今回とても勉強になりました。関連する書籍をしっかり読むことに加え、いろいろなドキュメントも見たので、勉強という観点では、大いに知識は得られたと思います。あとは、実際の業務とコンペでは似ているところと違うところがある中で、似ているところだけでなく、違うところというのも意識できた、体感できたというのが、今後業務をしていく上で良かったです。また、コンペの課題のレベル自体も高かったので、その点でも今回のコンペ参加は良い経験になったと思います。
—今後、本コンペでの経験をどう活かしていきますか
現在、データと比較的近い部署に所属していますので、モデル作成の知識やノウハウは多分に活かしていきたいです。また、知識面以外でも筋道立てて試行錯誤する経験や、気になったことを資料にあたりながら解決していくという経験は、今後も活かせると思っています。また、2ヵ月間のコンペを自力でやり通せたということに関しても、自信を持つことにつながりました。
2位:竹本 遼太 三菱UFJ信託銀行 不動産コンサルティング部
「期待していた社内ネットワークづくりに大きな成果があった」
ベストスコア0.98696(提出97回)
(三菱UFJ信託銀行 不動産コンサルティング部 竹本 遼太)
—参加した理由を教えてください
私は主に日本の不動産市場の分析をしていますが、不動産の領域はデジタル化への取り組みが遅れています。ITやデジタルのことでわからないことがあったときに、相談できる人が身近にいません。コンペ参加を契機に私自身のデータ分析のスキルを高めるとともに、グループ内でデジタル人材のネットワークをつくりたいと考えていました。
—コンペ期間中に感じたことを教えてください
学生時代は金融工学を学び、前職ではクオンツの業務もしていたので、プログラムを組むという経験はありました。Pythonも6、7年前から使っていますが独学でしたから、今回、事前のe-ラーニングで改めて機械学習における回帰や分類について学んだり、これまで使ったことがなかったPythonのライブラリも知ることができたりと非常に勉強になりました。
コンペ期間中は、一度提出すれば10秒後くらいにはスコアと暫定の順位が出ます。しかし、コンペですから、それ以上のフィードバックはありません。どこがまずいのか、ほかの人とどう違うのか、暗中模索の状態の中で走り続けるのは難しかった面もありますが、暫定ながら1位になったこともあり、最終1位を目標にモデルの改良と提出を続けました。
—本コンペで得られた成果を教えてください
コンペ期間中に開催された参加者向けセミナーで、融資の貸倒リスクとは関係ないと思い込んでいた要素が、実は大きく影響するということを知りました。実際にその要素を組み込むとスコアが上がりました。人間の先入観がいかに危うく、また、データがいかに見えないものを見せてくれるか、大きな発見であり学びでした。またコンペ参加時に期待していた、社内のデジタル人材とのネットワークも確実に広がりました。どの部署にどういう人がいるということがわかり、コンペ終了後も困っていることを質問させていただいたりしています。
—今後、本コンペでの経験をどう活かしていきますか
最近はノーコード、ローコードの流れが加速し、プログラムの知識がなくてもアプリケーションを迅速に開発することができるツールが増えていることを知り、DXやデータ分析に関する敷居がはるかに低くなっていると感じました。しかしその一方で、少し前に覚えた知識やノウハウがすぐに陳腐化してしまう状況があることも事実です。今まで以上に最新の動向を把握して、日々スキルのアップデートをしていかなくてはいけない、そういう時代なんだなと実感しました。