MUFGデータサイエンスコンペとは
ビジネス課題に対するPythonの機械学習モデルの精度を競う
データサイエンスコンペでは、前半は株式会社AVILENが提供するe-ラーニングプログラムを各々受講し、課題に取り組むための基礎知識を身に付けた。初級はデータ分析の基礎、中上級はデータ活用のスキル・高度な機械学習・Pythonのモデル実装スキルに関して学んだ。その後、与えられたビジネス課題に対して、機械学習(AI)やデータサイエンスの精度がコンペとして競われた。
参加者は常に更新されるスコアのランキングを注視しつつ、ライバルの存在を意識しながら切磋琢磨することで、前回以上の盛り上がりを見せる結果となった。
初級1位:片桐 康太 三菱UFJ銀行 ソリューションプロダクツ部
「データサイエンスを活かす可能性をM&Aの分野で模索していく」
—参加した理由を教えてください
私は普段、M&Aファイナンスグループという部署でLBOチームのヘッドをしています。ファンドが企業を買収する際に資金をご融資する、という業務です。そのため、普段の業務とデータサイエンス・プログラミングは直接的な関係はないのですが、金融の周辺分野の理解をすることは重要だと考えて参加しました。
—コンペを通じて工夫して取り組んだことを教えてください
今回のコンペは初心者でも参加できるようにe-ラーニング教材が用意されていたので、取りかかりやすい印象でした。私も全くの初心者でしたが、通常業務をこなしながらも時間を見つけて教材を着々とこなしていきました。また、教材だけではなく自分でWEB上の情報を収集し、初心者ながらもトライ&エラーを繰り返したことが今回の結果に繋がったと思っています。
—コンペを通じて苦労したこと・難しかったことを教えてください
課題の中で「精度が上がるポイント」が散りばめられていて、それを見つけるのにやや苦労しました。Pythonの特徴として、ライブラリが非常に充実しているので、ある一定レベルまでは中身が理解し切れていなくてもできてしまいます。一方、そこからさらに精度を上げるためには、しっかりと中身を理解する努力が必要でした。
(三菱UFJ銀行 ソリューションプロダクツ部 片桐 康太)
—コンペを通じて得られた成果を教えてください
テクニカルな面で言うと、プログラミングの基本的な技術を身に付けられたと思います。また、技術的なこと以外に、与えられた要素の数値の意味的な解釈・ビジネス的な解釈が結果に大きな影響を及ぼす、ということを経験できたことも大きな成果でした。
—上記の成果を今後どのように活かしていきたいですか
より高度な技術を身につけることは独学で続けていきたいと思います。ビジネス的な意味で言うと、データサイエンスをM&Aの分野でどう活かすかを考えていきたいです。データサイエンスには向き・不向きがあり、個別性の強いM&Aのプロセス全体で活かすというよりも部分的に活かす、という方が正しいと思います。そのため、向き・不向きを判断できるような感覚を養いつつ、ビジネスの拡大の余地があるフィールドを探索していきたいです。
中上級1位:澤木 太郎 Japan Digital Design M-AIS
中上級2位:山内 俊志 三菱UFJインフォメーションテクノロジー デジタルプロデュース部
「グループ内の誰もがデータ分析・活用できる状態を目指す」
—参加した理由を教えてください
澤木:普段はJapan Digital Design のM-AIS(※)でAI開発のマネジメントをしています。その立場上、MUFGグループのデータサイエンティストコミュニティを形成するというミッションを持っており、MUFG内にどのようなデータサイエンティストが在籍しているのかを知りたくて参加しました。また、マネジメント業務をすることになってからは、コーディングなど実際に手を動かす機会がめっきり減ってしまっていました。そこで現場勘を失わないようにしたい、という目的もありました。
※M-AIS(MUFG AI Studio)…Japan Digital Design内に2018年4月設立し、AI技術の研究開発から実用化までを手がける組織
山内:私は三菱UFJインフォメーションテクノロジーのデジタルプロデュース部の中で、AI・システム開発を担当する部門のラインマネージャーをしています。また、三菱UFJ銀行のシステム企画部も兼務していて、MUFG AIラボ(※)の一員としてデータ分析をしています。その中で、データ分析に関わる人を増やしていきたいと考えていて、一緒に参加してコンペを盛り上げることができれば、と思って参加しました。また、実際に一緒に働いている方々が参加されるということもあり、純粋に交流を楽しみたい、という想いもありました。
※MUFG AIラボ…MUFGのAI技術活用を統括・推進するMUFGデジタルサービス企画部とシステム企画部の協同プロジェクトチーム
澤木:実際に山内さんとはオンライン上でお話ししたことはあったのですが、今回のコンペで実際にお顔を知ることができました。
山内:そうですね。そういう意味で、繋がりができるのもコンペのいいところかな、と思います。
—普段の業務とコンペの課題の違いはありましたか
澤木:結構違うな、という印象です。モデルの精度を上げるにあたって、最初はどんどん精度が良くなっていって、数値が良くなるにつれて改善が頭打ちになっていく、というのが基本です。実務の場合、モデルの精度を90.0%から90.1%に上げるといった、非常に労力を使う作業というよりも、まずは90.0%で実装してみて、その上で出てくる様々な課題を把握する、ということが優先されます。コンペだと、その比重が逆になります。最初の精度を上げるのは皆ができるのであまり差がつかなくて、最後の0.1%の改善をどうするか、というところに時間をかけて頑張る必要があります。
山内:あとは、範囲の違いも大きなポイントだと思います。コンペは与えられるデータ、指標、解く問題が全て指定されていて、その中でひたすら精度を上げることに集中します。実務の場合、そもそも解く問題は何か、それを解くのに必要なデータは何か、それらの情報を集めることから始まります。また、予測したら終わりではなく、それをどのように業務に使うのかを含めて設計する必要があるので、実務の方がより幅が広いと思います。
(Japan Digital Design M-AIS 澤木 太郎)
—コンペ特有の難しさを教えてください
山内:普段の業務の場合、その分野について知識を持っている状態で作業にあたれますが、コンペの場合は全く知識のない分野に対して立ち向かわなければならない、という難しさがありました。
澤木:そうですね。今回のテーマは取り組みやすい内容だったのでそこまで問題はなかったのですが、分野によっては全く知識がないのでその点は苦労しました。
—コンペ参加中にモチベーションになったことを教えてください
山内:普段の業務もある中で、早朝や深夜、土日を使って取り組まなければならなかったので、その点はかなり大変でした。ただ、参加者の中には知っている方も多く、その方々がランキングで上位に表示されていると、「自分も頑張らないと」という気持ちが湧いてきました。
澤木:確かに上位は知っている名前が並んでいましたよね。
山内:他には、コンペであればコンペと割り切って色々と試したり実験したりできる点もモチベーションになりました。実務だとなかなか「試す」ということは難しいのですが、コンペでは普段やらない方法を試して、その中で実務でも使えることが見つかればラッキー、という気持ちでした。
(三菱UFJインフォメーションテクノロジー デジタルプロデュース部 山内 俊志)
—コンペ中に感じた難しさに対して工夫したことを教えてください
澤木:中上級のコンペは難しい設計だったと感じていて、具体的には宿泊施設の物件の価格を予想する、というものでした。少ないデータを用いてなるべく正確な予測をするモデルを作る、というのが難しかったです。
山内:私も同じところで苦労しました。学習に使うデータとテストで使うデータがかなり違ったので、単純に学習してもうまくいかず、その差をどう埋めるかを工夫しました。その際、データをじっくりと眺める時間をとる、というのが役立ったと思います。
—MUFGのデータドリブン経営にどのように貢献していきたいですか
山内:MUFGの強みとして、データを大量に保有している、という点が挙げられます。ただ、データ自体は持っているだけでは意味はなく、それをどう活用していくかが鍵だと思います。データサイエンティストはその中でも中心になる存在で、私たちのデータ活用の仕方がそのまま今後のMUFGの力になっていくと思うので、より個々のスキルを高めていくことが大切だと考えています。
また、コンペの意義として裾野が広がる、ということが挙げられます。一人がデータ分析をできてもあまり意味はなくて、みんなが当たり前にデータを分析して活用するようになって初めてデータドリブン経営と呼べるのかなとも思います。コンペはそのきっかけになる良い機会なので、これから興味を持ってくれる方が増えたら嬉しいです。
澤木:同意見です。私たちだけがデータ活用をしても意味はなく、経営陣を含め普段データ分析やデータサイエンスに関わっていない人たちもデータを見て活かしていく、という意識を持つことが大切です。コンペを通じて、色々な人にデータ分析やAIの楽しさを知ってもらえたら、と思います。