[ ここから本文です ]

  • SHARE
アナリストと自然言語処理レポートは共存できる MUFG FinTechアクセラレータグランプリ ゼノデータ・ラボ 座談会

アナリストと自然言語処理レポートは共存できる MUFG FinTechアクセラレータグランプリ ゼノデータ・ラボ 座談会

邦銀初のスタートアップ・アクセラレータプログラムである、MUFG Fintechアクセラレータ。昨年末から16年1月にかけて参加スタートアップが募集され、最終5社がエントリー。数カ月にわたってメンター陣による指導を受けながらサービスのブラッシュアップに努めた。8月に開催されたDEMO DAYでグランプリに選ばれたのは、ゼノデータ・ラボ(関洋二郎社長)だ。

同社の「ゼノ・フラッシュ」は、XBRLやPDF表・グラフを解析し、XBRL化されていない重要な注記情報も含めて決算関連資料の情報を表に変換、独自のアルゴリズムで重要なポイントを特定する。それだけでなく、自然言語処理で資料中の文章データから、“数値の背景”を抽出することができる。これらの資料収集から解析まで、一銘柄あたり1分以内という早さだ。

同社はグランプリに選ばれると同時に、カブドットコム証券でサービスをリリースすることを発表している。今回はゼノデータ関社長、取締役CTO宮代大輔氏、取締役八木夏樹氏のほか、メンターを務めたカブドットコム証券の伊藤充淳氏(営業推進部課長 兼 システム部課長)、中澤康至氏(システム部開発課長)らに話をうかがった。

もともと金融情報端末向けや経済メディア向けのサービス提供を考えていた

ゼノデータ・ラボ 関氏
ゼノデータ・ラボ 関氏

—メンタリングが始まったのはいつ頃、どういう形でですか?

ゼノデータ・関    2月に創業して直後、最終審査で、カブドットコムさんも含む審査員の方にプレゼンしました。

カブドットコム・伊藤 当社の問題意識として、従来のアナリストレポートが大型株中心であり、新興市場を主戦場とする個人投資家のニーズに十分にこたえられていないということがあります。ゼノデータさんのテクノロジーを使えば、より短時間に、個人投資家が必要とする新興市場を中心としたマーケットのレポートを比較的低コストで出せるのではないかと。社長の齋藤も着想が非常に素晴らしいと評価していました。メンタリングが始まってからは、我々のニーズとゼノデータさんの理想をすり合わせる作業を続けてきまして、当社で取引していただいている個人投資家にも会ってもらいました。

カブドットコム証券・伊藤氏
カブドットコム証券・伊藤氏

‐技術的なお話が多かったのでしょうか。

関    個人投資家のニーズを把握することが中心でした。僕達はもともと個人投資家に向けたサービスを作ろうと創業したわけではなくて、金融情報端末、経済メディアを狙っていたので。僕自身がヘビーな個人投資家でもなかったので、個人投資家さんにお会いする機会をもらって、ユーザーニーズを把握したかった。

—その過程で大きく考え方を変えたのでしょうか? 振り返って大変だったことは?

関    大きく作る物を変えたということはないです。ただ機関投資家でなく個人投資家向けにしたので、より分かりやすくするといったことは心がけました。大変だったのは、創業してまだ売り上げもなかったので資金繰りですね。別の仕事もして売り上げをつくっていたので、アクセラレータに入ってからもその仕事がしばらくあったので、その1〜2カ月は精神的にも体力的にもかなりしんどかったです。
八木    当時は明らかに顔色が悪かったですからね(苦笑)。

「うちでもできる」という会社もあったが……

—グランプリの反響はやはり大きかったのでしょうね。

中澤    グランプリ受賞後にちょっと興味深かったのが、お付き合いある複数のベンダーから「ちょうど同じことを考えていた」「自分たちもできそうだ」と言われましたね。

—ただ言うだけなら誰でも言えますね。

中澤 まあパイオニアってそういうものだし、「似たようなサービスありましたよ」というところもありましたが、要は業界ニーズにマッチしているものにちゃんと精錬できるかです。フィンテックと言う以上は、金融にどれだけ技術が貢献できるかというところが大事。最終的には個人投資家のニーズなので、そこにマッチできることがポイントですよね。

    あくまで僕の意見ですが、「(そうは言っても他社には)まあできないだろうな」と。大手ベンダーに聞いても、できてない実態を聞いていますし、僕の知らないベンダーができているのかもしれませんが。

自分たちに「できる」と言えるのは、わずかな差なんです。僕達のアルゴリズムが読んでるのは、結果にいたる背景を説明した文章なのですが、それがあるかないかで大きく違う。たとえば「増益しました」とときの「なぜ増益したのか」。買収をして連結子会社が増えたものなのか、販売数量はそのままで為替の影響を受けたものなのかなど、そういう記述が我々だとできる。一方で多くの自動生成レポートには「なぜ」がない。

一見すると既存の自動生成レポートにも「今期増収」「26%増益」とかいう文章があるので我々のレポートとの違いが分からないんですが、「なぜ?」の一言が無い。このわずかな差が決定的に重要であること、そしてその自動生成の難易度が非常に高く自分達以外にそうできないことを知っていたことが、周りに反対されても起業できた理由なんです。

—しかし、日本語はあいまいで、主語がなかったり、まったく逆の意味ととらえることができたりすると思いますが、そのあたりは可能なのでしょうか?

八木    まず「日本語は難しい」というのが前提であることは間違いないのですが、決算関連の文書は独特で、それほど幅もない。要するに会話と比べればパターンが決まっていて、割と狭い。医療系、法律系でもそうだと思うんですが、同じ業界であれば同じ単語が別の意味で使われることはない。良い例ではないですが、「バンク」という言葉を経済関連の文書で「土手」ととらえるケースはまずないんです。単語だけでなく言い回しにしても、会話と比べれば狭い領域なので、やりきれる範囲だなと。100%は無理でも90%なら割とすぐいけると。最後の10%がすごく大変なのですが。

—コンピュータの処理って、時々「何でこうなっちゃったの」みたいな、全然違うことを出すことがあると思います。

八木    我々は機械学習による因果関係抽出はほとんど使ってなくて、全部ロジックを切って、パターンを想定して対応しているんです。たとえば新しい、ものすごい突飛な表現をしたときとかなどは把握できないことはあるかもしれませんが、間違って抽出する確率はかなり低い。そもそも機械学習は間違うことも良しとして、やっていると思うんですよね。機械学習って大体85%が限界と言われるぐらいですから。

中澤    高名なアナリストが時間を掛けて書いたレポートと、ゼノデータさんのレポートが勝負する訳ではないんですよ。人間のチカラでやったら1日に100企業の分析はできないし、できても粗い。そんな粗いものを作るのに人件費を払うより、ゼノデータさんならはるかにクオリティ高いものが出せる。そこが強み。だからそういう意味で共生できると思う。

DEMO DAY直前はプレゼンを習ってトレーニングした

座談会の様子

—DEMO DAYの直前の準備はどういうものだったのでしょうか。

関    サンプルデータを実際に自動生成して準備するのと、自分はプレゼンの練習で、いっぱいいっぱいでした。本当に。最後の2週間は毎日プレゼンの学校に通って発声練習をして。2人の前で毎日僕がプレゼンをしてビデオ撮って、ダメ出しをされて。夜は自分の声を聞きながら寝る。それを2週間ずっとやりながら、バグ探しもしていました。

—お二人から見て、最初の頃、関さんのプレゼンのどこがダメでしたか。

八木    まず原稿を憶えてなかったよね、最初。

    最初ガチガチだったんですよ、プレゼンの学校へ行こうと思ったのも声が小さいので、そこを変えようと思って。声のボリューム以外にもいっぱい教わりました。語尾を上げる、「ア行を言うときは歯を見せる」。間の使い方も言われました。先生に「ここはこれぐらい間を入れたほうがいいですか」聞いたりもしました。ここで指を立てて「ひとつ目」というアクションをするとか、ステージで動くタイミングから、動画を見せるときは端に寄るけど、このときは中央に行ってスクリーンを指差して、最後の決めのところはスクリーン見ずに、審査員や会場を見て「目で押す」みたいな……。

—相当な練習をされたんですね。当日の出来は何点ですか?

    95点ぐらいですね。

一同 おぉ(笑)。

 もう直前ぐらいの練習をただ、ほぼそのままできたので。すごく良く言ってくださる方が多かったみたいで逆に意外でした。僕の中では5社の中ではプレゼンが平均点ぐらいいけば、サービスはモノが良いからいけるという感じでやっていた。

伊藤    本当に意気込みがすごく伝わってくるプレゼンでした。放映された動画などのクリエイティブもすごかったし、我々は事前には紙でしか見てなかったですが、とても分かりやすい、計算されたプレゼンでしたね。

———グランプリって聞いたとき、お二人はどうでした?

宮代 いやもう嬉しかったです。7月の開発合宿ごろから直前まで、発表する内容に嘘をつけないから、実際にレポートが出せて、こういう事ができますという宣言したいことに、間に合わせるために頑張ってきましたから。ラストスパートが実を結んだ。

八木    単純に素直に嬉しかったですね。最後は多分1日20時間くらいやってたと思いますし。1日2時間ぐらいしか寝てなかった。川崎に住んでてオフィスが六本木なんで、往復2時間はあるのと食事など以外はずっと仕事してましたから。

決算短信や統計データなんて見なくて済むような世界を

—今後の予定は?

中澤    遅くとも年内には何かしらの形で、個人投資家の目に触れるサービスとして提供を開始したいとは考えております。

関    「カブコムさんと」でいうと、今は決算分析を素早く出していますが、それをもっと深くしたい。たとえば予想値を出して、イベントドリブンで分析して、「こういうトレンドだから、こうなる」といった深い分析をやりたい。また、投資家ニーズの「どの企業がいいのか」というスクリーニングも課題なので、そちらにもサービスを提供したい。

もっと大きな画でいうと、世の中の人たちが決算短信を見たり記事検索をしたり、統計データを探したり、そういうのを全部取っ払いたい。たとえば、何かデバイスに「これどうなってるの」みたいな話をすると、結果が全部返ってくる世界観。そういうUIを作るのか、UIを持っているところにデータを渡すのかも分かりませんが、イメージとしては、今までのプロセスを飛ばして分析された情報というのを見ることができて、あとはもう意思決定するだけっていう状況をめざしていきたいなと思います。
 

>> スタートアップアクセラレータ“MUFGデジタルアクセラレータ”第3期説明会の参加登録はこちら