ＡＩ投資（４） - これからの「お金」の話をしよう

f:id:uki-profit:20170814143641j:plain

「金融でＡＩ活用進む　日銀の政策や株価予測」　－日経電子版、8月26日

「みずほ証券、ＡＩで株売買　機関投資家向け」　－日経電子版、10月18日

野村証券、みずほ証券ともに、ＡＩによる株価予測技術の開発に邁進しているようです。これもフィンテックの一分野ということなのでしょう。具体的に両証券会社がどのような手法をベースとしているのか、あくまでもＷＥＢ記事がベースとなりますが、考察としてまとめてみます。

１．ＷＥＢ記事の要約

過去の記事も踏まえて分かりやすく対比して要約すると以下のようになります。ざっと見た感じでは、両社ともＡＩ手法、予測対象は殆ど同じであると言えます。

(1)野村証券

・2016年4月から一部の機関投資家向けに試験的なサービス提供を開始。

・ＡＩ手法はディープラーニング。

・対象銘柄はTOPIX500、5分後の株価を予測。

・使用するデータは株価の過去の乖離率など

・的中率は100％ではないが(当然ですが笑)、多くの銘柄で大量の注文を執行する際に有効。

・ＡＩベンチャーであるＨＥＲＯＺと共同開発。

(2)みずほ証券

・2016年11月末にも機関投資家向けにサービス提供を開始。

・ＡＩ手法はディープラーニング。

・対象銘柄はTOPIX500（順次拡大）、30分～1時間後の株価の上昇／下落幅を予測。

・使用するデータは個別銘柄ごとの注文状況や売買ボリューム、過去の値動きなどのデータ

・的中率は8割以上に達しているという（これについては後述します）。

・注文金額の0.01％程度の運用成績改善が見込める。システムの利用料は徴収しない。

・ＡＩは自社開発。

２．具体的な手法

過去にみずほ証券がディープラーニングの株価予測への応用について発表した資料があります。それを元に不明な部分は予測を交えながら具体的な手法を考察してみます。

(1)対象銘柄

TOPIX CORE30（発表時点であり、その後対象をTOPIX500へ拡張したものと思われます）

(2)ＡＩ手法

ＤＢＮ(Deep Belief Network)を採用。ＤＢＮはディープラーニングの初期モデルであり、各層間のモデルをＡＥ(Auto Encoder)でなくＲＢＭ(Restricted Boltzmann Machine)で構成します。これについての詳細な説明は省きます。

(3)入力変数

7800（個別株データ3900＋日経先物データ3900）を１データセットとします。3900の内訳は、チャート情報が500、板情報が3200、Tick情報が200となります。

(4)出力変数

上記の１データセットに対応する解答ラベルが１つ。これについては後述します。

(5)モデル数

予測開始時点毎に異なるＤＢＮモデルを作成するようです（9:00時点の予測はＤＢＮ１、10:00時点の予測はＤＢＮ２、・・・など）。

(6)サンプル数

上記のデータセットが30銘柄×数年分と考えられます。学習期間を20年とすると30×240営業日×20＝144000サンプル／モデルとなります。

(7)層数

入力層(7800)→中間層１(4000)→中間層２(3500)→中間層３(3000)→中間層４(2500)→中間層５(2000)→中間層６(1500)→出力層(1)

入力層～中間層６がそれぞれＲＢＭであり、500変数ずつ次元削減されています。中間層６～出力層が識別部と考えられます。

入力変数の数に対してサンプル数が少なめですが、特徴抽出では経験上それなりの精度が出ます。また、最終段の中間層６(1500)→出力層(1)は、ドロップアウトなどのフィッティング抑止策をかなりキツめに取る必要があると思います。

３．考察

上記のディープラーニングモデルの出力変数（解答ラベル）ですが、実は資料には明記されていません。ＷＥＢ記事の内容からは、「みずほのＡＩは１時間後の株価の上昇を的中率８割で予想できる」などと読み取れてしまいますが、実際にはそんなことはありえません。もしもそうであった場合、運用成績の改善が0.01％に留まるわけがありません。

おそらく、みずほ証券の予測システムの解答ラベルは、「１時間後の騰落が±0.5％に収まるかどうか」、即ちボラティリティの予測であった筈です。これであれば的中率８割というのは納得できます。株価のボラティリティは基本的にＬＡＧ１相関が存在し、比較的容易に予測できるからです。この予測内容であれば、直後にボラティリティの高まる銘柄に対してアラートを出すことができ、それに従ってリスク調整すればポートフォリオの安定性を向上でき、運用成績の改善に繋がります。

当然ながら価格の動く方向も予測しようとした筈ですが、それほど有意な結果は得られていないと思います。論文紹介（４）で触れたように、そもそもディープラーニングで根本的な予測力が向上することはありえないからです。

最後にＡＩの権威であるベン・ゲーツェル氏（香港のファンドAidyiaチーフサイエンティスト）の言葉です。

－ディープラーニングは写真や言葉など特定のパターンをもつデータを分析するのには適しているが、このような種類のパターンが金融市場でも見られるとは限らない。もしパターンが見られたとしても、それが必ずしも役に立つわけではない。なぜなら、誰でもそのパターンを見つけ出すことができるからだ。

「人工知能が人間に買いを指示するＡＩ金融時代の到来」　2016年2月25日、WIREDより抜粋

私も当然ながらこの意見に賛成です。意味もなく感覚で賛成と言っているわけではなく、きちんとした理由があります。その理由についてはそのうち記事にしたいと思います（この話、それほど興味がある人がいるとは思えないので他のネタが切れた頃だと思います）。