「金融でAI活用進む 日銀の政策や株価予測」 -日経電子版、8月26日
「みずほ証券、AIで株売買 機関投資家向け」 -日経電子版、10月18日
野村証券、みずほ証券ともに、AIによる株価予測技術の開発に邁進しているようです。これもフィンテックの一分野ということなのでしょう。具体的に両証券会社がどのような手法をベースとしているのか、あくまでもWEB記事がベースとなりますが、考察としてまとめてみます。
1.WEB記事の要約
過去の記事も踏まえて分かりやすく対比して要約すると以下のようになります。ざっと見た感じでは、両社ともAI手法、予測対象は殆ど同じであると言えます。
(1)野村証券
・2016年4月から一部の機関投資家向けに試験的なサービス提供を開始。
・AI手法はディープラーニング。
・対象銘柄はTOPIX500、5分後の株価を予測。
・使用するデータは株価の過去の乖離率など
・的中率は100%ではないが(当然ですが笑)、多くの銘柄で大量の注文を執行する際に有効。
・AIベンチャーであるHEROZと共同開発。
(2)みずほ証券
・2016年11月末にも機関投資家向けにサービス提供を開始。
・AI手法はディープラーニング。
・対象銘柄はTOPIX500(順次拡大)、30分~1時間後の株価の上昇/下落幅を予測。
・使用するデータは個別銘柄ごとの注文状況や売買ボリューム、過去の値動きなどのデータ
・的中率は8割以上に達しているという(これについては後述します)。
・注文金額の0.01%程度の運用成績改善が見込める。システムの利用料は徴収しない。
・AIは自社開発。
2.具体的な手法
過去にみずほ証券がディープラーニングの株価予測への応用について発表した資料があります。それを元に不明な部分は予測を交えながら具体的な手法を考察してみます。
(1)対象銘柄
TOPIX CORE30(発表時点であり、その後対象をTOPIX500へ拡張したものと思われます)
(2)AI手法
DBN(Deep Belief Network)を採用。DBNはディープラーニングの初期モデルであり、各層間のモデルをAE(Auto Encoder)でなくRBM(Restricted Boltzmann Machine)で構成します。これについての詳細な説明は省きます。
(3)入力変数
7800(個別株データ3900+日経先物データ3900)を1データセットとします。3900の内訳は、チャート情報が500、板情報が3200、Tick情報が200となります。
(4)出力変数
上記の1データセットに対応する解答ラベルが1つ。これについては後述します。
(5)モデル数
予測開始時点毎に異なるDBNモデルを作成するようです(9:00時点の予測はDBN1、10:00時点の予測はDBN2、・・・など)。
(6)サンプル数
上記のデータセットが30銘柄×数年分と考えられます。学習期間を20年とすると30×240営業日×20=144000サンプル/モデルとなります。
(7)層数
入力層(7800)→中間層1(4000)→中間層2(3500)→中間層3(3000)→中間層4(2500)→中間層5(2000)→中間層6(1500)→出力層(1)
入力層~中間層6がそれぞれRBMであり、500変数ずつ次元削減されています。中間層6~出力層が識別部と考えられます。
入力変数の数に対してサンプル数が少なめですが、特徴抽出では経験上それなりの精度が出ます。また、最終段の中間層6(1500)→出力層(1)は、ドロップアウトなどのフィッティング抑止策をかなりキツめに取る必要があると思います。
3.考察
上記のディープラーニングモデルの出力変数(解答ラベル)ですが、実は資料には明記されていません。WEB記事の内容からは、「みずほのAIは1時間後の株価の上昇を的中率8割で予想できる」などと読み取れてしまいますが、実際にはそんなことはありえません。もしもそうであった場合、運用成績の改善が0.01%に留まるわけがありません。
おそらく、みずほ証券の予測システムの解答ラベルは、「1時間後の騰落が±0.5%に収まるかどうか」、即ちボラティリティの予測であった筈です。これであれば的中率8割というのは納得できます。株価のボラティリティは基本的にLAG1相関が存在し、比較的容易に予測できるからです。この予測内容であれば、直後にボラティリティの高まる銘柄に対してアラートを出すことができ、それに従ってリスク調整すればポートフォリオの安定性を向上でき、運用成績の改善に繋がります。
当然ながら価格の動く方向も予測しようとした筈ですが、それほど有意な結果は得られていないと思います。論文紹介(4)で触れたように、そもそもディープラーニングで根本的な予測力が向上することはありえないからです。
最後にAIの権威であるベン・ゲーツェル氏(香港のファンドAidyiaチーフサイエンティスト)の言葉です。
-ディープラーニングは写真や言葉など特定のパターンをもつデータを分析するのには適しているが、このような種類のパターンが金融市場でも見られるとは限らない。もしパターンが見られたとしても、それが必ずしも役に立つわけではない。なぜなら、誰でもそのパターンを見つけ出すことができるからだ。
「人工知能が人間に買いを指示するAI金融時代の到来」 2016年2月25日、WIREDより抜粋
私も当然ながらこの意見に賛成です。意味もなく感覚で賛成と言っているわけではなく、きちんとした理由があります。その理由についてはそのうち記事にしたいと思います(この話、それほど興味がある人がいるとは思えないので他のネタが切れた頃だと思います)。