シストレのススメ第4章「期待成長率の阻害要因」に進む前に、いったん追加コラムとして「投資指標の探索要領」を設けます。
ここで説明する内容は、本来はシストレのススメ第7章「アルファの根拠」、第8章「アクティブ運用と投資指標」で触れる内容が主となります。
また、投資指標を探索する上で重要なポイントは公開中のコラムの複数の箇所に点在しており、この追加コラムで取りまとめを行います。
1.投資指標とは
投資指標とは、ストラテジーの売買判断基準となる指標です。
よくある移動平均乖離率の逆張りストラテジー「15日MA乖離率がマイナス10%でロング」を例に取ると、投資指標は15日MA乖離率、意思決定する閾値がマイナス10%ということになります。
最近流行りのVIX指数も投資指標となります。
ストラテジーに採用する投資指標の候補は無限に存在しますが、その中からほんの1〜3個程度に絞らなければなりません。
ストラテジーに採用する投資指標は、その数が多くなればなるほどカーブフィッティングの可能性が高くなります。
投資指標の数(というかパラメータの数)とカーブフィッティングの関係は理論的な研究も進んでおり、最も有名なものがAIC(赤池情報量基準)です。
AICでは自由パラメータの数の増加に伴って情報量が劣化することが示されています。
例えば移動平均乖離率であれば、売買を判断するために移動平均の計算期間と意志決定の閾値の2つのパラメータを持っています。
投資指標の数が増えるにつれてパラメータの数は2倍~4倍程度の勢いで増えてしまいます。
では数多の投資指標の中でどのようにストラテジーに採用する投資指標を探し出し、どのように取捨選択すれば良いのでしょうか。
2.投資指標とリターンの関係
数ある投資指標の中で採用する投資指標を選ぶためには、どのような投資指標が優れているか判断する尺度が必要となります。
この尺度が情報係数(IC : Infomation Coefficient)です。
(1)投資指標とリターンの関係式
アクティブ運用理論に基づくと、投資指標とリターンrの関係は以下で表すことができます。
(a)情報係数IC
情報係数とは、リターンと投資指標の相関係数です。
これは採用している投資指標がどれだけリターンに結びつくかを示し、投資家のスキルと見なされます。
(b)リターンの標準偏差σr
リターンの標準偏差です。
この項はリターンはリスクに比例するというハイリスクハイリターンの法則を示します。
(c)投資指標のスコアZ
投資指標の逸脱状況を示します。
投資指標のraw値について、タイムシリーズで正規化したものになります。
その指標の現在値がその指標の取り得る正規分布の中心からどれだけ乖離しているかを示し、すなわち収益の機会性となります。
この式の詳細な導出方法について興味のある方は、以下のアクティブ運用理論の本をご参照下さい。
アクティブ運用の本家本元バークレイズの名著です。
(絶版であり本日時点でAmazonには9点しか出品がありませんが・・・)
(2)投資指標とリターンの関係を図示する
上記の関係式を視覚的に分かりやすく捉えるためには散布図を書くことが重要です。
良い投資指標はリターンとの相関を持ち、散布図を書けばその関係を簡単に可視化することができます。
縦軸はリターンであり、その広がりはボラティリティσrを示します。
横軸は投資指標であり、投資指標が逸脱する状況では期待リターンが大きくなります。
さらに近似直線を引くことでリターンと投資指標の関係式と情報係数(ここでは情報係数の二乗である決定係数R2)が分かります。
信頼性区間を求めると、情報係数の確からしさも分かります。
この指標に基づき、スコアZが高い場合はロングを建て、スコアZが低い場合はショートを建てることになります。
指標を見つけたら、とにかくまず散布図をプロットすることが重要です。
(3)情報係数と資産曲線の関係を把握する
では情報係数がどれくらいあれば、ストラテジーとしての収益が見込めるのでしょうか。
当然ですが情報係数は相関係数であるため、-1~+1の間の値を取ります。
非常に重要な点ですが、情報係数はその絶対値が0.05以上あれば「優秀」、0.1以上あれば「非常に優秀」な投資指標と言われています。
以下は、各情報係数を持つ投資指標について Z>1のときにロング、Z<-1のときにショートした場合の資産曲線を示します。
情報係数が0.05でも十分使える資産曲線になっていると思います。
ただし、情報係数が低い場合には指標の確からしさも小さくなる(P値が大きくなる)ため、間違った指標を採用してしまう危険性(タイプⅠエラー)が発生しやすくなるので注意が必要です。
(4)投資指標の正しい使い方と誤った使い方
投資指標の使い方ですが、全くリターンとの相関が無い(つまりICの低い)指標について、たまたまリターンの平均値が高い区間を見つけて、そこをピンポイントに切り出してくるような指標の使い方をする人がいます。
以下のグラフは投資指標とリターンの散布図に対して、投資指標の区間毎にリターンの期待値(平均値)を図示しています。
有効な指標では投資指標とリターンは一定の相関を持つため、投資指標が乖離すればするほどリターンの期待値(平均値)も大きくなります。
これに対して無効な指標では、投資指標の区間毎のリターンの期待値はランダムとなります。
無効な指標でも、偶然期待値(平均値)が大きくなる場合があり、それを見つけてトレード条件に組み込むことがあります。
これは完全にカーブフィッティングです。
このような投資指標の使い方をすると、フォワード運用において全く予想から外れたリターンが得られてしまいます。
3.投資指標の探索
ここまでの話からすると、単純に手持ちの指標全てに対して情報系数を計算すればよいと考えるかもしれません。
しかし、実際には様々な罠が存在するため注意が必要です。
(1)情報係数だけで判断するのではなく累積リターンを確認する
情報系数だけで判断すると、時系列で特定の期間だけ説明力が高く、他の殆どの期間では全く説明力のない投資指標を掴まされる可能性があります。
これを避けるため、必ず時系列での累積リターンを確認します。
また、分位別ポートフォリオリターンを確認することも、素性の良い投資指標を発見する上で有効です。
分位別とは、投資指標の大きさで5~10個程度のグループを作り、そのグループのリターンを観察します。
素性の良い投資指標では、分位別ごとにリターンが階段状になるはずです。
(2)投資指標とリターンの分布形状に注意を払う
投資指標やリターンの分布が正規分布ではない場合、思わぬ間違いを招く可能性があります。
これにはヒストグラムを確認することが有効です。
詳細は下記のブログコラムをご参照下さい。
(3)必ず演繹的な観点から考察する
数多くの投資指標を探索すると、全く無意味な指標を誤って有意であるとみなしてしまう場合があります。
これをデータ・スヌーピング・バイアスと呼びます。
これを排除するためには、データだけでなく演繹的な整合性を考察する必要があります。
詳細は下記のブログコラムをご参照下さい。
(4)探索結果からさらに発展させて考える
もしも有効な投資指標が発見できた場合、なぜそのような結果が得られたか相関関係ではなく因果関係を推定する必要があります。
これにより更に有効な投資指標を発見する足掛かりとなる可能性があります。
テクニカル指標を探索する場合、そのテクニカル指標がどのような意図を込めて作られているのか考えることが重要です。
詳細は下記のブログコラムをご参照下さい。
4.さらに実践的なテクニック
(1)リターンの考え方
リターンは一定期間の騰落率(=(終値-始値)/終値)とします。
例えば、5分足の騰落率、1時間足の騰落率、日足の騰落率などです。
エントリーだけでなくイグジットでも指標を使うのはかなりの上級テクニックです。
(エントリー指標A、イグジット指標B)
エントリー指標Aとは、エントリーの直後の値動きだけ予測すればよいのです。
エントリーした直後に値動きが発生しなければ、それはエントリータイミングを間違えたことになります。
従って自分のトレードしたいタイムフレームでの一定期間の騰落率をリターンと置いて問題ありません。
これに対してイグジットとは、たいていの場合、値動きがなくなった場合(期待リターンが0になった場合)にはイグジットすべきであり、わざわざイグジット指標Bを使う意味はありません。
もしもイグジット指標Bを投資指標として採用したいのであれば、並行して指標Bでエントリーするストラテジーを走らせればよいだけです。
仮にイグジット指標Bに統計的に有効性を持たせたい場合、イグジット指標Bの検証には条件付き確率の考え方(イグジット指標Aの特定条件におけるイグジット指標Bに関するリターンの確率分布)を導入しなければなりません。
これは複雑な検証が必要となります。
私自身これには手を出しておらず、正しいフレームワークは分かりません。
(2)交互作用を考慮する
ここまでのように散布図や累積リターンをプロットしても有効な指標が発見できない場合があります。
それは単に有効な指標が存在しないわけではなく、有効であるけれどもその特性が隠れて見えていない場合が殆どです。
つまり「指標Aはある条件Bの下ではリターンを推定するのに有効であるが、条件B以外では特性が逆転したり消失したりする」、ということです。
これはレジームを考慮すると、その特性が顕著になる場合があります。
ただしレジームを導入するとパラメータが増え、カーブフィッティングの可能性が高くなるので注意が必要です。
詳細は下記のブログコラムをご参照下さい。
5.機械学習の応用
最近は機械学習を使って投資指標を探索することが注目を集めています(たぶん)。
これは、特徴選択(Feature Selection)と呼ばれるテクニックであり、多数の特徴量をまとめて学習に掛けて有効な指標を選択するというものです。
ただし、ニューラルネットなどの機械学習はフィッティング性能が強く、過分散なフィナンシャルデータは簡単に誤ったフィッティングに陥ってしまいます。
機械学習を適用する場合、単純な手法をお勧めしています。
(1)LASSO
LASSOは線形モデルであり、統計的手法と機械学習が上手く融合した手法だと考えています。
LASSOを使うと、多数の指標の中から自動的に有効なものを絞り込んでくれます。
詳細は下記のブログコラムをご参照下さい。
(2)ExtraTrees
ExtraTreesはRandomForestに代表される集団木の手法の1つです。
ここでは詳細な説明は割愛しますが、個々の決定木の作成過程においてランダムネスを導入しており、フィッティングが弱くロバストな手法となっています。
集団木は、個々の決定木への採用状況から、各特徴量の重要度(Feature Importance)を算出できます。
これにより、有効な指標を選定することができます。
LASSOと異なるところは、決定木の深さを2とすることで交互作用を考慮できることです。
また決定木はノンパラメトリックな手法であることから、指標の分布形状を気にすることなくお手軽に使うことができます。
詳細は下記のブログコラムをご参照下さい。
6.最後に
ここまでに投資指標の探索について書いてきましたが、
上記の手法を使って単純に儲かるかどうか判断するだけでは少し寂しい感じがします。
最も重要なことは投資対象に興味を持つことであり、想像力を膨らませて相場を眺めることです。
このコラムを元に読者の皆様がさらに投資の世界へ興味を持って頂けることを願っています。