データサイエンティストのひよこ

分析に関する日々の相談事項

投資のリターンと効果測定1:投資のリターン

 私はデータサイエンティストというより数理専門職として社内では認識されてしまったので、仕事ではクオンツのような金融の分析を行うこともある。おそらく、JTCの大きな企業に勤めていると、必ずしもデータサイエンスではない仕事でも、社内の部署の垣根を越えて相談を受けることがあるだろう。実際のところ、データサイエンティストの仕事に濃い技術力を期待すると、コンサル色が強くてまいってしまうことが多いので良い機会だと思って、一応関わっている。

 金融におけるデータ分析では、通常のマーケティングのデータサイエンスでは、あまり触れられることのない考え方があって、新鮮に感じることが多い。なかでも、今回は投資のパフォーマンス測定方法について紹介したいと思う。金融の仕事をしてる人には、今回の記事は当たり前のことなので、読まなくてもいいかなと思う。
 今回の内容は端的に言うと、利回りや利率というものをどのように正しく計測するかということである。一見すると、非常にベーシックな概念ではあるが、単純に利益を測定するだけでなく、利益を生んだ要因を細かく分解するニーズがある。比較的最近の2014年の論文でも新しい測定方法が提案されていたりする。データサイエンスの記事になぜ、金融のリターンの測定手法が?と思われた人も多いと思うが、金融の文脈でも効果をきちんと検証する、効果測定や効果検証に分類される分析方法が存在する。今回のリターン計測手法も、ある投資先に投資した結果がどれほど普通より優れていたかを、因果推論で行うようにヌルモデル(制御群)を定め、因果推論ほど厳密に扱うものではないが、そこから効果量を計測する手法である。私は直近、因果推論の手法の一つ、Synthetic Control法を利用していたので、ところ変われど必要となる技術は似るものなのだなぁと思い、分析文化の違う中で関わってみようと思ったことがはじまりである。

 まず、リターンと言っているのは、日常でいうところの利回りや利率という意味である。ある時点tのリターンr(t)は購入時の価格Price(t_0)と現在時(あるいは売却時)までn期要した時の価値Price(t)から比率(+年率のためのn乗根)として求められることが多い。(対数値をとる場合もある)

 r(t)=^{n}\sqrt{\frac{Price(t)}{Price(t_0)}}-1

 この数値によって、年率いくらの投資利回りがあったかを知ることができる。しかし、この数値は、投資対象単体での絶対評価となっていて少し使いづらい。。具体的に言うと、ある投資を行って、年5%増やすことができたとき、その投資は「良い投資」だったかどうかの比較が行えていないのである。例えば、リーマンショックの時であれば、市場が暴落している状況での5%と、好景気での5%では意味合いが異なってくる。このため、リターンを生み出す要因を分解して考えなければならず、こういう場合リターンr(t)は、市場環境から生み出される共通リターン\beta (t)と、個別要因リターン\alpha(超過リターン)に分解して考えられている。
 r(t)=\beta (t) + \alpha

 ある投資のリターンr(t)は、何もしなくても投資対象の市場全体が変動したことによって勝手に得られたリターン\beta (t)と、投資家の手腕やファンド個別の特有な活動によって生み出されたリターン\alphaを合わせたものになるということだ。自分がある投資をしたとき、この超過リターン\alphaがどれほどあったかを計測することが重要となる。つまり、ある株に投資した時、その株のリターンが日経平均のリターンに対して、どれだけの差(超過リターン)があったかを調べることで、自分の投資手腕を調べることができる。ベースとなるグループの変化量に対して、注目するグループの変化量が、どれだけ乖離があったかを調べるという意味で、因果分析の効果量の測定に近い。
 ここまでは、金融に関わる人でなくても知っている人はいると多いと思う。この\alphaを求めるための計測方法として、市場全体の\betaと比較するPME(Public Market Equivalence)法というものが知られている。いくつか修正手法があり、合理的なものとしてダイレクトアルファメソッドが2014年に提唱された。今回は、名前の紹介にとどめ、具体的な手法は、次の記事に書いていく。