量化選股之因子選股(僅供參考,大牛輕拍)
一、 定義和思想
因子選股模型是應(yīng)用最為廣泛的一種選股模型,基本原理是采用某個或某些因子作為選股的標(biāo)準(zhǔn),滿足這些因子的股票則被買入,不滿足的則賣出。
因子選股模型為什么適用?舉一個簡單的例子:如果有一批人參加馬拉松,想知道哪些人能獲得不錯的成績,只需在跑前做一個身體測試即可。測試可以用一個或多個指標(biāo)。對測試的結(jié)果進(jìn)行排名,排名靠前的運動員獲得好成績的可能性就比較大。因子選股模型的原理與此類似,可以利用某些指標(biāo)(因子)選擇未來可能表現(xiàn)較好的股票。
二、 因子的種類
哪些因子可能成為選擇股票的依據(jù)?這主要依賴于金融經(jīng)濟(jì)邏輯和市場經(jīng)驗??偟膩碚f,因子的來源有三方面:1)公司層面因子;2)外部環(huán)境因子;3)市場表現(xiàn)因子。
(一)公司層面因子
公司層面因子來自于公司的微觀結(jié)構(gòu),與公司的生產(chǎn)經(jīng)營息息相關(guān),一般來自公司的財務(wù)指標(biāo),反映了公司的盈利、運營、債務(wù)和成長狀況。這些因子主要有:1)價值類因子,如PE、PB;2)成長類因子,如ROE、凈利潤增長率;3)規(guī)模類因子,如凈利潤、營業(yè)收入;4)情緒類因子,如預(yù)測未來12個月的利潤增長率;5)質(zhì)量類因子,如資產(chǎn)負(fù)債率、應(yīng)收賬款周轉(zhuǎn)率。
(二)外部環(huán)境因子
政治法律、宏觀經(jīng)濟(jì)、社會習(xí)俗和技術(shù)發(fā)展等外部環(huán)境對一個行業(yè)和企業(yè)來說都是非常重要的。比較重要并且容易量化的外部環(huán)境因子主要是1)宏觀環(huán)境因子,如經(jīng)濟(jì)增長率、利率等;2)行業(yè)環(huán)境,如行業(yè)集中度等。
(三)市場表現(xiàn)因子
市場表現(xiàn)因子主要體現(xiàn)的是股票在交易過程中的價格和交易量。這些因子主要有動量和反轉(zhuǎn)類因子、資金流向和各種技術(shù)類指標(biāo)等。
三、 建模方法
因子選股模型想法比較簡單,幾乎用不到特別復(fù)雜的數(shù)學(xué)模型。如果從數(shù)
學(xué)的角度來看,因子選股模型僅僅是一個從因子到資金曲線的映射:
f(factors,parameters)=equity
其中f表示交易系統(tǒng)(線性或非線性),實際建模時可以用回歸法或打分法進(jìn)行簡化處理。Factors是我們篩選出來的一些有效因子,如果這些因子有信息重疊,可以采用多元統(tǒng)計中的主成分分析或因子分析進(jìn)行降維處理。Parameters是建模時遇到的各種參數(shù),它們包括因子的權(quán)重、觀察時間長度和持有時間長度等。Equity是資金曲線,它反映我們賬戶隨時間的變化情況。通過對資金曲線equity的一些再處理,就可以得到一些評價指標(biāo)(如年化收益率、年化夏普比率和最大回撤等),通過這些指標(biāo)可以來評價該投資策略的效果。
從上面的模型可以可以看出,因子選股模型最重要的有兩方面:一個是有效因子的選擇,另一個是因子參數(shù)的選擇。例如到底是PE有效還是ROE有效;到底是采用1個月做調(diào)倉周期還是3個月做調(diào)倉周期。這些因子和參數(shù)的獲取只能通過歷史數(shù)據(jù)的回測來獲得。
四、 模型回測
模型回測的目的是為了獲得有效因子和參數(shù),再利用這些有效因子和參數(shù)篩選股票,然后構(gòu)造投資組合進(jìn)行投資,從而獲得正的alpha收益。
總體來說,模型的回測可以分下面幾個步驟進(jìn)行(具體的細(xì)節(jié)只有在做的時候才能感受到)。
第一步,數(shù)據(jù)的準(zhǔn)備。這一步主要包括數(shù)據(jù)時間段的選擇、從數(shù)據(jù)庫導(dǎo)出數(shù)據(jù)以及數(shù)據(jù)結(jié)構(gòu)的的設(shè)計。
第二步,樣本的篩選。為了使模型的有效性更強(qiáng),我們需要對樣本進(jìn)行一些篩選。如剔除選股日的ST/PT股票、剔除新股和剔除由于停牌而無法買入的股票。
第三步,數(shù)據(jù)清洗。數(shù)據(jù)清洗主要是對異常值和缺失值進(jìn)行處理。
第四步,分析計算。這一步是整個回測過程的核心,它涉及到是否標(biāo)準(zhǔn)化、參數(shù)的選擇、是否考慮交易成本和結(jié)果計算等等非常重要的問題。
五、 撰寫研究報告
可以模仿一些比較好的數(shù)量分析報告撰寫我們的研究報告。
參考資料
[1]無名.《多因子選股模型》
[2]李洋.前言—基于matlab的量化投資
[3]光大證券.數(shù)量化投資:體系與策略
[4]國信證券.數(shù)量化投資技術(shù)綜述
[5]劉毅.因子選股模型在中國市場的實證研究[D].上海:復(fù)旦大學(xué),2012