如何从航空业核心指标建立量化模型:一个重要的方法

来源: 时间:18年08月10日 作者:

中信建投 丁鲁明

原题《量化基本面选股:从逻辑到模型,航空业投资方法探讨》2018.8.10

  • 内容摘要
1

航空业具有明显的高Beta属性

过去十几年,航空股表现出典型的高Beta属性。中国A股有三次大行情,在此期间,航空指数相对沪深300具有明显的超额收益,当然,A股的几次大跌行情,航空股也是明显的超跌。利用过去13年的月频数据,统计发现,航空指数相对沪深300指数的Beta为1.18,t值为15.83,显著的高Beta属性。

2

航空行业四季度超额收益显著

2005年1月到2018年6月,分别统计了航空指数相对沪深300指数的超额收益,统计发现,航空指数周期性十分明显,其中,一、二、三季度其超额收益皆为负,而四季度则超额收益均值为3.44%,且这13年有8年四季度超额收益为正。

3

供需结构是超额行情的基石

供需结构决定客座率,而客座率直接决定航空公司定价策略,从而影响其超额收益,历史规律发现,客座率对航空指数相对沪深300超额收益有3个月的领先效应,且显著的正相关,超额行情对客座率的敏感度达5.90,单变量解释度达28%。客座率是决定航空公司股价表现的核心因素,是超额行情的基石。

4

汇率与原油为影响航空业的主要外部因素

除了供需结构,汇率和原油对航空股的影响也是具有明显的领先性,研究发现,汇率、原油价格与超额行情均具有显著的相关性。汇率、原油价格领先期大概皆为6-9个月,与超额行情相关系数绝对值分别为31.50%,42.17%左右。GDP与超额行情也有显著的相关性的,但是研究发现,GDP并没有领先性。

5

量化基本面择时、选股模型

根据客座率、汇率、原油价格三大指标,我们建立了TTM环比增速模型,其中,客座率领先3个月,汇率、原油价格领先6个月。首先,我们预测航空指数相对沪深300超额收益的TTM环比增速方向,准确率达71.74%;其次,我们用这三大指标在航空业做指数择时模型,以航空指数为标的,单向做多,择时净值相对航空指数年化超额收益5.48%;最后,利用三大指标在航空业选股,核心思想是不同个股对指标的敏感度不同,从而选出未来表现好的股票,做指数增强模型,策略净值相对等权基准年化超额收益8.41%,相对航空指数年化超额收益13.64%。

◢ Part I ◣ 航空核心指标量化解析

要分析研究航空行业,就必须要挖掘其相关的行业变量,即解释变量。挖掘变量的过程中,首先要有经济逻辑基础,其次是构建模型,最后利用数据检验其相关性和逻辑性。在我们的研究中发现,客座率、汇率、原油价格和GDP与航空指数相对沪深300超额收益有显著的相关性,同时,这几类指标也有很强的经济逻辑基础。为什么我们用行业指标与航空指数相对沪深300超额收益做研究呢,因为我们想剔除市场的影响,而航空指数成分股基本同时也是沪深300的成分股,故用航空指数相对沪深300超额收益是比较能说明问题的。所以在找这一类指标的时候,经济逻辑上尽可能影响航空指数而对沪深300影响较小甚至没有影响的相关指标。

供需结构是超额行情基石

谈到影响航空指数的行业指标,首先想到的是供需结构,而直接反映供需的指标则是航空公司的客座率。从逻辑上来讲,客座率高则表明航空公司业绩会有明显的提升,因为客座率高的情况下,航空公司相对来讲有一定的提价空间,故业绩会有一定的改善,则相应的股价也会有对应的表现。

从原始数据来看,规律并不明显。从时间上来看,客座率基本是上升趋势,而在我们选取的时间内,航空指数相对沪深300却并不稳定,当然,这与A股过去十几年经历了牛熊有关,而航空行是比较典型的周期行业,且具有明显的高beta属性,后面我们会分析到。

对航空行业来说,供需从逻辑上来讲,是具有很明显的经济逻辑基础。为了研究其规律,我们用ttm环比增速来分析其相关性。首先,我们分析了其相关性,研究发现,客座率具有3个月的领先期,其与超额行情相关系数达53%。最后我们用客座率作为单变量对超额行情做回归解释。相关结果如下:

根据客座率与航空指数相对沪深300指数ttm环比增速相关分析可知,作为衡量供需关系的客座率,其与超额行情有显著的正相关性。

汇率为主要影响因素

汇率对航空影响是比较显著的。首先,我们知道,航空行业属于典型的外汇负债类行业,且主要负责为美元,故人民币升值会给航空公司带来显著的汇兑收益;其次,航空公司购买飞机及其维修原材料都是以美元计价的,人民币升值会明显的降低其购买成本;同时,人民币升值也会一定程度促进国外游,提高游客数量;最后人民币升值也使进口的航油价格下降,由于燃料费用占航空公司较大的成本比例,因此,人民币升值也会一定程度上降低航空公司的成本。当然,航空公司为应对人民币对美元汇率波动对于业绩的影响,各家航空公司通过缩减美元负债规模和占比,降低航空公司业绩对于汇率的敏感性。

从原始数据来看,无论是汇率还是航空指数相对沪深300指数,在我们的选取时间内,都是逐渐下降的趋势。这与我们前面分析的逻辑是不符合的,即人民币贬值,对航空指数是不利的。同样,为了研究其规律,我们用ttm环比增速来分析其相关性。首先,我们分析了其相关性,研究发现,汇率具有6-9个月的领先期,本文中,我们以领先6个月为准。最后我们用汇率作为单变量对超额行情做回归解释。相关结果如下:

研究发现,汇率对超额行情是显著的正相关的,这与我们的逻辑是不符合的,我觉得主要是因为其它影响因素超过了汇率的影响,或者投资者对汇率的过度反应导致结果与我们逻辑不统一的情况,但16年到18年,则汇率与超额行情显著的负相关,这是符合逻辑的,这可能是因为航空公司在降低汇率对其影响的同时,投资者对汇率也有比较理性的反应,所以汇率与航空超额行情的关系在逻辑上是符合经济学逻辑的。

原油价格为重要因素

油价虽然并非影响航空行情的核心因素,但其明显也是重要的影响因素,因为对航空公司来说,燃油费是比较重要的成本构成,油价上涨或下跌,会比较明显的影响其业绩,进而影响航空公司的股价表现。当然,为应对油价上涨,航空公司可采取措施并引进更好的新机型,比如征收燃油附加费等。从这一逻辑上来讲,油价可能是比较重要的扰动因素和影响因素,但不是核心因素。

从原始数据来看,其实我们也能发现,油价与航空超额行情是比较明显的负相关性,这与我们前面分析的逻辑是一致的,即油价上涨,则航空公司成本上升,故而业绩下滑,导致股价表现下行;相反,油价下跌,则航空公司成本下降,故而业绩好转,促进股价表现上行。为了更详细的研究其规律,我们用ttm环比增速来分析其相关性。首先,我们分析其相关性,研究发现,原油价格具有6-9个月的领先期,本文中,我们以领先6个月为准。最后我们用油价作为单变量对超额行情做回归解释。相关结果如下:

根据原油价格与航空指数相对沪深300指数ttm环比增速相关分析可知,其与超额行情有显著的负相关性,但超额行情对其敏感度相对较低,只有-0.27,与对客座率或者汇率的敏感度相比,其重要性是显著的降低,但原油价格与超额行情的相关系数却达到-42.17%,且t值为-5.5,具有显著意义,所以原油价格对航空业来说,为重要影响因素,但并非核心和主要因素。

GDP与超额行情显著相关,但无领先性

对航空公司来讲,经济大环境是比较明显的影响因素,比如经济大幅上升则会促进公商务客出行需求,同时也会提升因私旅游,进而提升航空公司的收入,改善其业绩,最后传导到股价。故而我们也分析了GDP与航空指数相对沪深300指数超额收益的关系。

从原始数据来看,规律并不明显,因为GDP基本是上升趋势,而航空指数相对沪深300指数超额收益是不稳定的。为了研究其规律,与前面一样,我们用ttm环比增速来分析其相关性。首先,我们研究其领先效应,主要是根据相关关系看其领先效果,研究发现,GDP与航空指数相对沪深300指数超额收益有明显的相关性,但并无领先性。相关结果如下:

根据原油价格与航空指数相对沪深300指数ttm环比增速相关分析可知,其与超额行情有显著的正相关性,但没有领先效果,这说明GDP对航空业来说,本身可能就是一个滞后指标,领先性不明显。

◢ Part II ◣航空股回顾 

航空股超额收益大行情回顾

 

在过去十多年的时间里(2007年01月到2018年06月,由于中国国航2006年8月18日上市,故在此我们以2007年1月作为起点),航空股相对沪深300指数有明显的三次超额行情。分别发生在:

2007年01月到2007年12月:航空指数上涨308.35%,相对沪深300超额收益82.47%;

2008年10月到2010年10月:航空指数上涨287.62%,相对沪深300超额收益90.79%;

2014年08月到2015年06月:航空指数上涨356.43%,相对沪深300超额收益138.60%。

从时间跨度来看,第二次航空指数从2008年10月到2010年10月刚好两年;从航空指数相对沪深300超额收益行情来看,第三次上涨从2014年08月到2015年06月不到一年时间超额收益达138.60%。在这三次超额收益行情中,第三次是用时最短,超额收益却最高的一次。

从图中我们可以看到,每一次航空指数相对沪深300指数超额收益行情的起点,基本也是A股牛市的起点,而超额收益的终点也基本是牛市的终点,虽然我们分析超额收益是尽可能找到只对航空指数影响较大而对沪深300指数基本没有影响的相关解释变量,但从超额收益与牛市的相关性,我们也知道,有些变量不仅对航空指数有影响而对沪深300指数有影响的也应该考虑,因为他们可能是影响程度不同。还有后面分析到的航空股的高beta属性,也是直接导致航空指数在牛市有超额行情的主要原因。

第一次航空指数相对沪深300指数超额收益行情从2007年1月(甚至更早),而在此区间人民币相对美元是明显的升值,这得益于我国2005年的汇改,人民币汇率不再盯住单一美元,而是选择若干种主要货币组成一个货币篮子,同时参考一篮子货币计算人民币多边汇率指数的变化。

第二次航空指数相对沪深300指数超额收益行情从2008年10月开始,航空业客座率从2008年05月的70.9%到2010年8月上升到84.2%,提升率达18.75%,这一次超额行情,客座率很有可能就是主要驱动影响。

第三次航空指数相对沪深300指数超额收益行情从2014年08月开始,而在此时间段,原油价格基本是瀑布式下跌,原油暴跌,则航空公司成本直线下降,业绩也会有明显提升。

每一次超额行情都伴随着一些相关指标异常现象发生,比如第一次为汇率现象,人民币明显升值,第二次是客座率提升显著,第三次是原油价格暴跌。当然,这些现象不是全部原因,但一定是不可忽略的重要原因。我们主要简单分析了航空指数相对沪深300超额行情的一些现象回顾,接下来,我们简单分析个股情况

从近十几年的历史航空行业个股表现来看,中信海直表现相对平稳,其它个股表现基本一致,从个股情况来分析,中信海直与其它航空个股主营业务区别较大,其它航空公司基本是以航空运输业为核心,而中信海直是中国规模最大的通用航空企业,主要业务是为国内外用户提供海洋石油服务及其他通用航空业务。为了比较剔除市场的影响后的个股表现,我们比较了个股相对沪深300指标的表现,可以看到,剔除市场影响后,航空股整体相对表现与没有剔除市场影响基本一致。

2007年01月到2018年6月,在此区间,以沪深300指数收益为自变量,以个股收益为因变量,我们对各个个股分别进行了简单的回归统计,根据回归beta可知,南方航空与中国国航最敏感,而中信海直与东方航空敏感度最弱;根据回归的拟合度可知,沪深300指数对海航控股和中国国航解释度最高,达到60%,而对东方航空的解释度最差,仅为35%。

 

航空行业具有明显的高beta属性

过去十几年,航空股表现出典型的高Beta属性。中国A股有三次大行情,在此期间,航空指数相对沪深300均具有明显的超额收益,当然,A股的几次大跌行情,航空股也是明显的超跌。利用过去13年的月频数据,统计发现,航空指数相对沪深300指数的Beta为1.18,t值为15.83,显著的高Beta属性。

航空行业四季度超额收益显著

航空业是显著的周期性行业,我们分析了08年到18年之间,各月度均值,季度均值,各年度均值等几种客座率情况,以更好的研究客座率与航空指数超额行情的关系。

各年内月度均值从2008到2018这十一年,客座率明显的上升趋势,从08年的74.7%到18年83.7%。

1月、5月、11月和12月客座率相对较低,而2月、7月、8月和10月相对较高。从季度平均来看,3季度明显较高,而4季度则显著较低。

航空行业为明显的周期行业,2005年1月到2018年6月,分别统计了航空指数相对沪深300指数的超额收益,统计发现,航空指数周期性十分明显,其中,一、二、三季度其超额收益皆为负,而四季度则超额收益均值为3.44%,且这13年有8年四季度超额收益为正。再细分到月份,可以看到,8月份超额收益为负非常明显,而11月为正的超额收益显著。从其逻辑上讲,8月明显的负超额收益主要原因是4,5月可能是航空淡季,而暑假是旺季,根据我们前面的研究知道,客座率大概有3个月的领先期,故传导到股价导致8月明显的负超额收益,而11月等明显的正超额收益。

◢ Part III ◣  基于行业核心指标的航空预测模型

前面我们分析了航空行业几大指标,研究发现客座率是航空指数相对沪深300指数超额收益的最核心的指标,而汇率和原油价格也是非常重要的影响因素,且客座率领先3个月左右,而汇率和原油价格领先6-9个月;虽然GDP与超额行情有显著的相关性,但没有领先性,故实际指导投资意义并不大。

我们将分别利用这三大指标,对航空业净利润及营业收入和航空指数相对沪深300指数超额行业做ttm增速预测模型,分别统计其相关性及预测能力。

基于三大指标的行业净利润ttm增速预测模型

首先,我们简单统计航空业几大个股的相关净利润情况。

中信海直前面已经提到过,与其它航空个股主营业务差距比较大,所以净收益相对比较小,但明显比其它航空个股稳定,且其净利润各季度都大于0。且从时间轴度上来看,其实航空航业这10多年,净利润并没有明显的提升。根据前面的分析,我们以客座率、汇率、原油价格三大行业指标建立航空行业TTM增速预测模型。其中,客座率领先3个月,汇率(美元人民币)领先6个月,原油价格(美国西德克萨斯中级轻质原油(WTI))领先6个月。对于缺失数据,我们用简单的线性插值补全。用这三大指标的TTM环比增速做自变量,用航空业净利润(季度线性插值转为月度)的TTM环比增速作为因变量进行多元线性回归。

很明显,2011年以前航空股月度净收益TTM环比增速变化太大,不利于统计规律,故我们回归预测模型起始数据从2011年1月开始。

根据客座率、汇率、原油价格三大指标建立的航空业净利润增速模型由上述统计结果可知,其并不理想,且解释力度只有12.65%。由显著性检验t值也可得出,客座率、原油价格对净利润回归并不显著。

基于三大指标的行业营业收入ttm增速预测模型

三大指标建立的净利润TTM增速预测模型并不理想,我们进一步研究三大指标与营业收入的关系。

和净利润一样,中信海直营业收入相对比较小,但明显比其它航空个股稳定。且从时间轴度上来看,营业收入是明显的提升,尤其是20090630到20100930,行业营业收入从35221.44百万人民币增长到76107.54人民币,增长率达116%。

航空行业为明显的周期行业,行业净利润变化较大,净利润增速预测非常困难,所以我们进一步对航空行业营业收入建立预测模型。根据前面的分析,我们以客座率、汇率、原油价格三大行业指标建立航空行业TTM增速预测模型。其中,客座率领先3个月,汇率(美元人民币)领先6个月,原油价格(美国西德克萨斯中级轻质原油(WTI))领先6个月。对于缺失数据,我们用简单的线性插值补全。用这三大指标的TTM环比增速做自变量,用航空业营业收入(季度线性插值转为月度)的TTM环比增速作为因变量进行多元线性回归。

根据客座率、汇率、原油价格三大指标建立的航空业营业收入增速模型由上述统计结果可知,效果比净利润增速模型有明显的提升,且解释力度达到64.15%。由显著性检验t值也可得出,客座率、汇率、原油价格对营业收入相关性都是非常显著的。

基于三大指标的行情ttm增速预测模型

基于客座率、汇率、原油价格三大行业指标建立航空行业TTM增速预测模型。其中,客座率领先3个月,汇率(美元人民币)领先6个月,原油价格(美国西德克萨斯中级轻质原油(WTI))领先6个月。对于缺失数据,我们用简单的线性插值补全。用这三大指标的TTM环比增速做自变量,用航空指数相对沪深300指数的TTM环比增速作为因变量进行多元线性回归。

根据客座率、汇率、原油价格三大行业指标建立航空行业TTM增速预测模型方向准确率达71.74%,拟合度为45.85%,且根据三大指标的t统计量,其绝对值明显大于2,说明其系数都具有显著性。根据系数的方向可以知道,客座率与航空超额行情是显著的正相关,而原油价格是负相关,至于汇率,我们前面分析过,其经济学逻辑应该是与超额行情成负相关的,但在我们的样本内,由于其它因素呈现正相关。最后,根据回归系数的绝对值可以知道,客座率对超额行情的影响是远大于汇率和原油价格,其次汇率对超额行情的影响远大于原油价格。从逻辑上来讲,客座率反应的是供需情况,直接影响到航空公司的业绩,是超额行情的基石,而汇率是通过负债等因素间接影响,原油价格主要是通过成本来影响,但由于各大航空公司对成本的控制或优化,所以原油价格对航空公司的影响是比较有限的。综上所述,无论从逻辑上还是统计结果都显示,三大指标对超额行情的影响程度由高到低依次为:客座率>汇率>原油价格。

◢ Part IV ◣  基于核心变量的择时模型

与航空行情增速模型一样,也是基于客座率、汇率、原油价格三大行业指标建立的择时模型。其中,客座率领先3个月,汇率(美元人民币)领先6个月,原油价格(美国西德克萨斯中级轻质原油(WTI))领先6个月。对于缺失数据,我们用简单的线性插值补全。

择时模型原理

实证期间:20080901到20180701的月度数据(样本外);

自变量:客座率、汇率、原油价格三大行业指标的TTM环比增速;

因变量:航空指数相对HS300超额收益ttm环比增速;

择时标的:航空指数相对HS300超额收益;

择时信号:利用客座率、汇率、原油价格三大行业指标的TTM环比增速历史一年的月度数据和航空指数相对HS300超额收益ttm环比增速历史一年的数据作回归,因为三大指标有相应的领先期,故利用最新指标数据来预测未来一期超额收益ttm环比增速的大小,若预测大于0,则做多超额收益,否则平仓。

前面我们讨论过,汇率在历史上对航空超额行情的影响关系直观上并不符合我们的经济学逻辑,但随着市场的逐渐成熟,其也在逐步的回归到经济逻辑基础之上。取最近一年的回归系数,因为是月度数据,我们取其各月度均值,发现客座率对航空超额行情的影响显著为正,而原油价格和汇率则明显为负,且从数值上来看,客座率的影响系数远大于原油价格和汇率,而汇率与原油价格在方面是一致的,但汇率对航空超额行情的影响系数则远大于原油价格。

量化基本面择时模型结果分析

根据客座率、汇率、原油价格三大行业指标建立的择时模型,若预测未来一期航空超额行情TTM环比增速大于0,则做多超额收益,否则空仓,以超额收益净值为基准,则相对基准年化超额收益为5.48%。

◢ Part V ◣ 量化基本面选股模型 

传统的选股模型,一般是以传统的因子,比如估值因子、规模因子、质量因子、动量因子、低波动、低换手等相关因子构建选股模型。而本文希望跳出传统选股模型框架,建立起以基本面指标为因子的选股模型,我们前面大量讲述了航空行业内相关的行业指标,其中客座率、汇率、原油价格三大行业指标对航空超额行情有显著的相关性和领先性。这三大指标对航空股有明显的影响性,而这三大指标对不同的个股影响程度应该是不同的,我们可以利用这几大基本面指标对个股影响的不同程度做分析,选出未来表现更好的股票。

选股策略原理

与航空行情增速模型及择时模型一样,也是基于客座率、汇率、原油价格三大行业指标建立的选股模型。其中,客座率领先3个月,汇率(美元人民币)领先6个月,原油价格(美国西德克萨斯中级轻质原油(WTI))领先6个月。对于缺失数据,我们用简单的线性插值补全。

实证期间:20080901到20180701的月度数据(样本外);

自变量:客座率、汇率、原油价格三大行业指标的TTM环比增速;

因变量:航空成分股相对HS300超额收益ttm环比增速;

候选股标的池:航空指数成分股;

剔除情况:上市不足二年以上,换仓当天涨跌停的相关股票剔除。

组合构建:利用客座率、汇率、原油价格三大行业指标的TTM环比增速历史二年的月度数据和航空成分股相对HS300超额收益ttm环比增速历史二年的数据作回归,因为三大指标有相应的领先期,故利用最新指标数据来预测未来一期超额收益ttm环比增速的大小,然后推出下一期个股相对hs300的值,最后再推出个股未来一期的收益,选出收益大于0的个股并等权组合,若推出未来一期所有个股收益皆小于0,则投资组合为所有成分股的等权配置。

航空个股指标敏感性逻辑分析

因为是月度调仓,故每月都会有相应的指标,此处我们分析不同个股对客座率的敏感程度分析(因为航空指标成份股只有8只,且有上市不足二年或者历史数据较少的个股,真正在模型中可选的个股只有中信海直,南方航空,东方航空,海航控股,中国国航五只股票)。

从航空公司对客座率的敏感程度(即回归系数)来看,南方航空最敏感,而中信海直最低,且中信海直对客座率的敏感程度是季度递减的,而其它航空公司貌似各个季度对客座率的敏感度区别不大。中信海直公司是中国规模最大的通用航空企业,也是为我国通用航空业首家及唯一的上市公司。中信海直主要业务是为国内外用户提供海洋石油服务及其他通用航空业务,所以对客座率敏感度最小也就符合逻辑了。

由于数据来源限制,我们只能获取到2016年来的相关各公司的客座率数据,海航控股客座率明显高于其它公司,海航控股是中国内地唯一一家SKYTRAX五星航空公司,其服务可能相对更好,也有对应较高的客座率。但从价格上来看,中国国航明显高于其它航空公司,这与国航的定位有关,国航定位于中高端公商务主流旅客市场,国航的客户对价格的敏感度相对较低。

从航空公司的航运收入占比来看,中信海直占比最高,从航空公司航运收入历年占比均值可以看出,总体航运收入占比是有提升的趋势。

我们简单的统计了国内、国际航班订座量情况,明显其订座量总趋势是上升的,并且国际占比也有一定的上升趋势。

美元负债比在很大程度上可以衡量该航空公司对汇率的敏感度,从统计数据可以看出,2012-2014年,明显南方航空美元负债比最高,达90%以上,而在2015年及以后则该指标明显降低,去年是35%左右;从这三家航空公司年度美元负债比均值来看,该指标是显著降低的,说明国内航空公司在努力减少汇率对公司业绩的影响。

原油价格为影响航空公司的重要因素,原油若上涨或下跌,则直接影响航空公司的业绩向下或向上。从历年来,各家航空公司中燃油成本占总成本比率可知,中信海直该指标最低。从这几家航空公司年度燃油成本占总成本比率均值来看,该指标与美元负债比一样,也是显著降低的,原因可能是航空公司采取措施并引进更好的新机型,或者是其它成本比如用人成本升高等降低了燃油成本。

从上面分析可知,客座率、汇率、原油价格对航空公司的影响在发生不同方向的改变,虽然对每家航空公司影响程度不同,但总体来说对整个行业方向是很明确的。客座率对整体航空行业的影响将越来越高,而随着航空公司减少美元负债占比,减少燃油成本占比,则汇率、原油价格对整个行业的影响将会逐渐降低。

量化基本面选股模型结果分析

利用客座率、汇率、原油价格三大行业指标的TTM环比增速历史二年的月度数据和航空成分股相对HS300超额收益ttm环比增速历史二年的数据作回归,因为三大指标有相应的领先期,故利用最新指标数据来预测未来一期超额收益ttm环比增速的大小,然后推出下一期个股相对hs300的值,最后再推出个股未来一期的收益,选出收益大于0的个股并等权组合,若推出未来一期所有个股收益皆小于0,则投资组合为所有成分股的等权配置。策略净值相对等权基准年化超额收益8.41%,相对航空指数年化超额收益13.64%。

◢ PartVI ◣ 航空行业量化体系总结

量化投资本质是统计规律,在做模型之前,我们一定要有基本的经济学逻辑作为支撑,以避免纯粹的数据挖掘。本文属于量化基本面行业选股模型第一篇报告,我们尝试用行业/宏观基本面指标来进行选股,跳出传统的选股模型框架,用行业指标TTM环比增速来预测个股相对基准超额收益TTM环比增速,进而推导出个股相对基准超额收益,最后选出股票组合。

以航空业作为基本面量化选股首篇深度报告,要分析研究航空行业,就必须要挖掘其相关的行业变量,即解释变量。挖掘变量的过程中,首先要有经济逻辑基础,其次是构建模型,最后利用数据检验其相关性和逻辑性。在我们的研究中发现,客座率、汇率、原油价格和GDP与航空指数相对沪深300超额收益有显著的相关性,同时,这几类指标也有很强的经济逻辑基础。为什么我们用行业指标与航空指数相对沪深300超额收益做研究呢,因为我们想剔除市场的影响,而航空指数成分股基本同时也是沪深300的成分股,故用航空指数相对沪深300超额收益是比较能说明问题的。所以在找这一类指标的时候,经济逻辑上尽可能影响航空指数而对沪深300影响较小甚至没有影响的相关指标。本文分析了这几大指标与超额行情之间的逻辑关系,量化解析了客座率、汇率、原油价格和GDP与航空指数相对沪深300超额收益的相关关系,最终发现客座率是航空指数相对沪深300指数超额收益的最核心的指标,而汇率和原油价格也是非常重要的影响因素,且客座率领先3个月左右,而汇率和原油价格领先6-9个月;虽然GDP与超额行情有显著的相关性,但无领先性,故实际指导投资意义并不大。

航空业具有明显的高Beta属性

过去十几年,航空股表现出典型的高Beta属性。中国A股有三次大行情,在此期间,航空指数相对沪深300具有明显的超额收益,当然,A股的几次大跌行情,航空股也是明显的超跌。利用过去13年的月频数据,统计发现,航空指数相对沪深300指数的Beta1.18t值为15.83,显著的高Beta属性。

航空行业四季度超额收益显著

20051月到20186月,分别统计了航空指数相对沪深300指数的超额收益,统计发现,航空指数周期性十分明显,其中,一、二、三季度其超额收益皆为负,而四季度则超额收益均值为3.44%,且这13年有8年四季度超额收益为正。

供需结构是超额行情的基石

供需结构决定客座率,而客座率直接决定航空公司定价策略,从而影响其超额收益,历史规律发现,客座率对航空指数相对沪深300超额收益有3个月的领先效应,且显著的正相关,超额行情对客座率的敏感度达5.90,单变量解释度达28%。客座率是决定航空公司股价表现的核心因素,是超额行情的基石。

汇率与原油为影响航空业的主要外部因素

除了供需结构,汇率和原油对航空股的影响也是具有明显的领先性,研究发现,汇率、原油价格与超额行情均具有显著的相关性。汇率、原油价格领先期大概皆为6-9个月,与超额行情相关系数绝对值分别为31.50%42.17%左右。GDP与超额行情也有显著的相关性的,但是研究发现,GDP并没有领先性。

然后基于这些研究,我们分析建立了预测航空指数相对沪深300超额收益的TTM环比增速方向,准确率达71.74%;其次,我们用这三大指标在航空业做指数择时模型,以航空指数为标的,单向做多,择时净值相对航空指数年化超额收益5.48%;最后,利用三大指标在航空业选股,核心思想是不同个股对指标的敏感度不同,从而选出未来表现好的股票,做指数增强模型,策略净值相对等权基准年化超额收益8.41%,相对航空指数年化超额收益13.64%

从公司层面的角度,我们也分析了不同指标的变化趋势,得出客座率、汇率、原油价格对航空公司的影响在发生不同方向的改变,虽然对每家航空公司影响程度不同,但总体来说对整个行业方向是很明确的。客座率对整体航空行业的影响将越来越高,而随着航空公司减少美元负债占比,减少燃油成本占比,则汇率、原油价格对整个行业的影响将会逐渐降低。

除了利用三大指标构建超额行情ttm增速预测模型外,我们还构建了行业净利润ttm增速预测模型和行业营业收入ttm增速预测模型。航空业作为明显的周期行情,其净利润增速预测非常困难,模型解释力度只有12.65%;周期行业虽然净利润预测困难,但对营业收入ttm增速预测却较为准确,模型解释力度达到64.15%

本文作为我们首篇量化基本面选股研究报告,以航空行业入手,首先找到行业关键指标,分析其相关性及领先性;然后回顾航空股近十多年的行情,分析了航空业的高beta属性,统计了各季度的超额收益规律;利用行业指标构建了航空业净利润ttm增速模型、航空业营业收入ttm增速模型、航空业超额收益的ttm增速模型。然后建立了择时模型,最后利用行业个股对行业基本面指标变化的敏感度不同选股,得到的选股组合也有非常不错的表现。本文利用行业指标,结合量化模型,以经济逻辑作为支撑,以量化模型作为工具,实现量化基本面择时及选股模型,未来我们将实现更多行业的量化基本面选股模型。