基于基金持仓构建行业组合和Lasso回归
线性回归作为一种常用的统计分析方法,被广泛应用于基金行业仓位测算中。但简单线性回归方法存在多重共线性问题,且使用一级行业指数作为自变量容易丢失基金独特信息。我们针对每个基金自身持仓分别构建基金维度的行业组合,并采用Lasso回归。这种方法有效地突显了每个基金的独特性,且L1正则化能够筛选出对基金收益率有显著影响的行业,消除多重共线性。采用Lasso回归方法得到的误差平均值为0.81%。
对损失函数进行时序衰减、债券仓位限制
在Lasso损失函数中,我们引入了时间衰减加权,赋予近期数据更大权重。考虑每个基金的历史持仓,为债券持仓设定了上下限,避免大幅偏离。这些改进使模型结果显著提升,平均误差达到0.51%。
基于券商金股、优秀基金持仓构建行业模拟组合
针对基金持仓权重小于1%的行业,我们尝试使用券商金股组合或基金持仓绩优股票池组成模拟行业组合,通过对比,我们发现利用绩优的基金持仓进行模拟行业组合更为有效。这种方法从2018年开始已使模型的预测误差平均值降低到0.46%,提高了模型的预测准确性。
模型近期测算结果
截止至2023年9月底,当月有色金属、基础化工、煤炭等行业的仓位比例上涨最为显著;而传媒、汽车、房地产等行业的仓位则有所下降。剔除行业涨跌幅后,我们预测整体上基础化工、有色金属、交通运输等行业主动增持仓位,而传媒、汽车、医药等行业则主动减持。
模型行业轮动表现
基于基金行业仓位占比变化,生成的行业轮动信号,我们进行了行业轮动回测,多头组能贡献10.85%的年化超额收益率,而空头组能贡献-6.2%的年化超额收益率。整体上时序IC表现并不稳定,IC均值为2.8%,ICIR为0.89。
风险提示
本报告基于历史数据分析,历史规律未来可能存在失效的风险;市场可能发生超预期变化;各驱动因子受环境影响可能存在阶段性失效的风险。