
线性判别分析是一种经典的线性学习方法,在二分类问题上最早由Fisher在1936年提出,亦称Fisher线性判别。线性判别的思想非常朴素:给定训练样例集,设法将样例投影到一条直线上,使得同类样例的投影点尽可能接近,异样样例的投影点尽可能远离;在对新样本进行分类时,将其投影到同样的直线上,再根据投影点的位置来确定新样本的类别。
在基于财务比率和其他金融变量的破产预测中,LDA是第一个用来系统解释公司进入破产或存活的统计学工具。尽管受到财务比率不遵守LDA正态分布假设的限制,Edward Altman的1968年模型仍然是实际应用的领先者。在市场营销,判别分析曾经常用于通过市场调查或其他数据收集手段,找出那些能区分不同客户或产品类型的多个因素。
按照《量化投资策略:多因子到人工智能》资料中的步骤,搭建机器学习模型,选择线性判别分析算法(LDA),构建包括特征和标签提取、特征预处理、样本内训练、交叉验证和样本外测试等步骤。最终在每个月底可以产生对全部个股下期上涨概率的预测值,然后根据正确率、AUC 等指标以及策略回测结果对模型进行评价。我们的模型设置为月频换仓,为了让模型及时学习到市场特征的变化并兼顾计算效率,我们采用了滚动回测方法,即从 2016年5月1开始,每月底重新构建一次模型,在下一月进行测试。我们还根据模型的预测结果构建了沪深300成份内选股和中证500成份内选股策略,通过年化收益率、夏普比率、最大回撤等指标综合评价策略效果。
中证500标的收益110%,同期指数15%,超额95%,夏普比率3.15,最大回撤24%。
沪深300标的收益130%,同期指数45%,超额85%,夏普比率2.88,最大回撤27%。
总体而言,这个算法对中证500指数更加稳定,收益率更高
(来源:量化策略与人工智能的财富号 2022-03-03 18:38) [点击查看原文]
