线性判别分析(LDA)是最初由RA Fisher于1936年开发的分类方法。它简单,数学上稳健,并且通常产生的模型的精度与更复杂的方法一样好。
算法
LDA基于搜索最佳分离两个类(目标)的变量(预测变量)的线性组合的概念。为了捕捉可分性的概念,Fisher定义了以下得分函数。
给定得分函数,问题是估计最大化得分的线性系数,其可以通过以下等式求解。
评估歧视有效性的一种方法是计算两组之间的 马哈拉诺比斯距离。距离大于3意味着两个平均值相差超过3个标准差。这意味着重叠(错误分类的概率)非常小。
最后,通过将新点投影到最大分离方向并将其分类为C1来对新点进行分类,如果:
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar