机器学习算法可以分为监督学习、无监督学习和强化学习三类。监督学习可以理解为:使用标记的训练数据来学习从输入变量(X)到输出变量(Y)的映射函数。无监督学习问题只有输入变量(X),但没有相应的输出变量,它使用无标签的训练数据来模拟数据的基本结构。强化学习是一种机器学习算法,它允许代理根据当前状态决定最佳的下一个动作。

监督学习算法又包括:线性回归、Logistic回归、分类和回归树(CART)、朴素贝叶斯、支持向量机算法(SVM)、K邻近算法(KNN)、Apriori算法、K-means、主成分分析(PCA)、随机森林、套袋(Bagging)。

分类和回归树(CART)是决策树的一个实现方式。非终端节点是根节点和内部节点,终端节点是叶节点。每个非终端节点表示单个输入变量(x), 叶节点表示输出变量(y)。该模型用于做出如下预测:遍历树的分裂到达一个叶节点,并输出叶节点上存在的值。

主成分分析(PCA)用于通过减少变量的数量来使数据易于探索和可视化。这是通过将数据中的最大方差捕获到一个称为“主要成分”的轴上的新的坐标系来完成的。每个组件是原始变量的线性组合,并且彼此正交。组件之间的正交性表明这些组件之间的相关性为零。

发表评论

您的电子邮箱地址不会被公开。