机器学习十大算法 - 智能高科网

机器学习是一种人工智能领域的技术和方法，通过让计算机系统自动学习和改进，使其具备从经验中学习和执行任务的能力。机器学习利用数据和算法，通过模式识别和统计分析，让机器能够进行预测、决策和行动，而不需要明确的编程指令。简而言之，机器学习使计算机能够从数据中学习，然后将学到的知识应用于类似的问题和任务中。

线性回归
Logistic回归
线性判别分析（LDA）
分类与回归树
朴素贝叶斯
K近邻算法
学习向量量化
支持向量机（SVM）
Bagging
随机森林

1、线性回归

线性回归的表示是一个方程，它通过找到输入变量的特定权重（称为系数B），来描述一条最适合表示输入变量x与输出变量y关系的直线。可能是统计学和机器学习中最知名和最易理解的算法之一，预测建模主要关注最小化模型误差或者尽可能作出最准确的预测，以可解释性为代价。

2、Logistic回归

Logistic回归与线性回归相似，目标都是找到每个输入变量的权重，即系数值。与线性回归不同的是，Logistic回归对输出的预测使用被称为 logistic 函数的非线性函数进行变换。它是一个快速的学习模型，并且对于二分类问题非常有效。

3、线性判别分析（LDA）

线性判别分析进行预测的方法是计算每个类别的判别值，并对具备最大值的类别进行预测。该技术假设数据呈高斯分布，因此最好预先从数据中删除异常值。这是处理分类预测建模问题的一种简单而强大的方法。

4、分类与回归树

决策树的叶节点包含一个用于预测的输出变量y，通过遍历该树的分割点，直到到达一个叶节点并输出该节点的类别值就可以作出预测。决策树模型的表示是一个二叉树，学习速度和预测速度都很快，可以解决大量问题，并且不需要对数据做特别准备。

5、朴素贝叶斯

朴素贝叶斯是一个简单但是很强大的预测建模算法，该模型由两种概率组成，这两种概率都可以直接从训练数据中计算出来：1）每个类别的概率；2）给定每个x的值，每个类别的条件概率。如果数据是实值时，通常假设一个高斯分布，这样可以简单的估计这些概率。

6、K近邻算法

KNN 算法在整个训练集中搜索K个最相似实例（近邻）并汇总这 K 个实例的输出变量，以预测新数据点。KNN需要大量内存或空间来存储所有数据，但是只有在需要预测时才执行计算（或学习）。可以随时更新和管理训练实例，以保持预测的准确性。

7、学习向量量化

学习向量量化（简称 LVQ）是一种人工神经网络算法，它允许你选择训练实例的数量，并精确地学习这些实例应该是什么样的。在学习之后，最相似的近邻通过计算每个码本向量和新数据实例之间的距离找到。然后返回最佳匹配单元的类别值作为预测。

8、支持向量机（SVM）

超平面是分割输入变量空间的一条线，超平面和最近的数据点之间的距离被称为间隔，分开两个类别的最好的或最理想的超平面具备最大间隔。实际上，优化算法用于寻找最大化间隔的系数的值。

9、Bagging

Bagging 是从数据样本中估算数量的一种强大的统计方法。在训练数据中抽取多个样本，然后对每个数据样本建模。当你需要对新数据进行预测时，每个模型都进行预测，并将所有的预测值平均以便更好的估计真实的输出值。

10、随机森林

随机森林是对Bagging方法的一种调整，在随机森林的方法中决策树被创建以便于通过引入随机性来进行次优分割，而不是选择最佳分割点。针对每个数据样本创建的模型将会与其他方式得到的有所不同，可以更好的估计真实的输出值。

顶一下

(0)

踩一下

(0)

相关评论

我要评论: 用户名: 验证码:

上一篇：返回栏目

下一篇：大一计算机应用基础学习的主要内容？