哪种机器学习模型最好？_机房360

摘要：机器学习模型发现训练数据中的模式，用于估计目标函数并负责将输入转换为数据集的输出。在这篇文章中，您将找到所有可用的机器学习模型类型。但在此之前，让我们了解一下机器学习。

通常最好从适合问题的最简单模型开始，然后逐步提高复杂性。
　　
　　机器学习模型发现训练数据中的模式，用于估计目标函数并负责将输入转换为数据集的输出。在这篇文章中，您将找到所有可用的机器学习模型类型。但在此之前，让我们了解一下机器学习。
　　
　　什么是机器学习？
　　
　　机器学习是一个包罗万象的短语，用于帮助计算机自行学习和适应的一系列策略和技术。机器学习技术可帮助AI进行学习，而无需明确编程预期的动作。机器学习算法完全基于学习模式而不是通过从样本输入中学习结构来预测和执行任务，而不是预先确定的程序命令。当严格的方法不切实际时，机器学习可以在各种情况下发挥作用。它将从先前的模式中学习新的过程并应用它所学到的东西。
　　
　　我们非常熟悉的机器学习应用程序的一个例子是我们的电子邮件提供商如何帮助我们处理垃圾邮件。垃圾邮件过滤器利用一种算法来检测不需要的电子邮件并将其路由到您的垃圾邮件文件夹。一些电子商务企业将机器学习算法与其他IT安全解决方案结合使用来检测欺诈并提高其推荐引擎的效率。
　　
　　机器学习模型的类型
　　
　　我们可以根据任务类型将机器学习模型分为以下几组：
　　
　　1.分类模型
　　
　　ML中的分类是从一组有限的可能性中预测项目的类型或类别的工作。分类输出变量通常是一个类别变量。预测电子邮件是否为垃圾邮件是经典二元分类工作的一个示例。让我们看一下分类任务的几个相关模型。
　　
　　1.K-最近邻算法
　　
　　2.朴素贝叶斯
　　
　　3.逻辑回归
　　
　　4.支持向量机
　　
　　5.决策树
　　
　　6.合奏
　　
　　2.回归模型
　　
　　学习回归在机器语言中有一系列问题，其中结果变量可以采用连续变量。例如，计算航空公司的价格是一项常见的回归任务。让我们看一下一些最常用的回归模型：
　　
　　1.线性回归
　　
　　2.套索回归
　　
　　3.岭回归
　　
　　4.支持向量机回归
　　
　　5.决策树回归等
　　
　　3.聚类
　　
　　聚类，简而言之，就是将相关项目组合在一起的问题。它有助于自动识别可比较的项目，而无需操作员参与。如果没有同质数据，我们就无法创建成功的监督机器学习模型（必须使用明确策划或标记的数据进行训练的模型）。聚类使我们能够以更有效的方式完成此任务。以下是一些最常用的聚类模型：
　　
　　1.K表示
　　
　　2.K表示++
　　
　　3.K中心点。
　　
　　4.凝聚聚类
　　
　　5.星展扫描
　　
　　4.降维
　　
　　用于估计自变量或目标的预测因子的数量称为维度。现实世界数据集中的变量数量经常过多。当模型中的变量太多时，过度拟合也是一个问题。实际上，并非所有这些高变量集对目标的贡献都相同，并且在许多情况下，我们实际上可以用较少数量的变量来保存方差。让我们来看看一些最常用的降维模型。
　　
　　1.主成分分析
　　
　　2.TSNE
　　
　　3.SVD
　　
　　5.深度学习
　　
　　深度学习是机器学习的一个分支，专注于神经网络。让我们通过几个主要的基于神经网络架构的深度学习模型：
　　
　　1.多层感知器
　　
　　2.卷积神经网络
　　
　　3.循环神经网络
　　
　　4.玻尔兹曼机
　　
　　5.自动编码器等
　　
　　6.哪种型号最好？
　　
　　我们讨论了上述各种机器学习模型的概念。现在出现了一个明显的问题：“这些模型中哪个是最好的？”这取决于当前情况以及其他因素，例如异常值、可访问数据量、数据质量、特征设计等。实际上，通常最好从适合问题的最简单模型开始，并通过彻底的参数调整和交叉验证逐步提高复杂性。在数据科学领域，有句谚语说：“交叉验证比领域专业知识更可靠。”
　　
　　编辑：Harris

JIFANG360.com - 机房360

哪种机器学习模型最好？