什么是机器学习？ – 终极指南

已发表: 2020-12-31

您是否知道 82% 的营销专家正在使用人工智能和机器学习来增强其定制技术的各个方面？在本文中，我们将阐述您需要了解的有关 ML 的所有信息。享受！

在这篇文章中

机器学习定义
机器学习的工作原理
机器学习的重要性
为什么要使用机器学习
机器学习的应用
机器学习类型
机器学习技术
机器学习的例子
机器学习的优点和缺点
机器学习的未来
机器学习的趋势

什么是机器学习

机器学习是人工智能的一门学科，专注于开发应用程序，以提高其准确性并随着时间的推移从经验中学习，而无需任何人工编程指导他们这样做。机器学习应用程序从数据中学习，以便随着时间的推移提高其预测准确性或决策制定。

在机器学习中，“教授”算法如何识别大量数据中的特征和模式，以便根据新数据做出预测和决策。算法的质量将决定在分析额外数据时预测和决策将变得更加准确。

机器学习如何工作？

开发 ML 模型或应用程序基本上有 4 个步骤。他们是：

第 1 步：选择并安排您的训练数据集

教学数据是一个数据集，代表机器学习应用程序要摄取的信息，以解决构建到固定的挑战。在某些情况下，教学数据是标记数据——旨在选择模型必须识别的分类和特征。其他数据集未标记；因此，该模型将删除这些特征并自行分配分类。

尽管如此，必须充分准备教学数据并扫描可能影响培训的异常或错误。它应分为 2 个子集：教学子集，用于教授模型，分析子集，用于评估和增强模型。

第二步：选择一种算法对教学数据集进行操作

算法的类型由类型（标记或未标记）、教学数据中的数据量以及要解决的问题类型决定。以下是标记数据时要使用的常见 ML 算法类型：

衰退算法（例如线性和逻辑回归，以及支持向量机）。
决策树
基于实例的算法
未标记的数据使用以下算法：
聚类算法
关联算法
神经网络

第 3 步：教授算法以构建应用程序

教授算法是一个关键过程，通过算法涉及操作变量，在输出和它应该产生的结果之间进行比较，调整算法中可能产生更准确结果的偏差和权重，并再次测试变量直到算法在大多数情况下都能提供期望的结果。最终经过训练的精确算法是机器学习应用程序。

第 4 步：利用和改进应用程序

最后一步是使用带有新数据的应用程序，以便随着时间的推移提高有效性和准确性。新数据的来源将取决于要解决的问题。例如，为检测垃圾邮件而构建的机器学习应用程序将接收电子邮件，但运行机器人吸尘器的机器学习应用程序将使用与房间中新物体或移动家具的真实交互产生的数据

为什么机器学习很重要

由于可用数据种类和数量的增加、可负担的数据存储以及更强大、更便宜的计算处理等因素，人们对机器学习的兴趣正在重新燃起。

所有这些因素使得自动快速创建应用程序成为可能，这些应用程序可以处理更大、更复杂的数据并产生更快、更准确的结果——即使规模更大。通过开发准确的应用程序，公司可以更好地发现有利可图的机会和/或避免隐藏的风险。

机器学习的用途

如前所述，机器学习无处不在。以下是您每天可能会遇到的一些用例：

金融服务
金融和银行业的许多企业将 ML 用于两个主要目的：识别数据中的关键见解并防止欺诈行为。这些重要见解有助于识别有利可图的投资机会，或帮助投资者了解最佳交易时间。数据挖掘还有助于使用网络监视来指示网络欺诈的警告信号或识别高风险客户。

政府
公用事业和公共安全等政府机构对 ML 有特殊需求，因为它们拥有大量数据源，可以通过挖掘获得洞察力。例如，分析传感器数据提供了提高效率和节省资金的方法。政府还可以使用机器学习来检测欺诈并减少身份盗用。

卫生保健
在 ML 快速增长的趋势中，医疗保健行业并没有被排除在外。该行业现在使用可穿戴传感器和设备，可以利用数据实时检查患者的健康状况。 机器学习还可以导致技术的出现，该技术将帮助医学专家评估数据以检测可能导致更好治疗或诊断的危险信号或模式。

油和气
该领域的机器学习用例数量巨大。从发现新能源、检查地下矿物、预测炼油厂传感器故障，到简化石油分配以提高成本效益和效率——用例很多，而且还在不断扩大。

机器学习应用

机器学习算法用于需要解决方案来促进部署后改进的情况。 ML 算法和模型的应用是通用的，并且可以在适当的条件下用作普通技能人力的替代方案。例如，称为聊天机器人的自然语言处理机器语言已经取代了大型 B2C 公司的客户服务管理员。这些聊天机器人能够评估客户查询并为人工客户协助管理员提供支持或直接与客户互动。

此外，机器学习算法用于帮助增强在线平台的定制和用户体验。亚马逊、谷歌、Netflix 和 Facebook 都利用推荐系统来消除内容过剩，并根据每个用户喜欢和不喜欢的东西向他们提供个性化的内容。

机器学习的类型

监督学习算法
这些类型是通过使用标记示例来教授的。监督学习使用机器学习技术，如预测、回归和分类，来识别预测额外未标记数据上的标签值的模式。监督学习通常用于过去数据预测未来可能发生的突发事件的系统中。

无监督学习算法
这些类型用于没有过去标签的数据。该应用程序没有给出“正确答案”。它必须确定自己正在显示什么。目的是探索数据并确定其中的一些模式。这种类型在交易数据上表现出色。

强化学习算法
这种类型通常用于导航、游戏和机器人技术。通过反复试验，它允许算法发现哪些动作产生最高的奖励。强化学习有 3 个主要组成部分：代理（决策马来语或学习者）、环境（代理与之通信的任何东西）和动作（代理的能力——它能做什么）。

机器学习技术

大约有 10 种机器学习技术，它们提供了一个概述——以及在您掌握 ML 技能和知识时可以继续构建的构建块。他们是：

回归
分类
聚类
降维
集成方法
神经网络和深度学习
迁移学习
强化学习
自然语言处理
词嵌入

（另请阅读：专家应该知道的机器学习算法列表）

机器学习示例

在这个高度现代化的世界中，我们周围有几个 ML 的例子。一些最常见的例子包括：

垃圾邮件检测器可阻止不需要的电子邮件进入我们的收件箱
当我们把时间花在更好的事情上时，机器人会吸尘
网站会根据我们之前听过、看过或购买过的内容来推荐歌曲、电影和产品。
数字助理搜索互联网，响应我们的命令，并播放歌曲。
医学图像评估系统帮助医生检测他们没有注意到的肿瘤。
第一批自动驾驶汽车正在上路。

机器学习的优势

数字助理：Google Assistant、Amazon Alexa、Apple Siri 和其他 NLP 驱动的数字助理有助于推动语音识别和语音转文本软件。
推荐：机器学习推动 Spotify、Netflix、亚马逊和其他求职、娱乐、旅游、新闻和零售服务提供的个性化推荐。

其他好处是：

欺诈识别
聊天机器人
网络安全
医学影像分析
自动驾驶汽车
上下文在线广告

（另请阅读：企业 CMO 应该知道机器学习的好处）

机器学习挑战

以下是当今专家面临的一些挑战：

数据采集
训练数据量不足
非代表性训练数据
数据质量差
ML 模型中不必要的特征
模型的离线训练和实现
负担能力
耗时的部署
数据安全和不可访问的数据
测试和实验的基础设施需求

机器学习的未来

毫无疑问，机器学习的未来非常光明。据预测，几种生物识别技术将与 ML 集成，以实现全面的安全解决方案。由于人工智能技术的进步，多模态生物特征识别将在不久的将来实现。

机器学习趋势

人工智能驱动的生物识别安全解决方案
生物特征验证取得了重大进展。这是一种新兴的机器学习趋势，你应该注意。生物识别机器学习应用的一个例子是亚马逊的 Alexa。该软件现在可以通过将说话者与预定语音配置文件进行比较来区分不同说话者的声音。

对话式人工智能
整个 2019 年和 2020 年，人工智能已经发展到现在能够在写作等日常活动方面与人类认知竞争的水平。例如，OpenAI 的研究人员报告说，他们基于 AI 的文本创建者可以创建逼真的文章、诗歌和故事。

其他机器学习趋势是：

可解释的人工智能
人工智能对抗 COVID-19
商业预测中的人工智能分析
自动化机器学习

最后的想法

总之，有必要了解如何将最佳算法与正确的流程和工具相结合，以从中获得最大价值。通过在其业务流程中部署 ML，跨多个行业的企业可以获得很多好处。

其他有用的资源：

深度学习与机器学习：区别

数据科学与机器学习：有什么区别？

人工智能与机器学习之间的区别

机器学习如何改善业务流程