机器学习与人工智能、深度学习有什么关系?终于有人讲明白了

图灵汇官网

导读

“机器学习”、“人工智能”和“深度学习”这三个概念经常被人们混淆。实际上,它们各自有着不同的起源和发展阶段。“人工智能”诞生于20世纪50年代,“机器学习”出现在20世纪80年代,而“深度学习”则是近年来兴起的技术。这三者之间存在包含与被包含的关系,如图1-1所示。

机器学习与人工智能

“人工智能”这一术语最早出现在1956年的达特茅斯会议上。当时,人工智能领域的先驱们致力于开发具备人类智能特征的软硬件系统,即所谓的“通用人工智能”。尽管这类系统在科幻电影中大放异彩,例如《星球大战》中的C-3PO机器人,但至今为止,实现这种高级推理和思考的能力依然困难重重。因此,目前较为实际的应用属于“广义的人工智能”,如人脸识别等。

机器学习是一种实现人工智能的方法。它基于已有数据、知识或经验,自动识别有意义的模式。机器学习算法通过对数据的学习,进而做出决策或预测。这种方式使得机器学习区别于传统的软件或程序,后者通常需要程序员逐行编写代码来指定行为。

在机器学习的过程中,算法会从数据中学习并做出决策,而不是由人工指导。这意味着机器学习的结果是非确定性的,通常以概率形式呈现,比如80%的可能性是晴天。相比之下,传统的程序需要明确的指令,决策的主体是程序员而非机器本身。

机器学习与深度学习

深度学习利用多层(通常超过五层)人工神经网络来学习数据内部的复杂关系。人工神经网络的灵感来源于生物学和认知科学,早在早期的机器学习中就被采用。随着现代超级计算机的发展,深度学习得以验证其多层网络结构的有效性。Geoffrey Hinton因其在深度学习领域的贡献被誉为该领域的奠基人之一,并与Yoshua Bengio、Yann LeCun共同获得2018年图灵奖。

深度学习可以被视为机器学习的一个分支,专门处理多层神经网络。与之相比,过去只有单层或少数几层的神经网络被称为浅层学习。

机器学习与统计学、大数据及数据科学

机器学习与统计学密切相关,二者都是从数据中得出结论。统计学通常在数据分布假设的基础上进行参数化求解,同时考虑样本量无限增大时的统计估计问题;而机器学习则尽量减少对数据分布的假设,更多依赖算法来学习接近数据生成模型的方法,并关注有限样本下的学习性能。

机器学习与大数据的关系也非常紧密。当提到大数据时,需要根据上下文理解其具体含义。如果是从技术角度看,大数据通常指数据的存储、分析、处理和计算的技术,难点在于分布式系统的设计;而在业务角度,则是指基于数据的分析、挖掘和运营策略。在很多情况下,是否拥有真正意义上的大数据取决于具体的应用场景。

机器学习所需的数据量通常非常庞大,这些数据通常存储在大数据平台或系统中,这说明机器学习离不开大数据的支持。此外,大数据(及其处理能力)也是传统数据分析建模转向机器学习和深度学习的关键因素。

结语

机器学习与数据科学之间的联系也非常紧密。数据科学涵盖了从数据采集到应用的全过程,包括数据工程、数据可视化、数据集成与ETL、商业智能、数据产品等多个方面。数据科学的范围比机器学习更广泛。

以上是对机器学习与相关领域关系的概述。希望这些信息能为读者提供一定的启示和帮助。

本文来源: 图灵汇 文章作者: 手机圈