网站首页

产品中心

智能终端处理器 智能云服务器 软件开发环境

新闻中心

关于完美体育

公司概况 核心优势 核心团队 发展历程

联系完美体育

官方微信 官方微博
主页 > 新闻中心

概念完美体育篇-什么是人工智能?机器学习?深度学习

发布时间:2023-12-24 18:53浏览次数: 来源于:网络

  完美体育近些年,人工智能这个词热火的,与人工智能相关的机器学习、深度学习、神经网络等词大家肯定也都听过,但它们之间的联系和区别是什么?本文就对机器学习行业相关概念进行讲解,主要采用自问自答的方式进行。

  算法是抽象的概念,是解决某个问题的准确而完整的描述,说人话,就是处理事情的办法,比如“怎么把大象装冰箱”这个实际问题,你的算法可以是把大象切成小块,多买几个冰箱,分批把各小块装入冰箱。而我们这里讨论的算法, 一般是对应到计算机实现,算法与程序形成映射,一个算法对应到计算机的逻辑处理代码,是一条条指令,计算机依次运行这些指令,就能完成某种功能,解决某个特定问题。

  1中说到,算法对应到计算机在解决特定问题时执行的一组指令,传统算法是程序员指导计算机如何实现下一步操作的逐步过程;而人工智能算法是计算机可以从以前的结果中“学习”获取到一定的信息,在无需人工干预的情况下执行特定的任务。概念总是抽象的,我们举几个实际的例子加以理解。

  我们把痛苦分为12个等级,1级痛一般是被蚊子叮咬的痛感。2级痛一般是打过麻药后动手术的疼痛。3级痛通常只是一些打情骂俏。4级痛一般都是指父母的打骂。5级痛一般是指巴掌抽打的痛。6级痛指的是由于肠胃疾病引起的痛。7级痛一般是指用棍棒打的痛感。8级痛是指因为各种原因引起的外伤。9级痛是指皮肉之苦。10级痛一般是指造成肢体残疾的疼痛。11级痛是指内脏痛。12级痛是指母亲分娩时的感觉。那当用户随便给出1~12内任意一个数字,我们就可以把数字对应的痛苦描述返回,即把痛苦进行量化打分。由于规则是确定的,仅使用传统if-else算法就能搞定。

  当实际问题变的复杂,我们无法准确地找到其规律,或即使能找到,但实现成本太大,这时,我们可以赋予机器一定的智能,让机器自己去解决问题,经典的问题是波士顿房价问题,波士顿郊区房价与该地区不动产税、一氧化氮浓度、城镇中师生比例、城镇人均犯罪率等共计13个指标相关。波士顿房价数据集有506个样本,每个样本包含13个特征信息以及实际房价,波士顿房价预测问题目标是给定某地区的特征信息,预测该地区房价。诚然,既然房价与这13个指标有关,如果我们确切地知道它们的联系,不管函数f(x)有多复杂,给定13个输入数据,输出房价都是确定的,可计算的,遗憾的是,我们无法准确地找到它们的关系,只能通过给定的数据集去猜”其背后的f(x),说白了就是找规律嘛,线性回归,逻辑回归都可以实现,我们也可以设计神经网络去“学习”这些规律。而找“规律”这个事,是机器自己完成的,人只提供数据,并没有参与其“找规律”的过程。

  区别于传统算法,人工智能是人赋予机器智能,让机器自己解决问题,而不是人“手把手”指导机器解决问题。关于人工智能、机器学习、深度学习三者之间关系,大部分回答是,这三者是集合关系

  既然是集合的关系,机器学习是人工智能的子集,而深度学习又是机器学习的子集,那不免要问个问题,人工智能里非机器学习部分是哪些,机器学习里非深度学习部分又是哪些?既然讨论,我们就来个刨根问底,以下是个人结合行业经验总结:

  人工智能,本质上是人赋予机器智能解决特定问题,包括机器学习和非机器学习

  ,机器在解决问题前,要不要“学习”,从算法分类上,需要“学习”的算有决策树、SVM支持向量机,线性回归、逻辑回归等,这类算法在工作前需要学习”,所谓学习,本质上是参数拟合;当然还有不需要“学习”的算法,上来就可以直接工作,比如K-mean算法,用于聚类,k-近邻算法(KNN)用于分类等。

  ,深度学习只是机器学习的一部分,深度学习是以神经网络为代表的多层感知机,也是近些年较火的,比如卷积神经网,循环神经网络等,2015年打败天下无敌围棋手的阿尔法狗,就是基于深度学习的蒙特卡洛搜索算法;非深度学习部分,如遗传算法、决策树、支持向量机等,算法在工作前也需要一定时间的参数迭代,但算法的结构,较深度学习模型有很大的不同,它们并不是像深度学习一样通过不断加深网络结构来能解决更复杂的问题,而是有自己独特的结构,例如决策树,其更像是很多if-else分支组成的多叉树,而且决策树中通过计算熵值,实现了更科学的树分支生长过程,而不是深度学习中的BP算法。

  其实机器学习这个大集合中,与深度学习并列的还有一个相当重要的领域,那就是强化学习,

  强化学习是以马尔可夫、蒙特卡洛搜索为理论基础的一套机器学习理论,其核心点是智能体、状态、环境、动作等,如果说深度学习擅长处理分类、回归、生成等问题,那强化学习擅长处理实时决策、动态交互等,比如下围棋、打游、开车等,这些都是实时性较强且需要依靠对环境做感知处理的任务。

  其实不管是人工智能,还是其子集机器学习、深度学习、强化学习,它们都是为了解决某个/某些特定任务而存在的,这些任务无外乎是分类、回归、降维、聚类四大基本问题。下面具体讨论下每个问题。

  分类从数学角度描述是建立m维输入到n维输出之间的离散映射,我们举机器学习西瓜书中的例子,我们通过观察一个西瓜的⾊泽、根蒂、敲声、纹理、脐部、触感、密度、含糖率这8个属性来判断它是好瓜还是坏瓜,输入是8维向量,输出为2维向量(好或不好,对应1和0),以下是部分西瓜的属性及好坏瓜真值:

  我们看到,输出只有两个离散的选择,0或1,没有0.3,0.8这种连续的数值。

  我们的分类问题就是处理类似于根据西瓜属性判断好坏瓜此类问题,今天让你判断好坏瓜,明天让你判断一张图片里是猫还是狗,它们都是分类问题范畴。

  回归问题与分类有一定的相似性,区别就是回归问题的输出是连续的,不是离散的,回归问题从数学角度描述是建立m维输入到n维输出之间的连续映射。同样地,举个糖尿病的问题,研究发现,糖尿病的发病与自身10个生理参数密切相关,它们是

  diabetes 是一个关于糖尿病的数据集, 该数据集包括442个病人的生理数据及一年以后的病情发展情况。这442份数据是真实实验结果,那回归的问题就是,对于一份新的样本(病人提供他的10个生理指标),我们要预测其一年后血糖数值,这个数值是一个连续的浮点数,这也是回归与分类的区别,分类给出的是离散结果,回归是通过拟合给定数据集,预测给定样本某一项未知结果。

  现实现世的数据存在很大的冗余,如果不进行任何预处理就拿过来用,计算量大,复杂性高,不利于操作,而降维就是对输入数据做提取,高度抽象化的过程。我们以MNIST数字手写体为例,MNIST数字手写体是一张28x28像素的黑白图片,用于表示数字0到9,每一张图片使用了28*28=784个点,却只传递了数字0~9这10个信息,可以,图片中大量像素点之间存在冗余,说白了就是我扣掉其中某些像素点并不影响对数字结果的识别,这些可有可无的像素点就是冗余信息,而降维就是如何高度有效地找到冗余信息并,去粗留精,实现数据压缩的算法。

  俗话说,物以类聚人以群分,给定一批样本,我们如何从其不同属性中找相似点,把相似的样本放到一起,这就是聚类要处理的问题,可能有小伙伴就抬杠了,这不是分类么,怎么又聚类了呢,不错,聚类确实有分类的那么个意思,但区别还是有的,首先,我们的分类标签可以不数字化,另外,有时我们聚类结果总个数都是未知的,一个班56个学生,你可以简单地把他们分成好学生”、“差学生”,还可以分成“优秀学生”、“中上等学生”、“中等学生”、“中下等学生”、“学渣”,或者在你拿到这些学生样本前,你并不知道分成2类好还是5类好,分成2类太粗糙了,不同学生之间好多细节属于其实差别还是挺大的;分成5类的刚刚好,分成7类的话,就太过详细了,那问题来了,有没有最优分类个数,比如分成4类恰到好处?以上问题都是聚类要解决的。

  本文概念较多,为了便于理解,穿插了一些小例子。本文属于机器学习专栏入门理解性文章,后续会陆续更新各个具体的算法,先数学推导,再代码实现,由浅入深,全面讲透各知识点,大家记得持续关注收藏哦

下一篇:人工智完美体育能简史
上一篇:完美体育窦德景:国内大模型达到GPT-35水平与GPT-4技术差距在缩小

咨询我们

输入您的疑问及需求发送邮箱给我们