网站首页

产品中心

智能终端处理器 智能云服务器 软件开发环境

新闻中心

关于完美体育

公司概况 核心优势 核心团队 发展历程

联系完美体育

官方微信 官方微博
主页 > 新闻中心

完美体育人工智能概览

发布时间:2023-12-19 00:45浏览次数: 来源于:网络

  250多年以来,驱动经济增长的根本动力是技术创新,其中最重要的创新即经济学家所谓的通用技术,包括蒸汽机、电力和内燃机等。在这些技术之后,补充性创新和机会大量涌现。举例来说,内燃机问世后,汽车、卡车、飞机、链锯、剪草机,以及大型零售商、购物中心、交叉配货仓库、新供应链,甚至包括郊区的概念都相继出现。沃尔玛、UPS和优步等多元化公司利用该技术,创建新的商业盈利模式。

  我们这个时代最重要的通用技术是人工智能,特别是机器学习技术(ML)——机器不需要人类对所担负任务作出明确指令,有能力自主提升表现。过去几年中,机器学习的效率和普及程度显著提高。我们现在可以开发能够自主完成任务的系统了。

  为什么这件事意义重大呢?原因有两个。首先,人类所知胜于其所能言:我们无法准确说明很多任务的操作过程,从人脸识别到亚洲传统策略游戏围棋。在开发ML之前,我们还不能清楚解释自身所具备的知识,所以多项任务都不能实现自动化。但现在我们有能力了。

  其次,ML系统往往是出色的学生,在多种活动中都有超越人类表现,比如侦查欺诈交易和监测疾病。“优秀”的数字ML系统在经济的层层面面中都得到应用,未来影响不可小觑。

  人工智能(AI)将在商业领域中产生巨大影响,在极大程度上扩大早前多个通用技术的应用规模。虽然现在全球数千家公司已经在应用人工智能,但绝大多数重要机会尚未发掘。人工智能的影响在接下来的10年中不断放大,制造、零售、交通、金融、医疗、法律、广告、保险、娱乐、教育及几乎所有其他行业都会改革核心流程和商业模式,从而搭上机器学习的顺风车。现在,瓶颈出现在管理、执行和商业想象力方面。

  然而AI像很多新技术一样,也让人们产生多种不切实际的期望。我们看到不少商业计划书随随便便提到机器学习、神经网络和其他技术,但和这些技术的实际能力并没有多大关联。比如,仅仅称一个约会网站“受AI驱动”,该网站不会因此变得更有效(但可能获得筹款)。本文求真务实,旨在描述AI的真正潜力、实际应用和阻碍其应用的障碍。

  达特茅斯大学数学教授约翰·麦卡锡(John McCarthy)于1955年首次使用“人工智能”一词,次年他就该话题组织了一次意义深远的会议。自此以后,关于人工智能的大胆假设和宣言层出不穷,可能部分原因是这个名字让人们浮想联翩。经济学家赫伯特·西蒙(Herbert Simon)1957年预测,计算机将在未来10年内打败人类国际象棋棋手,但实际上计算机用了40年时间。认知科学家马文·明斯基(Marvin Minsky)1967年说:“‘人工智能’的创建问题将在下一代基本得到解决。”西蒙和明斯基都是才智超群的人,但他们的预言大错特错。所以,这些对未来重大突破的大胆假设遭到质疑,也在情理之中。

  我们先来看一下AI现在做的事及其进步速度。最大的进步出现在以下两大领域:感知和认知。前一类别中出现的一些重大实践进展与说话有关。虽然语音识别仍有很大改善空间,但数百万人都在使用该功能,相关应用比如Siri、Alexa和谷歌助手。你正在读的文字最开始是口述给计算机,然后计算机提供足够准确的速记稿,比打字速度更快。斯坦福计算机科学家刘哲明(James Landay)及同事发现,语音识别现在比手机打字平均大约快3倍。误差率也从之前的8.5%下降到4.9%。令人震惊的是,这一显著改进在过去10年中都没有出现,仅仅在2016年夏才有突破。

  图像识别也有显著提升。你可能已经注意到,Facebook和其他应用软件如今能认出你所上传照片中很多朋友的脸,并提示你标出他们的名字。你的智能手机上运行的应用软件几乎可以识别出野外所有的鸟类。图像识别甚至取代了公司总部的身份证件。自动驾驶汽车使用的视觉系统等类似软件,此前识别行人时每30帧错误一次(这些系统中的相机每秒大概记录30帧),现在误差率骤降,低于每3000万帧一次。大型数据库ImageNet识别数百万张普通、模糊或离奇的图像,最优系统的误差率在2010年为30%多,2016年时降到了约4%。(见边栏《小狗还是松饼》)

  近几年来,基于大型或“深度”神经网络的新方法得到应用后,人工智能改进速度再次加快。尽管视觉系统的ML能力依然问题重重,但人类的表现也不稳定。他们也不能迅速识别小狗脸,甚至有时还会在没有图像的地方看到小狗的可爱小脸,这真是尴尬。

  第二类重大突破是认知和问题解决能力的提升。机器已经打败了最优秀的人类扑克牌和围棋选手,虽然专家曾预言这一成就起码还要再等上10年才能实现。谷歌的DeepMind团队利用ML系统,在人类专家对系统的优化基础之上,将数据中心的冷却效率进一步提高15%以上。网络安全公司Deep Instinct和PayPal分别利用智能代理检测恶意代码和防止洗钱。搭载IBM技术的系统将新加坡某保险公司的索赔流程自动化。数据科学平台公司Lumidatum创建的系统还可以提供及时意见,改善客户支持服务。多家公司都利用ML决定执行华尔街的哪项交易,更多信贷决策都会借助于ML。亚马逊用ML优化库存,提高给客户产品推荐的准确率。Infinite Analytics开发的ML系统能够预测用户是否愿意点击某个广告,从而帮助某全球消费性包装品公司提高线上广告投放精准度。该公司开发的另一ML系统,帮助某快消品公司改善巴西在线零售商网站的客户搜索和发现流程。前一个系统将广告ROI提高了3倍,后者将公司年收入提高了1.25亿美元。

  机器学习系统不仅正在取代多个应用软件中的传统算法,还在很多人类曾经最擅长的任务中有更优秀的表现。虽然这些系统还远远谈不上完美,但在ImageNet数据库中5%的误差率已经和人类的表现持平,甚至更优异。即使在喧闹环境中,语音识别现也能和人类有近乎持平的表现。系统到达这一水平后,就会为工作场所和经济改革开启无数新的可能性。一旦基于AI的系统在某项任务中超越人类,就有很大可能迅速得到大规模应用。比如制造无人机的Aptonomy和制造机器人的Sanbot正使用升级后的视觉系统,将多数安保工作自动化。软件公司Affectiva正用这些系统识别焦点小组中快乐、惊讶和生气等情绪。深度学习初创公司Enlitic使用视觉系统扫描医学图像,辅助癌症诊断。

  以上都是AI系统的杰出成就,但其应用领域依然有限。比如,这些系统在ImageNet数据库上表现出色,能识别出上百万张图像,但并不代表它们“在自然环境下”也能有同样优秀的表现,因为照明条件、角度、图片清晰度和背景可能非常不同。此外,我们赞叹这些能够理解中文演讲,并将之翻译成英文的系统,但并不期望这类系统知道某个特定汉字的意义,更不用提在北京哪里吃饭了。我们会很自然地认为,在某项任务中表现良好的人也会在相关任务中展现同等实力。但ML系统只得到特定任务的培训,还不能举一反三。人们错误地以为,计算机能够不断扩展自己相对狭隘的知识面——这可能是他们现在困惑不已的原因,也是他们夸大AI进步程度的根本原因。现在的机器还远远不能在多个领域中表现出通才。

  我们最应该了解ML的一点是,ML代表与传统方法截然不同的软件制作方式:机器从实例中学习,而非针对某个目标,提前设定好编程。这和传统做法有很大区别。在过去50年中,信息技术的进步和应用主要是将既有知识和程序编成代码并录入机器。实际上,“编程”这个词指的就是程序员费尽心思,将脑中知识转化成机器可以理解和执行形式的过程。这种方式有个致命缺点:我们具备的多数知识都是不可言喻的,也就是说我们无法解释清楚这些知识的内容和获取方式。我们总结不出学习骑自行车,或识别朋友脸部特征的方式,也不可能写下来给其他人做借鉴。

  换句话说,人类所知远胜于其所能言传。哲学家兼博学家迈克尔·波拉尼(Michael Polanyi)于1964年首次阐释了这一重要课题,被后世称为波拉尼悖论(Polanyi’s Paradox)。该理念不仅界定了我们能够阐释的知识,还在历史上首次严格限制了我们赋予机器智能的能力。波拉尼悖论在很长时间内限制了机器在经济领域中的工作范围。

  机器学习正在突破这些局限。在第二机器时代的第二次浪潮中,人类制造的机器正在从实例中学习,并用结构性反馈自主解决问题,比如波拉尼认为机器不可能克服的人脸识别问题。

  人工智能和机器学习的形式多种多样,但近年来多数成功案例都属于同一类别:监督学习系统(supervised learning systems),即机器会得到大量有正确答案的实例,并利用实例解决特定问题。该流程一般是把一组输入信息映射到输出组中。比如输入信息可能是多种动物的图片,那么正确的输出就是这些动物的名称:狗、猫、马。输入信息也可以是音频的不同波段,输出信息则是文字:是、不是、你好、再见。(见边栏《监督学习系统》)

  成功的系统往往会用到包含数千甚至数百万实例的训练数据组,每个数据组都被标记出正确答案。系统接下来可随意查看新实例。如果培训进行顺利,系统就可以预测答案,而且正确率会很高。

  带来以上成就的算法倚赖所谓的“深度学习”方法。深度学习使用神经网络,其算法可以高效利用大型数据组,和早期的ML算法相比有很大优势。随着训练数据中实例的增加,传统系统也会升级,但提升程度有限,之后即使数据增长,预测准确率也不会提高。该领域顶尖专家吴恩达(Andrew Ng)表示,深度神经网络不会陷入这类瓶颈期,相反,数据越多,它们的预测越精确。有些超大型系统的训练实例高达3600万个甚至更多。当然,使用超大型数据组要求你有更高的处理能力,这也是为什么超大型系统往往要在超级计算机,或专业化计算机体系结构上运行。

  如果你手上有海量行为数据并想要预测结果,就极有可能要用到监督学习系统。亚马逊消费者业务主管杰夫·威尔克(Jeff Wilke)称,监督学习系统在很大程度上已经取代了基于记忆的滤波算法,后者曾用于确定个性化客户推荐。在其他案例中,用于确定库存水位和优化供应链的传统算法,已经被基于机器学习的高效稳健系统取代。摩根大通率先采用审查商业贷款合同的系统,曾经需要用36万小时完成的信贷审查工作如今几秒钟就解决了。监督学习系统现在还被用来诊断皮肤癌。这些只是少数几个例子。标记一组数据,并利用这些数据训练监督学习系统相对来说比较简单,所以监督ML系统比“无”监督系统使用更广泛,至少现在是这种情况。无监督学习系统可以自主学习。我们人类就是出色的无监督学习者:我们不用带标签的数据,也能了解世界,比如识别树木。但要开发出用人类方法认知的机器学习系统,就十分困难。

  如果我们可以创建无监督学习系统,就能开启各种可能性,未来成果激动人心。这些机器可以从全新角度研究复杂问题,帮助我们发现疾病传播、市场证券价格浮动、客户购买行为等潜在模式。所以Facebook人工智能研究主管兼纽约大学教授杨立昆(Yann LeCun)将监督学习系统比作蛋糕上的糖霜,无监督学习比作蛋糕本身。

  这一领域中另一不断增长的小板块是“增强学习”(reinforcement learning)。会玩雅达利视频游戏和围棋等棋类游戏的系统就使用“增强学习”方法。该方法还有助于优化数据中心的电力使用,协助制定股市的交易策略。Kindred制造的机器人利用机器学习,整理并辨认从未见过的物体,加快了消费品分销中心的机器抓取与放置流程。程序员在增强学习系统中设定了系统当前状态和目标,列出指定动作并描述限制每个动作的环境因素。系统利用指定动作,分析如何尽最大可能完成目标。如果人类规定好目标,系统就能顺利执行任务;但若没有目标,系统就不知道怎么做了。比如微软使用增强学习挑选MSN网站新闻报道的标题。微软会“奖赏”得分最高,即吸引最多访客点击链接的系统。系统试图按照设计者给它的规则,尽可能得到最多分。这说明增强学习系统可以高效完成明确的目标,但未必能实现你真正关心的目标,比如顾客终身价值。所以你必须明确规定好你的目标。

  现在寻求应用ML的组织有三大利好消息。首先,AI技能普及迅速。从世界范围看,数据科学家和机器学习专家的人数还远远不够,但在线教育资源和大学可以满足对这类人才的需求。Udacity、Coursera、fast.ai等在线培训佼佼者不仅教授入门级概念,还能教聪慧好学的学生创建工业级ML系统。对ML感兴趣的公司除了培训自己的员工外,还可以利用Upwork、Topcoder、Kaggle等在线人才平台寻找有专业证书的ML专家。

  第二大振奋人心的消息是,如今我们可以根据需要,购买或租赁AI必需的算法和硬件。谷歌、亚马逊、微软、赛富时(Salesforce)等公司通过云端搭建强大的ML基础架构。现在这几家公司之间的刀光剑影,意味着未来冀图使用或创建ML的公司将看到更多廉价ML能力出现在市场中。

  最后一条好消息可能得到的重视程度最低,即你也许不需要太多数据,就可以有效利用ML。多数机器学习系统的表现随着所得数据的增多而提升,所以我们似乎有足够理由认为,拥有最多数据的公司是赢家。如果“赢家”意味着“在某一项应用上称霸全球市场,比如广告投放或语音识别应用霸主”,这个结论可能成立。但若成功的定义是将公司表现显著提升,那么获取足够数据的目标就显得微不足道了。

  比如Udacity联合创始人塞巴斯蒂安·特龙(Sebastian Thrun)观察到,他手下一些销售人员回复聊天室查询问题的效率比其他人高。特龙和研究生宰德·伊纳姆(Zayd Enam)意识到,他们的聊天室日志本质上是一组带标签的训练数据,而且正是监督学习系统需要的数据。达成交易的互动被标记为成功,其他则都被标记为失败。宰德利用数据预测,优秀销售人员在回复某常见查询问题时会给出哪些回答,然后将预测结果分享给其他销售人员,鼓励他们提升表现。销售人员经过1000个训练周期,整体效率提高54%,而且每次服务的客户人数翻倍。

  AI初创公司WorkFusion采用了类似的做法。WorkFusion与其他公司合作,将国际发票开具和金融机构大型交易处理等后台流程的自动化水平提高。这些流程之所以还未实现自动化,原因在于流程本身过于复杂,而且相关信息不一定每次都相同(“我们怎么知道他们说的是哪种货币?”),必须有一些解释和判断。WorkFusion的软件在后台观察正在作业的员工,将他们的动作变成数据,用于分类认知(“这张发票使用的货币是美元,那张是日元,还有一张是欧元”)。系统对自身分类足够自信后,就会掌控整个流程。

  机器学习正从三个层面上驱动改革:任务和职业层面、商业流程层面和商业模式层面。任务和职业层面改革的案例是,机器视觉系统被用来确定潜在癌细胞,放射科医生从此有更多时间研究真正紧急的病例、与病人交流、和其他医生协作。另一个流程改革例子是,亚马逊运营中心引入机器人,优化基于机器学习的算法后,其工作流和布局彻底改变。我们须反思商业模式,利用ML系统为客户提供个性化的音乐或电影智能推荐。更好的模式不是基于消费者选择售卖固定歌曲,而是收取个性化电台的会员费。这类电台预测并播放会员喜爱的音乐,即便他本人可能从来没有听过这些歌。

  注意,机器学习系统仍不能完全取代工作、流程或商业模式。这些系统会辅助人类,这也彰显了其价值。新分工形式的最有效准则肯定不是“将所有任务都交给机器”。相反,这意味着原本需要10步才能成功完成的流程,现在其中一两步可以自动化,而人类完成其他更有价值的步骤。比如Udacity的聊天室销售支持系统没有创建负责所有聊天任务的机器人程序,其ML系统只是为人类销售人员提供提高绩效的建议。人类依旧掌控大局,但效率大大提升。相比设计能够为人类做所有事的机器,这一方式要可行性更大。新分工形式下,人类的工作效率和质量都会提升,而客户也会享受到更佳成果。

  只有做好全面的创新和规划,才能将设计和执行技术、人类技能和资本资产的结合起来,设计出全新的组合并投入使用,进而满足客户需求。创新和规划是机器不太擅长的任务,也是创业家或业务经理成为ML时代最有价值社会职业的原因。

  第二机器时代的第二次浪潮带来了新风险,特别是机器学习系统的“可解释性”往往很低;也就是说,人们很难了解这些系统的决策过程。深度神经网络可能有数亿个连接点,每个连接点都促成了最终决策。所以机器学习系统的预测很难用简单、明晰的语言解释清楚。机器和人类不同;它们还不能绘声绘色地讲故事。机器通常不能阐释某求职者获得职位或被拒的原因,或为何推荐某类药物。虽然我们已经开始克服波拉尼悖论,但如今我们面临与之恰恰相反的悖论:机器所知胜于其所能言传。

  三大风险接踵而来。首先,机器可能抱有隐性偏见;其偏见并非设计者有意为之,但用于培训系统的数据为偏见提供了温床。举例来说,如果系统基于人类招聘人员过去所做决定,判断哪些职位申请者可被录取,就会无意间继续扩散人类对求职者种族、性别、民族等其他偏见。这些偏见可能不会变成明文规定,但会在交流中,和其他数千种因素一样影响到录取决定。

  第二个风险是,神经网络系统不同于基于明确逻辑规则的传统系统;这类系统处理统计数据,而非事实数据。所以要想百分之百证明这类系统适用于所有情形(特别是培训数据中没有涵盖的情形),难度可能较大。负责重大决策的应用软件(比如控制核电站或涉及处理攸关生死的决定)如果不能证明其可靠性,后果令人担忧。

  第三,ML系统难免会犯错,但我们很难发现出错的地方并做出精确调整。解决方案背后的结构可能出乎想象地复杂;如果系统接受培训的环境改变,解决方案还可能出错。

  尽管以上风险真实存在,但衡量风险的准则不是力求完美,而是选择最优替代方案。毕竟人类也有偏见、会犯错误,也不知道如何阐明自己的决策过程。机器系统的优势在于,它们不断改进;只要得到的数据不变,它们给出的回答也不变。

  这是否意味着人工智能和机器学习的能力可以无限开发?感知和认知涵盖的领域极其之广,从汽车驾驶到销量预测,再到雇佣和升职决定。我们认为,AI在多数或以上全部领域中的表现很可能在不久的未来超越人类。所以未来还有什么AI和ML做不到的?

  我们会听到有人说“人工智能太死板、不通人情,永远都不能评估情绪化、狡猾奸诈、反复无常的人类。”我们不同意这一说法。情绪识别公司Affectiva的ML系统和其他类似应用,已经可以基于个人说话语气或面部表情,判断其情感状态,而且表现不亚于人类,甚至更好。其他系统甚至可以在“一对一无限注得州扑克”(Heads-up No-limit Texas Holdem)游戏中,推断出世界上最好的扑克牌选手是否在虚张声势,进而打败他们。准确阅读人类是项微妙的工作,但并非魔法。这种阅读需要感知和认知,而这两者就是ML的强项,而且正变得越来越强。

  谈到AI的局限,就不得不说下巴勃罗·毕加索(Pablo Picasso)对计算机的观察:“它们一无是处,只能给你答案。”ML近期的成功说明,计算机远非“一无是处”,但毕加索的看法依然给了我们一些洞见。计算机只能回答问题,不能提问题。所以创业家、创新者、科学家、创作者和其他能够分析出待解决问题、待发掘机会或待探索领域的人才,仍将是未来的中流砥柱。

  同样,被动评估某个人精神状态或积极性,与主动引领他们改变之间,有本质区别。ML系统越来越擅长评估,但改变方面仍旧被我们远远甩在身后。我们人类是群居动物,最擅长煽动强烈的社会情绪,比如同情、骄傲、团结和羞耻等,说服、激励和鼓舞其他人。TED大会和XPrize基金会2014年为“首位登上这一舞台、发表TED演讲并获得观众起立鼓掌的人工智能”颁奖。我们怀疑这一奖杯很快又要被领走。

  我们认为,ML强势开启新时代后,人工智能最大、最重要的机遇出现在以下两大能力的交叉处:找到待解决的问题,以及说服很多人解决该问题并就解决方案达成一致。这也是对领导力的恰当定义,而领导力的重要性在第二机器时代与日俱增。

  人类和机器的分工正发生剧变。坚持当前分工形式的公司将失去越来越多竞争优势,但有的公司愿意在恰当地方应用ML,也知道如何将ML与人类能力进行有效结合——这些公司将在竞争中占有更大主动权。

  随着技术的进步,一场触及商业基础结构的改革已经开始。和蒸汽和电气时代一样,获得新技术甚至尖端技术并不能让竞争者脱颖而出。恰恰相反,思想开明、透过现象看到未来新发展路线,并付诸实践的创新者才是赢家。机器学习最大的贡献之一,可能就是创造了新一代商界领袖。

  在我们看来,人工智能,特别是机器学习是我们这个时代最重要的通用技术。这些创新对商业和经济的影响不仅体现在其直接贡献上,还表现在激发补充性创新的能力上。随着视觉系统、语音识别、智能问题解决和其他很多机器学习带来的能力不断成熟,新产品和流程正在大量涌现。

  有些专家甚至有更深刻的洞见。丰田研究所负责人吉尔·普拉特(Gil Pratt)将现在的AI技术潮流比作5亿年前的寒武纪生命大爆发。和那时一样,现在的关键新能力之一也是预见力。动物初次获得这种能力后,能够更有效地探索环境,而这会刺激物种种类(捕食者和猎物都涵盖在内)和生态位范围的迅猛扩张。我们今天也期望看到更多产品、服务、流程和组织形式涌现或者消亡。意料之外的成功和不可思议的失败都会出现在这个时代。

  虽然我们很难准确预测哪些公司会在新环境中称霸,但有一条原则明显具有普适性:最敏捷、适应力最强的公司和高管将崭露头角。能够迅速感知并抓住机会的组织将在AI的天下占领高地。所以,要想取得成功,你必须愿意实验、快速学习。如果管理者不加大在机器学习领域的实验力度,就是不尽职的领导。虽然AI还不能在下一个10年中取代管理者,但使用AI的管理者将取代其他管理者。

  埃里克·布林约尔松((@erikbryn)是麻省理工学院斯隆商学院“许塞尔家族”管理学教席教授兼数字商务中心院长,也是美国国家经济研究局研究员。他主要研究信息技术对商业战略的影响、生产率和绩效、数字商务和无形资产。他在麻省理工学院教授信息经济学和分析实验室课程。

  布林约尔松评估IT产能贡献,以及组织资本和其他无形资产的补充性作用,是这方面研究的先驱之一。他的研究首次量化了网络产品多样化价值,即众所周知的“长尾”,并开发了信息商品的定价和捆绑模式。他获得哈佛大学应用数学和决策科学学士和硕士学位,斯隆商学院管理经济学博士学位。

  布林约尔松著有多部书,其中包括和安德鲁·麦卡菲合著的两本书:2017年出版的《机器、平台、群众:掌控我们的数字未来》、2014年出版的《》畅销书《第二个机器时代:先进科技时代的人类工作、进步和社会繁荣》。

  安德鲁·麦卡菲((@amcafee)是麻省理工学院首席研究科学家。他研究数据技术如何改变商业、经济和社会。麦卡菲和埃里克·布林约尔松合著《机器、平台、群众:掌控我们的数字未来》(2017年出版)和《第二个机器时代:先进科技时代的人类工作、进步和社会繁荣》(2014年出版)。《第二个机器时代》是《》畅销书,并入围《金融时报》和麦肯锡年度最佳商业图书奖名单。麦卡菲发表学术论文,为《金融时报》撰写博客,并给《哈佛商业评论》《经济学人》《华尔街日报》《》等杂志报刊投稿。他曾在《查理罗斯秀》和《60分钟》中介绍其研究,也曾登上TED,并在达沃斯和阿斯彭思想节论坛上向众多观众发表演讲。

  麦卡菲曾就读于哈佛和麻省理工学院,他是麻省理工学院数字商务中心创始人之一。完美体育

下一篇:揭秘未来人工智能技术的五完美体育大发展趋势
上一篇:2023人工智能与机器人教育论坛成功举办完美体育

咨询我们

输入您的疑问及需求发送邮箱给我们