当前位置: > 文章中心 > 纵论天下 > 网友杂谈

人工智能是共产主义的春天吗?(上)

2019-03-04 16:47:30  来源:激流1921  作者:载言
点击:    评论: (查看)

  导语:自从2016年AlphaGo围棋AI击败李世石,世界又掀起了一轮人工智能浪潮,公众视野对于人工智能的讨论不绝于耳,高等院校的人工智能研究院相继成立,与人工智能有关的商业项目雨后春笋搬出现,并在一些领域进入到人们的生活当中。

  与此同时,有关人工智能的社会影响的讨论也一直没有停止。有人认为,人工智能会在近几年大规模取代人类劳动,并在有生之年替代人类;但也有人认为,人工智能现在只是资本炒作的噱头,并没有取得过多实质进展。有人认为,人工智能会加剧垄断集中,国家甚至会依靠人工智能实现法西斯式的统治,但也有人认为,人工智能是资本主义的丧钟和共产主义的春天。还有人认为,人工智能会导致社会阶级结构的变化,比如产业工人减少和脑力无产者增加。

  对这些问题的争论,离不开对当前人工智能发展现状的认识。事实上,算上近几年,人工智能有三次浪潮,第一次浪潮实现了基于规则的简单推理,第二次浪潮是基于数据的机器学习及简单决策,本次浪潮是在深度学习的基础上众多决策领域的突破。每一次浪潮,都有上述问题的广泛讨论与研究。仔细观察本次浪潮,可以确定的是:当前人工智能在人类严格定义的问题上可以取得接近甚至超过人类的成果,如围棋、电竞游戏等。然而,人工智能目前大量依赖人工标注的数据,且容错性短期内无法解决。此外,当前人工智能远远无法有人类的思想,如推理、感知并没有实质性突破。可以断定,目前人工智能在生产领域只会处于辅助部门的位置。而从阶级结构的角度,人工智能一定会带来更大规模的垄断集中,并加速资本主义基本矛盾的爆发。

  2019年1月20日,载言同志在“好家伙”线上讲座向大家详细讲述了人工智能的技术现状,并在此基础上讨论了人工智能行业的现状,以及人工智能对社会矛盾产生的影响。

  在本次讲座开始之前,先对本次讲座做一些说明。因为大家也知道,这几年人工智能的浪潮,也引发了在左圈里面很多方面的讨论,而且讨论可以说是各种方向都有,有些讨论也比较天马行空,所以说我这次讲座的一个重点,是希望把这次讲座,讲得更加实际一些,看一看我们当前人工智能,到底发展到一个什么样的情况。基于当前的人工智能,我们去做一些相关的讨论。

  首先我们仅讨论当前可预见时间内的人工智能,而这个当前和可预见时间大概是几年?可能就是五年,也可能是十年。如果说接下来可能出现一波人工智能低潮的话,可能只有20年。我们也是在这么一段时间内进行考虑,我们不会讨论更长远的时间,比如说50年,100年,那个时候可能在大家脑子会非常的天马行空。

  为什么只讨论这段时间?是因为毕竟我们对对当前社会的理解,可能也就是这么多的时间!从长远来说,马克思主义已经把握一个大的方向,但是从短期来说,还是要看现实矛盾,从现实的矛盾去探讨当前的各种问题。

  然后第二点,是我们这次讲座,要侧重于从技术角度来调整问题,所以说本次讲座可能我要花一半的时间讲这个,这一部分基础理论应该是需要一些高中的数学知识。然后我们尽量把这些技术理论讲得通俗一些,也让大家从基础理论的角度出发来看,这人工智能到底发展到什么程度,我们去从一些现实的生活做判断。

  我们讨论的一个前提就是,这是我对当前人工智能的理解,可能有一些同志有不同的观点,我们后面可以再进行讨论。我对当前人工智能理解就是一个更加先进的机器,这个机器可能能操作以前机器没有办法去做的事情,而且可能是能够做很多以前自己没有办法去做的事情。

  至于它有没有人的感知,反正在能预见的时间内,我认为是没有,所以我们不讨论更加长远时间内的问题。

  

  有一个叫冯象的老师,他有一本书叫《我是阿尔法》,里面也说了一些人工智能的远景。对于一些远景问题的话,可以参考冯象老师的那本书,它相应的文章里面提出的一些观点。

  然后第三点的话,我们不讨论当前看来非常虚无飘渺的问题,比如说最典型的问题就是人工智能何时取代人类,我们不讨论。

  然后还是基于这个点,我们不讨论以后所有工作是不是全部自动化了。可能某些工厂是全自动化的,这已经有实现的了,比如一些港口。但是所有工厂能不能全自动化,这一点我觉得可能时间太长了,我们也不讨论这个问题。

  当然还有一种讨论,说人工智能能不能统治人类,不仅能够取代,而且能够统治。当然这个统治可能说的很抽象,比如说像资本主义私有制社会里面,统治阶级能不能依靠人工智能统治人民。这一点的话也不讨论,一是它比较长远,二是我们还是把重点放在人的关系上。。

  最后一个就是,人工智能会不会对资本主义内部的经济结构产生影响,就是说在资本主义的环境下,会不会有些阶级会消失,有些阶级会产生?比如说比较典型的观点是,脑力无产者会成为将来社会的主流,而产业工人是没落的群体。这个问题的话,也相对来说也非常长的,我们也不做讨论。

  01

  人工智能的典型应用

  今天我们是主要是谈这几个方面的,首先先谈一下人工智能当前有哪些应用。

  然后花一半的时间去谈论一下人工智能目前的一些技术理论及发展现状,从工程角度来理解一下,人工智能到底在做什么。

  第三点的话是讨论一下人工智能目前的行业发展是一个什么样的情况,就是说各个产业在人工智能里面有什么样的应用。然后第四点的话,讨论一下,就是从马克思的政治经济学的角度,看对人工智能如何去理解,这个涉及到一些政治经济学的知识。

  最后一点就是说一下我对人工智能一个基本的结论。

  首先先谈一个典型应用。

  先说一下什么是人工智能。国外有一个人,他编了一本教科书,分成了两个维度。

  一个就是,一个人维度,或者可以做人做的事情,或者可以像人一样具有理性(毕竟人是有社会性的)。然后第二点的话,是从行为的角度,或者有一定的行为,或者有一定的思维(毕竟人有社会性啦,他可以思考)。

  那么从这两个维度,其实就可以构成四个层面的定义,比如说一个人工智能系统可以像人一样地行动;然后更高端的,就是人工智有可能像人一样地思考;或者进一步来说,人工智能这个系统,可能能够理性地进行行动,不仅是像人一样行动,而且是能够做一些正确的决策,而且这个正确决策,对社会来说看起来是合理的;还有一个就是,人工智有可能能够像做到一种理性的思考,甚至理性思考可能还比人要好一些。

  从目前发展情况来说,我标了不同的颜色,这不同颜色就标志着人工智能在不同的层面下发展的情况。

  

  比如说红色的这部分就是人工智能像人一样行动,其实这一部分从当前来说已经基本上实现了,或者有一些没有实现的,应该也能够在近期来进行实现,在比较简单的领域做人做的事情。

  然后这些系统能不能像人一样思考?这个谁都不知道。当然有的人工智能系统能做一些类似人的行为,比如说AlphaGo,AlphaGo确实是在这个方面还是起了很大的突破的,它至少能知道这个棋局是一个什么样的情况,这有点像人一样思考。

  但是它能够做到理性思考,理性行动,那就当前的人工智能可能远远达不到这个层次,毕竟它远远没达到人对事物认知的水平。

  我们说一些典型的应用,比如说自然语言的处理。

  这里面的语音,第一点就是语音合成,这里面就有一个大家知道公司叫讯飞。可能很多人会用一种输入法,叫讯飞输入法,那种输入法,至少你在走路或者是在开车的时候,使用起来都非常地方便,因为我只要说一段语音,无论是普通话还是地方的方言,一般来说这个识别准确率能达到90%以上,至少是人都能看得懂,汉字的叙述顺序和错误,可能不会影响到人对这段语音的文字的判断。

  然后语音合成的话,就是可以合成一些像人听起来非常舒服的这种,比如说可能合成一些方言等等,最近不是有一个非常火的平台,就是什么新闻联播的播音员的合成,还有在iPhone手机上有一个东西叫siri的对话系统,就是我说的一句话,然后然后siri会自动反应,比如说打电话给谁谁谁,那就真的把电话给拨出去了。

  自然语言里面还有一些其他应用,比如说机器翻译等,一会我会举一个例子。

  信息的抽取,就是给一段话,生成一段摘要的文字,有的时候也是能成功的。信息的检索,就百度谷歌的搜索,自动的问答,比如说百度王宝强的前妻是谁,百度直接就反应,说了马蓉。还有一个就是文本的情感识别。另外比如说有一些在炒股领域可能有些可笑例子,比如说像之前章泽天和刘强东,之前两者关系出现一些矛盾,于是有一个股票当天就暴跌了,这个股票就叫泽天股份。当然还有川大智胜啊,西仪股份。它们可能也会受到智能炒股软件一些影响,即这些炒股软件针对网上消息进行大数据分析,“发现”了相关股票的“负面/正面消息”,然后做出卖/买的决定,当然这都只是传言了,当个段子听就可以。

  这里面就举一个例子就是谷歌的翻译,然后上图是前几年谷歌翻译系统,然后下图是谷歌2016年的翻译系统。我们可以对比一下,上图和下图翻译系统,然后它的翻译效果,前一段文字你会发现其实读起来非常不通顺,比如说第二句 “AI教科书定义字段的研究的和设计的管理,智能管理智能代理,其中一个智能代理是感觉周围环境”,你会发现读起来非常不通顺,也不知道他在说什么。

  

  但是到16年,他翻译就已经是非常通顺。关于第二句话,“AI教科书将该领域定义为智能代理的研究和设计,其中这个代理能够感知其环境,并采取行动以最大化及成功机会的系统”,那么发现这段话至少人是能够非常理解的,而且其实翻译的结构和人自己去翻译,可以说是没有什么太大的差别。

  所以说现在读英文论文的话,大家都会采取一个手段,就是先把这段英文扔到谷歌翻译里面,让谷歌翻译,再看一看他到底在讲什么,可能这篇论文理解起来就会更容易些。然后写论文的时候就也会做,先写一段中文,把它扔到就谷歌或者百度翻译里面,让他生成一个英文,然后把这段英文粘贴,然后润色里面的文字。

  然后在视觉领域的话,一般是针对图像或者视频,一般可以做图像的分类,比如说我拍一个照片,这照片有一朵花,花是一个是一种什么样的种类的花,这个APP都是有实现的。

  还有就是物体的检测,比如说给一张图,这个图里面是有很多绵羊,把每只绵羊都识别出来。

  当然可能大家更加熟悉的就是街上摄像头的人脸或者行人的检测,就是我这个摄像头三个环境里面,基本上这摄像头下面,所有的人,我都可以检测出来,甚至我都知道这个人的一些基本特征是什么。

  然后右边这个图,是一些场景的标注。比如说这个场景,我给定三种这张图,我去标注右上,然后可以看到标注的结果就是右上方,比如说哪些地方是马路,哪些地方是物体,哪些地方是高楼,哪个地方是天空,那我都可以把这个区域都找出来,这一些现在人工智能系统已经被完全实现了。

  

  用场景标注在自动驾驶领域是非常实用的。还有是安防领域,这是一个非常简单的安防系统,所以我给定在摄像头背后,去连一个数据中心,他在数据中心里面可以实时地去进行进行人脸和判决,有时候可能去抓一些犯罪分子,会去抓一些相对敏感的人物等等。

  另外一点,比如说像在火车站、飞机场这样的一些环境当中,利用人脸识别的系统去代替以前的实名制,是实名制的检验系统。

  然后还有一个,最近这个视听节目类吧,要进行审核。这个审核领域,像抖音这种短视频,审核的话,人的审核其实根本没有办法完成的,所以很多时候会比较依赖机器审核。比如说一些直播系统,它背后是有一个AI的鉴黄师的,就是说某个主播,可能会做一些黄色行为,鉴黄师就可以立马反映到后台,然后后台有些审核人员就跟进,根据反馈的结果,然后去决定到底要不要封杀主播的一些不法的行为。这种鉴黄师其实现在已经有了非常广泛的运用。

  (有人提问:道路识别这个因为楼房是白色的?)你刚才说的这道路识别,就是照片的建筑颜色是白色的是吧?但问题是,其实是如果从人的角度来说,肯定是识别判别的一个依据,但是现实的场景当中,建筑物的颜色可能千奇百怪,道路颜色可能也是千奇百怪的,而且会受到雪天、雨水天、太阳这种影响,所以他不一定都是这样。建筑物或者是场景范本这种识别,它可能会综合很多的因素,这个因素都是从数据中去学习出来。

  然后还有一个比较经典的,就是围棋游戏,待会我会讲围棋游戏的基本的原理。

  另外就是一些电竞游戏,比如说像dota2,还有像星际争霸。现在dota2和星际争霸的AI的水平,基本上已经能够超过一般的顶级玩家水平,但是远远达不到职业玩家的水平。(最近星际争霸AI可以达到一般职业玩家的水平)

  还有一大类就是属于生成工作,就是AI可以自己去做一些艺术作品,比如说AI去作画,AI去作曲,这个现在都有一些初步结果。我们实验室有一个人,做一个工作,就是AI生成风景画,大家可以猜一下,哪些画是生成的,哪些画是真实的中国画。可能一般的人确实看不出来,当然如果你放大去看里面的细节,可能是能够看出来的。这里就直接展示结果,有标签的是生成图片,仔细看看这生成图片,可能和真实的图片还是有一定的差别的,但是如果你简单去看,确实是能够达到一个就是水平不太高的人的做画标准。

  

  自动驾驶领域,它是有很多的摄像头,有雷达测距的系统,它就会根据汽车周围环境信息,去做一些自动驾驶决策,比如说要加速,减速,刹车等等。自动驾驶系统,至少可以做到一个辅助驾驶水平,就是人去离开方向盘,在一个比较简单的环境中,是可以做一些简单的决策的。

  这是一个自动驾驶的例子,就是它可以检测出来前面的汽车,它的行驶的轨迹和行驶的速度。

  

  这里也是自动驾驶的一个案例,比如说给他一个前方的摄像头,它来做什么,比如说会做一些检测工作,防止有一些障碍物,然后直接撞上去。右侧就是一个场景的分割,我要把道路去分割出来,防止汽车不小心就开到了荒郊野里去了。

  

  所以总结就是人工智能有三大应用场景,总共3大类。

  第一类对机器人和人都很容易,比如说语音识别、机器翻译、棋类游戏,这类是对机器对人都是比较容易,人能够经过大量的训练,达到一个很高的水准,机器也是,可以达到一个很高水平。这些领域有一个特点,就是他对问题的定义都是高度的结构化或者是形式化的,也就是说这个定义非常非常简单,每个人都会知道这个问题到底是什么,虽然我可能不会这个问题,但我至少知道这个问题应该是出一个什么样的结果。

  第二个就是对机器和人类可能都很难,比如说像提出一些新的概念,可能人类都不一定能完成,机器目前来说也不一定会完成。

  还有一大类就是对人类容易,对机器很难。当然就是这一类任务的难度都是相对的,比如说早期的话有像图像识别、图像理解、联想,等等这样的一些工作,对人类都是很容易的,对机器是很难。但这几年对图像识别,然后自然语言的处理,它可以说对机器来说也都不是那么难的事情。一般来说只要对人类容易的问题,一般长远来说机器都是能够解决的。

  当然有些对人容易的问题,可能机器是不能够解决的,这是一些基本的应用。

  02

  基础理论和发展现状

  讲一下基础理论,在讲基础理论的时候先简单说一下,人工智能总计有三次的浪潮。

  第一次浪潮大概是从56年到70年,第二次大概是从70年到90年,第三次大潮大概是2006年以后。

  然后第一次浪潮就是先提出了,机器能够做一些人能做的事情。比如说他们早期的人就想做一些定理的证明,做一些基本的道路、线路的规划等等,或者是想下一些简单的棋的游戏,这就是第一次人工智能浪潮。

  然后第二次人工智能的话,觉得人类有很多的知识,但这些知识的话,机器可能不是能够掌握,我能不能创造一个人工智能的模型,让机器去学习一些人类的知识,就形成了第二次浪潮。第二次浪潮比较典型的就是机器学习的这个方案,就是让让机器去学习,根据一些数据去学习一定的规律,这种规律可能人也是能够掌握,或者说是人先总结一些比较简单的,你比如说一个文档,它是每个词它都有一定的词频,这个词频我就可以构成一个特征,当中一个特征,我去做一些东西,对,要继续做一个决策。就是第二次。

  第三次的话,就是基于大数据发展,这个数据量都非常高,数据可能非常复杂,但是人工智能吧,不管数据多么的复杂,我只要能够有大量的数据可输进,我就能够解决一些人类定义的很好的问题。就是第三次的浪潮,第三次浪潮是以深度学习为标志发展。

  然后每次浪潮最低潮的时候,总会有这样的反应。每次人工这种高潮进去的时候,肯定有很多人声音就是:天啊人类要毁灭了,但是每次低潮的时候,他说这个东西都是骗子。

  现在到了第三次浪潮,可能也有快下去了,过几年可能要下去。将来也有很多人可能有很多声音,就是说现在人工智能就是个骗子。

  我们再总结一下,就是56年提出,人工智能第一个阶段,基本上就是到70年,当时主要是做搜索。就是说我给他一个问题,然后也知道这个问题可能有哪些可行的解,那我就把这些解一个一个的找出来,然后去得到一个最好的结果。这就是早期的任务,比如说定理的证明啊,游戏啊等等,都是能够得到比较好的一种。

  然后第二的时候就是知识处理,希望人类有一些支持。比如说像医疗领域,我去看一个病,看病的话,它可能有一个标准流程,比如说我要根据某些特征1、2、3,去判断它到底是不是一个心脏病,或者是不是癌症。

  当时就希望利用这些知识,让机器去掌握这样的知识,就创造了知识工程,或者专家系统等等。系统给输入一些标准化的东西,输入一些新特征,比如说心电图的一些特征,然后让专家去做一些诊断。但因为人做这种角色其实非常非常复杂的,当时机器去做决策,其实都是只能靠简单的搜索,所以说,当时这个领域其实是客观上失败的。

  然后接下来发展第三个阶段,就是特征数据,我人到这个机器去处理的时候,我人先对这个数据做一些简单的处理,比如说我去判断一朵花是什么样的、什么种类的花,我可以人先去做一些简单处理,比如说先把这花的颜色,花瓣的大小,花瓣的数量等等东西,用一种简单的方法先把这些特征提取出来,然后把这些特征去放到一个机器学习的系统里边,比如说通过一些统计的知识,然后去就统计到底可能是某一种花,它可能长度大概就是在5到8厘米区间。另外一种花,可能花瓣长度会在9到12厘米区间,但有一种新的花的花瓣长度,可能是七厘米,我就判断他就是前一种花,这都是一些统计学习的知识,当然优化学习也是有相应的这种知识的。这是特征处理下取得了一定的成果。

  当然人工智能机器学习取得真正突破的结果就是2010年深度学习,就是说我根本不用去提取一个图片或者文本特征,我只需要把这个图片简单地扔到一个人工智能这种学习模型当中,它就能出来一个结果,而且能出来一个很好的学习结果。

  所以说其实我们讲了这么多,它的一个本质就可以发现它先定义一个问题,然后用相关的算法去求解和预测一些新的问题。

  这就是有哪些问题,第一大类人工智能可能就是搜索,然后第二大类人工智能就是继续学习,继续学习就分为回归、分类、深度学习,还要强化学习。

  首先就是讲搜索,搜索就很简单,就是要穷举一个所有的可能情况,找到一个最优的决策。这里面就一般分成几大类,比如说像棋类的游戏,导航啊,智能问答啊等等的,等会我会一个一个地讲。

  先说导航的问题,就是我们大家知道手机软件,然后希望能从A到B,找到一个最优的路径,一般来说根据高德地图运用的规划,我们就能够非常傻瓜地到我们想要的目的地,它是怎么实现的呢?比如说我们考虑北京市,就这么一个道路的网络,就这个点。可能就是一些关键的地点,然后现在就是一些道路或者路径,我们想从一个点A,就是A这样一个点,然后到这样的点,点B,怎么去找?其实就是暴力搜索的办法。首先会发现A的周边可能有三个点,有三条道路,人工智能系统就会把这三个道路全部搜索一遍。然后这个道路我们在这三条,然后到达这三个点后,我可能要找一些新的道路,比如说我要从某个点出发去寻找新的道路,会发现比如通过GPS的信息会发现这个点到这个点的距离可能是最短,那我就从这个点出发。然后发现他旁边有三条道路,肯定不能走回去,都走回去,那不就死循环了。发现可能有这样这三条三个可能的方向,于是所有的点搜索到就可能能从A点到达道路,就包括O打头的这个地方,S打头这个地方,F打头的这个地方,P打头这个地方还有G打头这个地方,再然后对这些地方在选取一个点,继续进行搜索,比如说我们发现F点根据GPS进行地点最近,我就从F点出发再做一步,然后要找百度下面的一个路径,当然你可能肯定也不能走回头路,结果发现好像F这个点正好一步能够到达最终的终点,就写错了这样一条路径,AI从S点到F点一直到D点这上一条路径,这就是一个搜索。其实搜索就是计算机就做一个简单事情,非常暴力的进行搜索,找到冲击和所有的情况,然后找到一个找到想要的结果。

  

  下棋也是,比如说一个最简单的棋,就相当于是在一个井字的3×3的井字格里面画圈,或者说画叉,然后如果是某一方能够横竖斜形成三个能够连在一起的话,某一方就赢了。这是一个现在假设机器就是画叉的这个人,可能要下下一步的棋,然后机器要判断他下一步要下到哪,机器就要穷举所有情况,所有情况其实简单,就是人工智能的系统,它要把所有可能的棋局都要下一遍。比如说现在有三个部分,就有三种可能情况,比如说他可能下到这里,右边中间这个点,但是下到这里发现肯定不行,因为比如说画圈的人下到了这里,那圈就赢了,我肯定不能下到这个地方,如果说我下到这个地方当然也不行,因为画圈的只要下到这里它肯定也赢了。然后我下到这个地方,我就让画叉的话我再做进一步的一个计算,比如说如果画圈的话到这里结果可能是平局。如果这个画圈的话到这里,那这个画叉的再补一步,就是这三条连成一线,那么这画叉的就赢了。(ppt演示)

  

  综合的所有的可能情况会发现,这个人工智能系统可能只能把叉画到这里面,最后取得胜利。

  然后还有智能问答,我们这里面就几个最简单的这种问答,可能大家原群里面,就是可能在微信群里面,都能看到一个非常搞笑的AI类核心代码,估值一个亿。它做什么呢?

  比如说我输入一个“在吗?”

  “在”。

  然后我再说“你好”

  AI说“你好”。

  我说“能听懂汉语吗?”

  “能听懂汉语”。

  “真的?”

  “真的”

  “English too?”

  “Englisg too.”

  “bye!”

  “bye!”

  你会发现后面代码其实对这些文字做一些简单的替换,比如说如果后面有“吗”和问号的话,那我就把这个“吗”和问号换成叹号,如果是句号的话,我就可以是一个陈述句,然后发现好像这个逻辑都是正常的。

  

  

  实际上早期的智能问答系统它就是在做这个事情,然后我就存大量的问答的语句和格式,那么人输入某一段话,他就去在这个数据库里面做匹配,匹配一个对这个问题的最佳回答,然后再输出出来,然后你们发现,其实所有智能问答在早期的话,本质其实就是在做这个事情。

  (有人提问:下棋问题,为什么继续计算?)这个问题是下棋总结的棋步,为什么还要继续计算?对,总结棋步肯定是要他要在搜索的时候,我要模拟棋局,就是要把棋局的结果下完,在下完之后,它实际上这个计算才能够真正地停止。

  这是搜索啊,然后接下来还有一大类,就是机器学习,这个可能大家也会听到很多相关的概念,我们得简单说一下,机器学习他到底在做什么?其实就是比如说我们假设收集到一百本书的页数,这一百本书的价格,大致是一个这样的情况,比如说这有一本书,有一本书是55页,然后它的价格是69块钱,有本书是105,价格79.5,有本书是90页,价格是128块钱,然后有一本书是240页,价格133。

  

  我们把这一百本书,可以在一个坐标系里面去画出来,可能会通过这个分布,我们可以得到一个非常简单的结论,就是书的页数越多价格就越高,这其实也是符合人类常理的。

  好的,我们接下来想做的任务的做两个,第一个就是告诉机器学习什么,然后第二个任务就是等机器把结果写出来,告诉机器学习什么呢?就是说我们假设有一本书是480页,我想知道这本书的价格是多少,

  可能就是我们要学习的话,因为我们觉得可能书的页数越多,书价值越高的,其实它可能就成为一个线性的关系,就是一次函数的关系,比如说可能是下面这样一条斜线。当然书价是480块钱的话,我能在斜线找到对应书价这样一个点,然后得到相应的结果。

  

  好了,这个斜线可能大家都学过,y=wx+b,W和B都是一些待定的系数,待定系数比如说可以解方程,也可能用一些其他方法去求,我们是必须要求W和B是什么?

  

  好,问题就是w和b是多少合适,我这里面就有一个。我们设y=wx+b这样一个一次函数,我们需要确定wb到底多少最合适。比如说这可能下面是有一些不同的情况,然后当然最好的情况,就直接根据这样的一些离散的点,人去画,或者机器再画一条直线,感觉这个直线能够覆盖到大多数情况就可以了。比如说下面这三种情况,可能都是一个比较合理的结果。但是哪个点可能就是哪条直线是最好的,我可能需要做一定的量化。

  比如说一个最好的最简单方法,就是要使预测的书价和实际的书价差越少越好,你说这样一个预测的点,比如说这是一个预测书价和书的线性的关系,我会发现可能每个点,和每个实际的书价和预测的书价,都会有一定偏差。这个就是偏差。我们就希望让这些偏差,就是所有点偏差的和越小越好,也就是说让预测书价,实际书价,差越小越好。

  怎么去形式化这个问题,我们可能就要做,像高中的话大家可能都学习过,我需要构造一个函数,针对实际问题,我们去实际问题去做到一个y=f(x)这样一个函数,然后去优化Y等于X,那么在这个问题中也是一样的。

  比如说我们假设价是y=wx+b,我们肯定是适当,比如说页数是55,那么它价格55w+b,然后它55W+B,它和实际69,他肯定存在一个误差,他这个误差我就取一个平方,就是这就是第一本书的误差。为什么取平方而不是取绝对值,就因为取平方可能更好计算,没有别的道理。然后这第二本书的话,预测价格是105w+b,实际价格79.5,我这也是求一个相应的误差,所有书的误差总和,我就可以一百个把它列出来,然后得到这么一个结果。然后得到这个结果的话,其实我们可以做到一个以W+B有关的损失函数,这点我只列了以W相关的损失函数。比如说是有这样的一个情形是很明显这样的形式,如果是掌握初中掌握的二次函数知识的话,肯定知道W该怎么求。求它的最低点,对吧?比如说我们把W搬进去,用一个图像去画出来,肯定知道W大概斜率大概10到15之间的这样一个数。OK,这是一个非常简单的算法,当然有些还是可能非常复杂的,比如说三次函数,还有可能这个函数都是分段的函数。总之到实际的深度机器学习里面,这个函数是非常复杂的,肯定不是像这么简单的二次函数。

  

  

  在求解过程中就有另外一种方法,就是画切线,然后算导数。比如说我就随机的从某一个点出发,然后这个点会发现它可能在现在切线,然后在切线的时候,我可能就是取一段X,然后X往前移,移到这里,然后再从这个点出发,然后再画一个斜线再往前移。然后这样的话,所有我们去做一个迭代,然后迭代人算肯定是非常的困难的,这样一个循环,但是机器的话确实非常容易去解决这类的问题。然后当然这个切线怎么算?那些高中的导数知识,其实就告诉我们答案。

  

  我小结一下吧,我从线性规划这个例子去说一下,目前最火的人工智能在做什么?首先就是在搜集数据。刚才不说书价和书的页数这样一个关系,书的页数是X,然后书价Y,就是X和Y也构造一个关系。

  第二个就是选择模型,就是选择一个合适的函数F(x),比如说刚才那个问题,相应合适的函数就是一个线性函数,在F(x)中的参数,都是W和B两个参数。

  第三点就设计代价函数,比如说衡量一个预测结果,和衡量一个真实的结果的差距,比如说用一个平方误差的代价函数,

  最后一步就是用一些方法去进行优化,去优化这个系统。

  所以说机器学习,其实从原理来说是非常简单的,但是在实际考察问题的时候,他可能有一些现实的困难,比如说他可能数据是非常复杂的,比如说一个图像,你怎么去确定图像对应的输入,X比如说它的它向量X,它是一个什么样的格式?我怎么去拟合它?可能就是让上个世纪一直到本世纪的前几年,一直大家都在研究这个X该怎么去算,直到最近深度学习,大家知道,我直接把图像每个像素点的RGB三色通道的数值输入进去就可以了。

  然后另外需要设计合适的模型,可能这些模型会非常非常的复杂。另外一点模型的输出和真实的结果可能是非常复杂的,比如说刚才这个解释的这个问题,就是输入输出就是一个连续的实数。但是可能有时候输出是一个离散的,比如说1和0,那就代表1可能代表某一类人,0可能代表另外一类。有的时候可能输出的结果是一个框,这个框可能有四个参数,就是左上角这个点的坐标和右下角的点的坐标,反正总之实际输出的结果是非常复杂的,虽然设计时就是和这个代价函数进行优化。然后非常复杂,大家可能用高中学的知识,就没有办法去进行解决了。

  然后呢,把F(x)学习出来的话,我就可以用到实际场景了,比如说给定一个新的数据,X那我就要预测,它对应的标签我直接用学习好的F去预测就可以了,这都是基于学习。

  然后我们再说一些其他应用,比如说分类,分类的话,比如说鸢尾花的话两有两种分支,一种是变色鸢尾花,一种是山鸢尾花。我们需要判断给定一张图片,这个图片有一朵鸢尾花,那这朵鸢尾花到山鸢尾花,还是变色的鸢尾花。

  

  比如说用一个比较简单的方法,我可以用我可以选取这个图片连几个特征,比如说花瓣的长度,花瓣的宽度,到植株的长度,还有花瓣的颜色,这样四个参数,然后进行学习,然后去判断,最后这个到底是一个什么样的花。比如说第一个花,他这个花瓣的长度5.10cm,花瓣的宽度是3.5cm,然后可能植植株的高度是1.4米,植株宽度可能是0.2米等等的,最后它这种花比如说是一种白鸢尾花等等,这就有一组X,还有四个数就构成一个x,然后输出的话就是一个什么样的话,比如说用B或者E来进行表示。

  如果我们画在一个坐标系里面,其实就可以看到这个为什么用四个,四个特征可能是非常的合理的,比如说我们仅用花瓣长度和花瓣的宽度这两个特征,然后在这个坐标系上做一个显示,就会发现这个山鸢尾花,它花瓣的长度宽度都比较短,然后变色鸢尾花花瓣长度和宽度都比较大。于是我发现这两个类别其实在这个坐标系统是明显分开的,我们就可以画这么一条红色的直线去把这两个种类分开,比如说这样一个一侧结构,比如说可能这样一个函数小于零的时候,它就是山鸢尾花,还是这样一个函数大于零的时候,它就是变色鸢尾花。

  

  当然怎么去确定这么一条直线?一个最简单的方法就是蒙嘛。把这条直线在所有空间里面枚举一遍,然后找到一个最好的,看起来最好的直线。当然有一个比较靠谱的做法,我可以通过函数的手段去进行优化。

  比如说我开始可能是这样一条直线,发现这条线肯定是不能把这两个类别分开的。也可能这个直线也不能把所有类别走开。当然可能是这样的直线,这个直线其实是能成功地把这两个类别分开了,但是好像发现分开的效果并不是很好。当然有可能是这样的,这样的直线的话,他们分的效果就很好,我们就可以以这条直线去进行优化,就其实是蒙的方法。(ppt演示)

  

  

  

  

  

  实际上怎么去形式化去应对这个问题呢?有一个比较简单方案,就是定义分类的间隔,你说第三条直线它是这样的一个直线,它分类会发现这条直线对着山鸢尾花特征的距离中最短的距离,会比较小,然后这条直线到变色鸢尾花的最短距离可能也是比较小的。

  但是如果是红色的直线,会发现这是这个直线对着山鸢尾花的最短距离,和这条直线对变色鸢尾花的最短距离都是比较大的,但我们肯定会选取红色的直线作为最好的结果。

  当然这个东西是可以去用一个函数,形式化来进行表示的,然后我们去优化这个函数,就确定这条直线到底在哪。

  然后这是分类问题,当然还有其他应用,比如说垃圾邮件分类,看它这个邮件,到底是不是垃圾邮件,垃圾邮件分类是一个早期机器学习很经典的应用,因为其实比较简单。比如说你去判断这个邮箱的地址,他是不是正常留下地址。

  然后看到这文字内容,比如说什么东西是免费的,我要营销这个什么东西肯定宣传免费,我一看到免费的两个字,我就可以把它扔倒垃圾邮件里面,因为肯定对用户没什么用。你可能会看到SCI会议投稿,或者说国内xxx,垃圾的会议投稿,当这个垃圾邮件系统发现这些文字的时候,我也得把它分成垃圾邮件里面。而正常的一些邮件,它可能会分析出一些完整的事情,我就把它放到正常的邮件中去使用。

  还有手写字体的识别,就是OCR系统,这时候给另一个图片去判断图片上的文字是什么。

  他现在广泛使用的车牌识别,还有像图像的分类,就看到一种花是什么样的花,还有人脸的识别,这都属于分类的一些典型的应用。

  然后在这个领域中,还有一个很重要的分支,就是这几年发展就深度学习,和普通的机器学习有几种不同?它本质的话,其实就是深度学习它是一个非常复杂的函数。这种非常复杂,可能人都没有办法去理解,但反正它是可以构造出来的。

  它动机就是人的一个神经元结构,它是分层的。你说我们考虑我们一个听觉的系统,这个系统先通过耳蜗对吧?然后耳蜗把信号处理掉,给了大脑皮层,大脑分好几种区域,比如说V1区,v2区,v3区,然后v1区把信号处理给Av2区,v2区把信号处理给v3区,最后呢信号到了脑的一个言语临界的这样一个系统,去得到正确的信息,然后这些正确的信息去指导人去做下一步的决策。

  神经元结构是高度分层的。那深度学习,就基于这样一个动机,它就会设计一些分层的网络结构,那种网络本身其实就是复杂函数的复合。比如说第一层一个输入f,第一层套一个f1,第二层把f1输出,然后套一个f2,然后快f2输出然后套套套,然后套了好几层,就是套了L层,最后得到真正结果。

  所以可以发现就这个函数是非常复杂的,一个简单点函数,可能就是之前说的y=wx+b,这样一个线性函数,复杂的话就是,我可以直接给定一张图像,然后对这个图像就是用卷积等等操作,处理,当然卷积是一个什么大家可以网上去搜一下,这都属于大学里面的一些基本的内容。

  然后函数的优化也很简单,因为我们是能够把问题定义,比如说可能输出结果是一种类别,或者输入结果是某一个数,我就可以根据这个类别信息,根据数的信息确定一个代价的函数,然后这个代价函数,我就可以进行优化。优化也有一些特定的方法,这个就不多介绍了。

  其实反正本质的话,深度学习相对普通学习一个优势,就是说叫没有中间商赚差价。他的意思就是说,比如说给他一张图像或视频,这样一个非常复杂的数据,那这个非常复杂数据,我用一个很复杂的函数处理,我都可以得到最后的结果,比如说分类,复杂函数得到0到9这个数字的结果。

  下面就可以看到,一个非常典型的结构,就是给定一张图片,这个图片就有非常复杂的这个函数结构。这些函数结合,最后输出的结果就是它的分类结果。

  以前的时候,机器学习怎么处理,它可能会有一些其他方法去判断。这张图里面文字有多少条直线,比如说这里面有三条直线,这三条直线我们能够判定,它可能是A可能在H。然后在三角之间的关系去构造一种特征,就说这可能是一堆实数的组合,然后用一个分类器,来进行分类,最后分类的结果。

  但是深度学习的话,我就可以把这两个过程融合到一块,用一个非常复杂的函数去得到解。

  就这么一个设计思路,其实在当前人工智能领域,得到一个飞速的发展。比如说图像的识别,有一个任务,有一个任务是这个图像的分类任务,就是说给定一张图像,这个图像里面有一个物体,物体里面它是包含在人类生活中一千个不同的实体,比如说是一种鸟一朵花或者一条狗一只猫等等,它有不同的标签,我要根据这张图片去判断这个里面的目的,到底是一个什么样的标签。

  但怎么去定一个错误率,就是说我可以一个人或者机器,我可以对这张图片打五个标签,如果这五个标签里面有其中一个,和这张图片真实的表现相同,我就认为它是针对错误,我们认为它是分类正确,否则就认为它是分类错误。早期的话它就分类错误率多少,可能百分之比将近30%,但自从有了刚才所说的深度学习,这个分类错误就一路下降到了2017年,它分类错误率是多少?2.5%。而一般来说一个熟练去做分类的人类,它的分类错误率是多少?大概是5%。

  所以说你会发现有一些非常差的标题党,经常会发一个什么重磅,某某领域的机器识别的性能已经超过了人类,它本质是什么样的?就是在这些特定问题上,比如说这种分类的问题的准确率上它超过了人类,然后人脸识别也是,他可能是在这个两个人脸,它是不是属于同样一个人,在这个问题中就是要回答是或者否,他超过了人类。

  其实这个问题从人的角度来说,它是个非常简单的问题,输入这张图片,输出,就是看到就是哪个类别,0-1?1-1000?你其实输出一个数就可以了,这种简单的问题机器现在都是可以解决的,并且超过了人类的水平。

  而这种深度学习还有另外一个特点,就是说它需要高度依赖大规模的数据,然后会说对当前人工智能的意味着什么?也就是说以前的数据量比较少的时候,它分类准确率是非常低的。

  

  (ppt演示)我看右边图标,先看绿线吧,在以前的机器学习算法数据量增长,性能逐渐提升。当然其实数据做到一定程度的时候,机器学习的算法可能无法继续,性能就无法继续提升了,但有了深度学习就不一样,我只要有更多的数据,我就能获得更好的结果,于是现在就出现一类领域的数据的标注员。

  另外还有一个就是强化学习,强化学习的本质就是它是一个自我学习的过程,就是我提一个问题,然后这个问题,他可能比如分成好几部,比如说我要做题,做数学题,就分成第一步第二步第三步第四步,做完这个题,然后有老师去判断,这里面就可能说总分12分,给你八分。好了,机器回过头来,我就要去判断我这样的一个解题的步骤,存在哪些问题,好像发现可能第一步存在问题,我就去优化一下第一步。然后我再重新再尝试把这道题做出来,第一步第二步先把这道题做出来,这时候可能有一个老师会跟你说,你现在得了9分,好像这一步可能是从错误变成正确了。我再找出来第三部又出了问题,然后把第三步来修改一下。然后第一步第二步第三步再做那道题,那么做完这道题得了12分,这就是强化学习的概念。

  有个非常经典的应用,就是在围棋领域。刚才我们说了,在下棋的时候一个比较简单的方法,就是暴力搜索所有的可能情况,在国际象棋,象棋,五子棋,还有刚才那个“井”字棋,都是可以用这个策略的,为什么?因为搜索的步骤其实比较小的,你像国际象棋可能只需要搜索上百亿步就可以了,上百亿步,其实对机器处理是非常简单的,因为机器每秒,一般普通机器就可以计算上亿步,一个很好的机器,可能可以计算上百亿股的,所以说我只要对棋局下面所有可能的情况,然后就可以指导人工智能这个模型去走一个最合理的步骤。

  但是对于围棋就不一样了,围棋每个下棋的步骤可能都是多少?有361步的。你下上几步的话,基本上它所有走的可能情况可能比宇宙中的原子数量还要多,对机器来说是根本没有办法处理。刚才有一个同志的提一个问题,就是说所有的步骤,你把这所有的步骤算下来,这是不是浪费资源,确实计算机它就是出这么处理的,我只要有多少资源我就可以下多少步,我们不管有些搜索步骤是不是对人类是合理的,反正我把所有的步骤穷举一下,我就能得到最好的结果。

  AlphaGo也是这样处理思路,但是他做了很多的改进。AlphaGo因为有了深度学习,所以说它就有个棋感,我可以把棋谱输入到一个神经网络里面,然后获得这个棋谱,就当前的棋局,它可能获胜的概率,会输入0到1之间的实数,这实数就是概率,概率越高的话,我就要越有可能走这一步。

  这个模型怎么去学习呢?是因为在国际比赛中其实有大量的棋谱,我是把棋谱和其余的结果用到神经网络模型里面去进行学习,其实网络就能够获得棋感,也就是说我给你当前棋局,我就能知道大概下一步能够下哪些可能的位置了。

  然后基于这些可能的位置下到可能的位置,比如说可能每一步我至少要到十个最有可能的位置,我说那行,其实我就可以做暴力搜索,每一步模拟找到几个最有可能的下法,然后去做到最后的结果。这就是AlphaGo第一步学习的方法,让其棋力提升,就通过刚才强化学习的方法,就是我自己去做,然后每次对弈肯定是有输赢的,有没有这个模型的话,那我就去判断我为什么去赢,把相应的步骤去进行优化的话,我就判断我哪一步可能输了,让我对这个输的哪一步再进行优化,就会得到更好的结果。

  刚才讲的人工智能的一些基础的理论,我做了一些简单的总结,就是目前解决的问题其实就是一些决策问题,就是这个问题有非常明显的规则,比如说分类问题,识别问题,检测问题,还有路径的规划问题。当然还有一些部分是数据的生成问题,比如说图像的生成应该生成这些问题也是高度规则性的,都是可以解决的。

  然后哪些领域取得突破,就刚才三大领域里面对的内容对机器较难,比如说语音识别,图像的识别,视频的分类,然后复杂棋类的竞技电子、竞技游戏等等,其实都是取得巨大突破,或者简单来说就是任何可以沿着路径的问题,其实都是取得了重大的突破。

  但问题是对人类很难的问题,机器基本上是没有办法处理,比如说我去发掘新的概念,必须是没有办法处理。

  人工智能其实还有很多现实的问题,比如说第一点,刚才讲到了目前的人工智能的模型,如果是数据量越多的话,学习的性能越高的,所以说人工智能高度依赖这样我们所要学习的数据,这时候就产生了一个行业:数据标注员。

  比如说对于人脸识别来说,我希望把所有的我需要的人脸,如果是我要看到这个人的眼睛在哪里?鼻子在哪?嘴在哪?那我就需要就是把人的鼻子眼睛嘴,X轴Y轴的位置,都要标注出来,这个需要数据标记员来说肯定是非常高的。没有这些标注,你人工智能系统都没有办法去判断人脸的这些眼睛,鼻子的位置在哪里。

  所以会发现数据标注本身其实蕴含了大量的人类知识,这其实我们可以推断一个基本的结论,就是目前的人工智能是完全依附于人类的,不可能去创造出新一些新的历史,因为人工智能所创造数据这块,都是依赖一些人类的先验知识。

  第二点的话,就是人工智能它高度依赖计算资源,比如说现在一些人脸识别的系统,它一般都是只能放在后台的大规模的集群计算机里面去进行计算,手机上是没有办法实施进行处理的。

  第三点的话,就是就是说有一个词叫做过度拟合易攻击,举个例子,我们比如说对于数据这个问题,比如说可能有一些在人工智能领域,可能有些不太能依靠这种智能去解决,比如说用AI去预测某个人他有没有犯罪的倾向,这个东西其实很容易引起社会争议,为什么?因为你从全球的角度来说,黑人或者说像长长胡须的一些人,他一定会有更大的可能被判断为犯罪分子。很简单,是因为在社会中黑人,或者留长胡须的人,因为受到社会的影响,还有他们社会地位比较低等等各种因素,它们的犯罪率是远远高出其他人,这时候其实就会产生大量的政治不正确,比如说像种族歧视的问题。

  还有一个最近可能出现,有一些新的方案,比如说用AI去判断一个人是否有党性,你说这种东西怎么去判断,还是我先找到一堆历史的数据,这些历史数据,比如说可能是人参加组织生活的这种次数,比如在微信里面发表反动言论的这种频率等等,然后这个人是否在工作场合是否工作等等这样一些特征,去看看这个人可能党性比较好,党性不好。当然你像当前的环境,你是否党性测试会产生指鹿为马的可能性呢?谁都不好说。

  

  这是第一点,第二点的话就是模型它可能易受攻击,我们举这么一个很经典的例子,对,(ppt演示)左边是一张原始的图片,这是大熊猫。但是我加一个很微小的微小的一个噪声,把这个噪声压到咱图像里面,会发现这张图片,可能以很高的概率去识别成长臂猿了。这在当前机器学习的领域是一个非常常见的现象,而且这个现象目前来说没有办法有效解决。为什么?因为这个模型一般来说非常的复杂,模型非常复杂,这个前提之下,你这个模型复杂,它可能会遇到一些非常奇怪的结果,

  大家可以下去就画一个,比如说大家可以下去去画一个,比如刚才图书那个问题,总共不是一百个点,一百个点用一次函数去拟合的话,发现可能很多点你可能误差都是非常完整非常大的。

  然后有一个很简单方法,我可以用一百次函数去拟合,这一百个点很明显,每个点肯定都是能够拟合得非常好。想象一下都可以知道,一百个函数在整个空间里面,它可能是上下跳跃的幅度非常大,这个就带来一个很现实的问题,就是过度拟合。就是说我可能预测480页这个书有多少钱话,我可能预测一个结果:-100,这明显就是一个过度拟合。但是比如有一本书,它在训练数据中它可能是450页,然后它的价格是一百块钱。可能这个模型就很精确的预测出它是一百块钱,但是451页,他要预测的话,它是比如说0.1块钱,这都是有可能的。但是你用线性函数,它就不会产生这样的结果,这就是对抗样本。

  还有一个在人脸识别领域,就是有些干扰物,它对人脸识别影响非常大的。比如说上图是一个戴特制眼镜的一张照片,下一步当然人脸所对应的搜索结果,但是会发现肯定它不是同一个人的人脸,但是就现有的人脸识别系统很容易就判断错,所以说大家会在火车站发现,如果说你戴着眼镜的话,基本上是识别不成功的。这个系统,可能会当把你当前照相人脸和身份证上人练,认为不是你同样一个人。

  反正总结一下高度依赖数据,高度依赖自然资源,过度拟合易攻击。

  另外还有两点就是人工智能现代网络就是知其然,不知其所以然,怎么理解呢?阿尔法去进行下棋的时候,现在就是顶级的一个棋手都不知道为什么要下到这么一个非常奇怪的位置上,而且没有任何道理。这就是知其然而不知其所以然。

  所以包括图像理解,我有一个非常复杂的函数,把这张图像的预测结果输出来,但是中间他怎么操作的,人类是不能理解。

  另外一点就是人类的一些动作,根本没有办法完成。因为人类都没有办法去定义,就像机器去对这些问题去定义,和学习那是不可能的,因为你没有模型,没有损失的函数及优化等等,这都是没有办法去完成一些探索新的事物。

  (提问环节)好了,我就讲一些基本理论的问题,然后中间可以休息一下,大家来一些提问。主持人先集中问问题,然后一分钟后我来回答这些问题。

  1.人工智能和人最本质的区别

  我个人认为,是当前的人工智能还是完成人所定义的事情,也就是说他是没有任何的思想,没有任何的对现实问题有理解能力,还有对一些问题没有这种拓展能力,比如人是可以对一些问题进行抽象和总结的,但是机器其实是没有能力,他可能有的就把这些问题进行抽象,但是他就没有能力把这些问题进行泛化。

  所以说人工智能目前来说,它其实能够解决人定义的非常好的问题,但是就是人所没有办法去定义和理解的问题,人工智能都没有办法解决。

  2.自然语言处理是用什么语法,是生成语法还是范畴语法?

  我不太清楚生成语法,范畴语法是什么样的意思?我说一下我的理解吧,早期的话可能早期的话就是自然语言的处理方法,其实是有一种基于统计的方法,就是你可以把语法理解成一种概率的分布。

  比如说这个名词,主谓宾,主谓宾就是名词动词名词,其实是一个标准的语法结构,大概人工智能在这处理自然语言的时候,它就会根据这样的一个结构去进行处理,他知道第一个词可能是主语,第二次可能是谓语,第三个词可能是宾语。第一第三个可能是名词,第二个词可能是动词,然后它基于这样一些先验的知识,然后去确定到底这个句子是一个什么意思。因为我知道第一个词什么,第三个词是什么?它都是名词。第二个词它是一个动作,然后它实际上这个语言它基本的意义就是能够理解出来了,我不知道这是不是叫生成语法。

  但是现在深度学习的话,基本上可能就脱离了这一套,可能就脱离了这套语法体系了。

  他就是根据大量大量的数据,然后对这些大量的数据进行建模,发现好像这种语言里面它可能有ABCDEFGHIJK这些语法的结构,然后对应了另外一个语言里面,它可能是有A‘B‘C‘D‘这样一个语法结构,然后里面有一些一一对应的关系,然后这些一一对应的关系我就可以做一些自然语言处理的,翻译的工作。

  因为我不是做自然语言处理方向,那我也只能说一些基本的处理方法。

  当然了,里面最简单一个处理方法就是词频上的处理。就是说比如说一个领域,刚才说垃圾邮件,比如说可能某些东西是免费的,免费这个词就是垃圾邮件的关键词,然后这样一些关键词,我就可以用这些关键词,去让它识别成垃圾邮件。包括这个群里面可能有一些敏感词的分析,敏感词分析其实也是一种基于关键词和词频的处理,在机器学习和对语言进行决策的领域,词频是最简单和最经典方法。

  3.人工智能和数据的种类有关系吗?

  人工智能其实跟数据的种类并没有任何的关系,关系并不是很大。当然要实际去分析问题的时候,就是语音是一个领域的,语音识别是一个领域,然后图像识别是一个领域,自然语言领域是一个领域,不同的领域的话,它的本质就是这些不同的,不同类别的数据,大家先就近一个特征进行处理。特征一般来说都是一些实数一些实数的一个数组,然后用这个数组建立模型去进行决策。

  4人工智能是否具有新的特点?

  我认为现在能处理的数据,还是基本上都能处理。

「 支持红色网站!」

红歌会网 SZHGH.COM

感谢您的支持与鼓励!
您的打赏将用于红歌会网日常运行与维护。
帮助我们办好网站,宣传红色文化。
传播正能量,促进公平正义!


相关文章