海外人肉购物网络社区

中国脑计划颠覆性创新之路八,“神”属于第几智慧等级,从AI,互联网到大脑的7个智能分级​

楼主:人工智能学家 时间:2018-06-19 03:07:22

人工智能学家



原标题:中国脑计划颠覆性创新之路八,扩展冯诺依曼架构,从AI,互联网到大脑的7个智能分级


声明:本文的”神”是借用传统神的概念描述人工智能分级的推导分类,不代表研究者属于宗教人士或有神论者


我们在中国脑计划颠覆性创新之路七中,提出建立人工智能,互联网和人类大脑的联合智商问题,并建立描述人工智能,互联网和人类大脑共同特征的标准智能模型,根据这个模型,我们在本文将对冯诺依曼架构进行扩充,以此为基础,对人工智能,互联网和人类大脑等诸多智能系统进行分级处理,这个研究对于探讨智能系统的未来发展方向起到引导作用,并为中国脑计划颠覆性创新之路第九章关于生命进化方向问题研究奠定基础。


2015年以来,“人工智能”成为科技界和产业界最热门的词语。智能冰箱、智能空调、智能手表和智能机器人,还有谷歌、百度各自的人工智能大脑等新产品不断涌现。但与此同时,人工智能威胁论也甚嚣尘上。我们能否通过研究人工智能产品和系统的智商发展水平并与人类智商进行对比,从而为解决人工智能威胁论问题寻找定量的分析方法呢?

人工智能定量评测目前面临两个重要挑战:第一,人工智能系统目前没有形成统一的模型;第二,人工智能系统与以人类为代表的生命体之间目前没有形成统一的模型。

这两个挑战都指向了同一个问题,即对于所有的人工智能系统和所有生命体(特别是以人类为代表的生命体)需要有一个统一的模型进行描述,只有这样才能在这个模型上建立智力测量方法并进行测试,从而形成统一的、可进行相互比较的智力发展水平评价结果。

标准智能模型和人工智能智商测试

从2014年开始,中国科学院虚拟经济与数据科学研究中心和北京交通大学团队针对如何定量分析人工智能与人类智慧的关系进行了研究,研究参考了冯·诺伊曼结构、戴维·韦克斯勒人类智力模型、知识管理领域DIKW(Data, Information, Knowledge, Wisdom,数据、信息、知识、智慧)模型体系等。分别在2014年和2015年发表论文提出建立“标准智能模型”,统一描述人工智能系统和人类的特征和属性。

其中,冯·诺伊曼结构给我们的启发是:标准智能系统模型应包含输入/输出系统,能够从外界获取信息,能够将内部产生的结果反馈给外部世界。只有这样,标准智能系统才能成为“活”的系统。

戴维·韦克斯勒关于人类智能的定义给我们的启发是:智力能力由多个要素组成,而非图灵测试或视觉图灵测试那样只关注智力能力的一个方面。

DIKW模型体系给我们的启发是:智慧是一种解决问题、积累知识的能力;而知识是人类不断与外界交互后沉淀下来结构化的数据和信息。一个智能系统不仅仅要掌握知识,更重要的是还要有解决问题的创新能力。这种对知识的掌握能力、解决问题的创新能力与戴维·韦克斯勒理论、冯·诺伊曼架构相结合,就可以形成智能系统智力能力的多层次结构“标准智能模型”,如图1所示。

根据上述研究,可提出标准智能系统的判定标准:任何系统(包括人工智能系统、人类等生命系统),如果符合如下特征,就可以认为这个系统属于标准智能系统。

● 特征1:能通过声音、图像、文字等方式(包括但不限于这三种方式)从外界获取数据、信息和知识的能力。

● 特征2:能够将从外界获取的数据、信息和知识转化为系统掌握的知识。

● 特征3:能根据外界数据、信息和知识所产生的需求,通过运用所掌握的知识进行创新的能力。这些能力包括但不限于联想、创作、猜测、发现规律等,这种能力运用的结果可以形成自身掌握的新知识。

● 特征4:能够通过声音、图像、文字等方式(包括但不仅限于这三种方式)将系统产生的数据、信息和知识反馈给外界或对外界进行改造。

2014年,我们在标准智能模型的基础上构建了人工智能智商评测量表。从信息或知识的输入、输出、掌握和创新等四大方面建立人工智能智商评价体系,并在此基础上建立图像、文字、声音识别、常识、计算、翻译、创作、挑选、猜测、发现等十五个小类,形成人工智能智商评测量表。我们对世界50个搜索引擎和3类不同年龄段人群进行了“人工智能智商测试”,测试结果发现目前人工智能系统的智商远远低于人类智商,评测最高的谷歌系统尚不及6岁儿童智商的一半,见表1。

2016年2月,我们和中国科学院大学刘颖团队开展“2016年人工智能智商测试”,目前已对谷歌、百度、搜狗等人工智能系统以及苹果Siri、微软小冰等进行了测试,工作还在进行中。不过从已完成的工作看,谷歌、百度等人工智能系统的性能比两年前已有大幅提高,但仍与6岁儿童有较大差距。

扩展的冯·诺伊曼架构

标准智能模型的建立参考了冯·诺伊曼架构。冯·诺伊曼架构由计算器、逻辑控制装置、存储器、输入系统和输出系统五个部分构成。通过对比图1和图2的差别能够发现,冯·诺伊曼架构可以补充两个部分。通过这种补充,我们得以将人、机器以及人工智能系统用一个更为明晰的方式表示出来。

第一个补充是创新创造功能,即能够根据已有的知识,发现新的知识元素和新的规律,使之进入到存储器,供计算机和控制器使用,并通过输入/输出系统与外部进行知识交互。第二个补充是能够进行知识共享的外部知识库或云存储器,而冯·诺伊曼架构的外部存储只为单一系统服务。因此,对冯·诺伊曼架构进行扩展,可形成新的架构(见图3)。

人工智能系统智能等级分级标准

在研究的过程中还发现,无论在自然界还是人类社会,即使是智商相同的人工智能系统,因其所在关键领域仍然存在巨大差异,也都存在智能和知识的分级现象。譬如,蚂蚁、鱼、猴子和人类,虽然都属于生命系统,但其种群个体都存在智能的差异。人类的教育体系也存在分级,例如本科、硕士、博士的分级。等级内部进行考核区分优劣,但在不同等级间,需要在知识、能力、资历上有明显提升和考核才能升级。

回到人工智能系统的智商测试上,应如何区分智能系统因在关键领域功能不同而产生的巨大差异呢?上述研究中提到的“标准智能模型”(扩展的冯·诺伊曼架构)给了我们启发,判断标准如下:

● 能不能和测试者(人类)进行信息交互,也就是有没有输入/输出系统;

● 系统内部有没有能够存储信息和知识的知识库;

● 这个系统的知识库能不能不断更新和增长;

● 这个系统的知识库能不能与其他人工智能系统进行知识共享;

● 这个系统除了从外部学习并更新自己的知识库之外,能不能主动产生出新的知识并分享给其他人工智能系统。

人工智能系统的7个智能等级分级

对于人工智能系统的第0级系统,其基本特征在理论上存在,但现实中并不存在这样的人工智能系统。在扩展的冯·诺伊曼架构延伸出来的分级规则中,可以做一些组合,例如可以信息输入,但不能信息输出;或者可以信息输出,但不能信息输入;或者可以创新创造,但知识库不能增长。对于这些在现实中不能或无法找到对应系统范例的案例,我们将其统一划归到“人工智能系统的第0级系统”,也可以叫“人工智能系统的特异类系统”。

对于人工智能系统的第1级系统,其基本特征是无法与人类测试者进行信息交互。例如有一种被称为泛灵论的思想认为天下万物皆有灵魂或自然精神,一棵树和一块石头都和人类一样,具有同样的价值与权利。当然,这种观点从科学的角度看,只能算作猜想或哲学思考。从“能不能和测试者(人类)进行信息交互”的分级规则看,因为石头等物体不能与人类进行信息交互,也许它内部有知识库,能够创新知识,或者能够与其他石头进行信息交互,但对人类测试者来说则是黑箱,不能让人了解。因此不能与测试者(人类)进行信息交互的物体和系统可以定义为“人工智能系统的第1级系统”,符合第1级分类的范例有石头、木棍、铁块以及水滴等等不能与人类进行信息交互的物体或系统。

对于人工智能系统的第2级系统,其基本特征是能够与人类测试者进行交互,存在控制器和存储器,即冯·诺伊曼架构描述的系统,因此很多家用电器被称作智能家电,如智能冰箱、智能电视、智能微波炉和智能扫地机。这些系统大多有一个特点,即虽然它们内部或多或少有控制程序信息,但一旦出厂,就无法再更新它们的控制程序,不能进行升级,更不会自动地学习或产生新的知识。譬如智能洗衣机,人们按什么键,洗衣机就启动什么功能。从购买到损坏,其功能都不会发生变化(故障除外)。这种系统能够与人类测试者和使用者进行信息交互,符合冯·诺伊曼架构描述的特征,而且它的控制程序或知识库从诞生时起就不再发生变化,这种系统可以定义为“人工智能系统的第2级系统”,范例包括日常见到的扫地机器人、老式的家用电冰箱、空调、洗衣机等等。

对于人工智能系统的第3级系统,其基本特征是除具备2级系统的特征外,其控制器、存储器中包含的程序或数据可不联网进行升级或增加。例如家用电脑和手机是我们常用的智能设备,它们的操作系统往往可以定期升级。例如,电脑的操作系统可从Windows1.0升级到Windows10.0,手机的操作系统可从Android1.0升级到Android5.0,这些设备的内部应用程序也可以根据不同的需要不断更新升级。这样,家用电脑、手机等设备的功能会变得越来越强大,可以应对的场景也越来越多。除了家用电脑,很多家用电器、机器人也都开始留有接口,可以通过外接设备进行系统升级。这一类系统明显比第2级智能系统适应性更强。这种系统能够与人类测试者、使用者进行信息交互,但不能与其他系统通过“云端”进行信息交互,其控制程序或知识库只能接受USB、光盘等外接设备进行程序或信息升级的系统,可以定义为“人工智能系统的第3级系统”,范例包括智能手机、家用电脑、单机版的办公软件等。

对于人工智能系统的第4级系统,其基本特征除了包含3级系统的特征外,最重要的是可以通过网络与其他智能系统共享信息和知识。2011年欧盟资助了一个叫作RoboEarth的项目,该项目旨在让机器人可以通过互联网分享知识。帮助机器人相互学习、共享知识,不仅能够降低成本,还会帮助机器人提高自学能力、适应能力,推动其更快、更大规模地普及。云机器人的这些能力提高了其对复杂环境的适应性。这类系统除了具备3级系统的功能,还多了一个重要的功能,即信息可以通过云端进行共享,因此这种系统能够与人类测试者、使用者进行信息交互,可以通过“云端”进行信息交互,进行程序或信息升级。但这类系统所有的信息都是直接从外部获得,其内部无法自主地、创新创造性地产生新的知识。这种系统可以定义为“人工智能系统的第4级系统”,范例包括谷歌大脑、百度大脑、RoboEarth云机器人、B/S(Browser/Server,浏览器/服务器)架构的网站等。

对于人工智能系统的第5级系统,最基本的特征就是能够创新创造,识别和鉴定创新创造对人类的价值,以及将创新创造产生的成果应用在人类的发展过程中。我们在扩展的冯·诺伊曼架构时,对原来的冯·诺伊曼架构增加了创新知识模块,就是试图把人纳入到扩展的人工智能系统概念中,人类可以看作是大自然构建的特殊“人工智能系统”。与前四个等级不同,人类等生命体最大的特征就是可以不断地创新创造,如发现万有引力、元素周期表,撰写出新小说,创造新的音乐、画作等等,然后通过文章、信件、电报,甚至互联网进行传播和分享。不断地进行创新创造,并能够识别创新创造对自身的用处,这让人类占据了地球生态环境下的智力制高点。因此,这种系统能够与人类测试者使用者进行信息交互,可以创新创造出新的知识,并可以通过文章、信件、电报甚至互联网这样的“云端”进行信息交互,这种系统可以定义为“人工智能系统的第5级系统”。人类是第5级人工智能系统最突出的范例。

对于人工智能系统的第6级系统,最基本的特征就是随着时间的向前推进,并趋向于无穷点时,不断创新创造产生新知识的智能系统其输入输出能力,知识的掌握和运用能力也将趋近于无穷大,按照基督教对于上帝的定义“全知和全能”,可以看出智能系统在不断创新创造和不断积累知识的情况下,在足够的时间里以人类为代表的智能系统将最终实现“全知全能”的状态,从这个角度看,无论是东方文化的”神“,或西方文化中的“上帝”概念,从智能系统发展的角度看,可以看作是智能系统(包括人类)在未来时间点的进化状态。


谷歌AlphaGo属于智能的第几等级

2016年3月,谷歌AlphaGo(阿尔法狗)与韩国围棋世界冠军李世石进行了举世瞩目的围棋比赛,并以大比分获得胜利。那么AlphaGo属于人工智能系统的第几级?我们可以根据上述规则进行评定。

因为AlphaGo可以与棋手进行比赛,具有庞大的运算系统和数据存储系统,因此具备第2级系统的条件。在谷歌的研发过程中,AlphaGo的策略训练模型版本通过不断进行大量数据训练而不断升级,从2016年1月与欧洲冠军对战,到2016年3月与韩国围棋世界冠军李世石比赛,AlphaGo的软硬件系统也获得很大提升,因此AlphaGo具备了第3级系统的条件。

从公开的资料看,AlphaGo虽然可以通过网络实现大量CPU和GPU协同工作,但由于保密性或阶段性问题,谷歌目前还没有在互联网上开放AlphaGo程序接受用户的在线挑战,因此AlphaGo不具备第4级智能系统条件。

关于AlphaGo是否具备创新创造性问题,我们认为它依然是依托人工支持的大数据训练形成的策略模型,同时在比赛中结合比赛对手的落点数据,根据其内部的运算规则,来不断形成自己的落点数据,这些落点数据最终形成比赛数据集合。AlphaGo根据围棋规则与对手的比赛数据集合进行计算和比较,判断输赢,整个过程完全在人类设定的规则下运行,无法体现其自身的创造性,如图4所示。

即使AlphaGo形成的落点数据集合很可能是人类历史上没有出现过的,也不能说明AlphaGo具备了独立的创新创造功能。例如,我们用计算机程序实现下述过程:从1万到100万的自然数中随机选取两个数进行相乘,记录相乘结果,重复此过程361次,即使得出的自然数集合很大,并且可能是人类历史上没有出现过的,我们也不能认定该计算机程序具有创新创造性。

如果AlphaGo在没有人类提供数据的情况下,能够主动获取棋谱,自动设计程序进行模拟对战,学习经验,并用于改变自己的训练模型,用于实战比赛,战胜对手,那么在这种情况下,我们才可能认为AlphaGo具备创新性。但从人工智能的发展过程看,AlphaGo还完全无法实现这一点。因此,综合来看,AlphaGo的智能等级被评定为3级,与人类相差两个级别。

工作意义和后续工作

对人工智能系统进行智商测试和智能等级分级,有助于我们更好地对这些智能系统进行分类和评判,同时为低等级智能系统的发展方向提供支持


根据上述研究我们可以每年利用人工智能智商测试方法对相关智能系统进行测试,以此为基础分析不同测试对象的人工智能智商的发展状况,从而发现这些同类产品在人工智能领域的发展差异,测试数据对于这些产品研究竞争对手发展趋势将具有实用价值。另一方面,每年根据测试结果,选取智商最高的人工智能系统和人类测试者智商作为代表,标注在图6.1上。以此作为判断人工智能与人类智慧未来发展关系的基础,从而作为判断前文提到的两条人工智能发展曲线究竟那一条更符合客观事实。


作者:人工智能学家主编  计算机博士  刘锋



附录:中国脑计划颠覆性创新之路七,突破图灵测试局限,建立互联网,AI和大脑联合智商



一,图灵测试的局限性

测试人工智能系统是否具有智能最著名的方法是“图灵测试”。1950年,图灵发表论文《Computing Machinery and Intelligence》提出了“机器思维”的概念[27,28],提出一位测试者在与被测试者相互隔离不能进行直接交流的情况下,通过信息传输,和被测试者进行一系列的问答,在经过一段时间后,测试者如果无法根据获取的信息判断对方是人还是计算机系统,那么就可以认为这个系统具有同人类相当的智力能力,也就是说这台计算机是有思维能力的,这就是著名的“图灵测试”(Turing Testing)。

图灵测试并没有定义智能的范畴,而只能作为一个人工智能的充分条件,关于这一点,图灵在论文中写道:

“机器能否拥有智能,为了回答这个问题我们应该首先定义‘机器’和‘智能’。一种可能性是根据大多数普通人的日常理解去定义这两个概念,但这样做是危险的。在这里我并不打算定义这两个概念,可能有人会说这项测试对机器而言过于严格,毕竟人类也无法反过来成功伪装成机器,这只需检查算术的速度和正确度即可辨别。难道被认为拥有智能的机器就不能表现出和人类不同的行为么?这是一个很有力的反对意见,但至少不管怎样,假如我们有能力制造出一个可以成功通过测试的机器的话,也就无需为这个反对意见烦恼了。”

作为被广泛应用的人工智能测试方法,图灵测试经常用来检验机器是否具备人的智能,但总体看,图灵测试的方法受人为因素干扰太多,严重依赖于裁判者和被测试者的主观判断,因此往往有人在没有得到严格验证的情况下宣称其程序通过图灵测试,例如2014年6月英国雷丁大学客座教授凯文•沃维克宣称一款名为“尤金•古特曼(Eugene Goostman)”的计算机软件通过了测试,但是测试结果充满争议,例如机器人只要能够通过30%的评判标准即可被判定通过图灵测试,另外这个计算机软件通过扮演一名年仅13岁,且第二外语为英语的男孩让参与测试的裁判大幅度降低了测试难度。


中国科学院自动化所研究员王飞跃在“关于人工智能九个问题”中也对图灵测试存在的问题进行了讨论,他的意见主要有以下两点:

(1)第一点是人类的智能并不是一个单一的对象,而是有多个类别组成,同样人工智能对应也是多类别组成。图灵测试究竟测试的那些类别并不明确,从实践上看,目前图灵测试仅仅局限在语言智能等特定小领域里,不具备代表性。

(2)图灵测试并不是考官对一台计算机测试后就可以宣布其是否拥有智能,图灵测试的本意是指一个广义的人类做个为整体的考官,其测试的时间段也不是具体的一段时间而是广义的时间段,即所有的人类在所有时间都分辨不出人与机器之后,才算其人类智能与人工智能等价。

从上述讨论可以看出,图灵测试只对人工智能系统是否具有人类智能回答“是”或“否”,并不对人工智能系统的发展水平进行定量分析,而且测试的智能或智力种类还过于单一;在测试方法上存在漏洞,容易被测试者找到漏洞从而产生作弊行为,从上述存在的问题看,图灵测试目前还无法承担定量分析智能系统智力发展水平的需求。

二。图灵测试的局限性导致的争论和对人工智能误解

因为图灵测试的局限性,导致后来关于人工智能是否超越人类的问题产生了巨大的争议。谷歌技术总监《奇点临近》作者雷·库兹韦尔(Ray Kurzweil)预言人工智能将超过人类智慧。他在书中写道”由于技术发展呈现指数式的增长,机器能模拟大脑的新皮质,到2029年机器将达到人类的智能水平;到2045年人与机器将深度融合,那将标志着奇点时刻的到来[4]”  。

物理学家霍金患有肌萎缩侧索硬化症(ALS),使用英特尔公司开发的一套通信系统和外界交流。这套系统涉及基本的人工智能技术,可以接收霍金的想法,从而提出词语供他选用。当被问到如何改进这套系统的时候,霍金提出了人工智能可以毁灭人类的想法。

霍金表示,截至目前,基础性的人工智能技术已经取得一定成果,很有实用价值。不过,霍金担心,人工智能也许会在将来的某一天赶上甚至超过人类。霍金说:“它自己就动起来了,还能以前所未有的超快速度重新设计自己。人类呢,就要受到缓慢的生物进化的限制,根本没有竞争力,会被超越的。”

特斯拉CEO马斯克对待人工智能的态度比较极端,2014年8月,他在Twitter推荐尼克-伯斯特罗姆的著作《超级智能:方法、危险和策略》时写到:“我们需要超级关注人工智能,它的潜在危险性超过核武器”。

微软创始人比尔·盖茨2015年1月29日在Reddit的“Ask Me Anything”论坛上表示人类应该敬畏人工智能的崛起,它可能将最终构成一个现实性的威胁,但它在此之前会使我们的生活更轻松,他的原话是“我正在关注超级智能。首先在开始的时候机器会为我们做很多工作,这些机器并不是超级智能。如果我们处理得很好的话,这应该是具有积极意义的。那之后的几十年,人工智能会强大到足以引起人们的关注。我同意伊隆·马斯克和其他一些人的说法,不明白为什么有些人并不关心。”

在人工智能威胁论热度日益高涨的情况下,人工智能领域科学家对人工智能威胁论也提出了反驳意见。Facebook人工智能实验室主任,NYU计算机科学教授Yann LeCun 2014年4月在接受IEEE 《Spectrum》采访时发表了对人工智能威胁论的看法,他认为人工智能研究者在之前很长的一段时间都低估了制造智能机器的难度。人工智能的每一个新浪潮,都会带来这么一段从盲目乐观到不理智最后到沮丧的阶段。

Yann LeCun 提出了与威胁论支持者不同的人工智能未来发展路径,他提到大部分人觉得人工智能的进展是个指数曲线,其实它是个S型曲线,S型曲线刚开始的时候跟指数曲线很像,而且奇点理论比指数曲线还夸张,它假设的是渐进曲线,线性、多项式、指数和渐进以及S曲线的动态演变,都跟阻尼和摩擦因子有关系,而未来学家却假设这些因子是不存在的。未来学家生来就愿意做出盲目的预测,尤其是他们特别渴望这个预测成真的时候,可能是为了实现个人抱负。

除了Facebook人工智能实验室主任Yann LeCun,百度首席科学家,斯坦福大学计算机科学系和电子工程系副教授吴恩达,中国科学院自动化所教授,人工智能领域专家王飞跃等也在不同场合对人工智能威胁论提出了反对意见。应该说人工智能威胁论引发争论背后,本质上是人工智能的智力发展水平能不能定量评测的问题。

三。互联网,人工智能和人类大脑的联合智商的提出背景

我们在中国脑计划颠覆性创新之路系列文章中已经阐述,“互联网正在向着与人类大脑高度相似的方向进化,它将具备自己的视觉、听觉、触觉、运动神经系统,也会拥有自己的 记忆神经系统、中枢神经系统、自主神经系统。"




随着博客、社交网络、以及云计算、物联网等技术的兴起,互联网上数据信息正以前所未有的速度增长。互联网用户的互动、企业和政府的信息发布、物联网传感器感应的实时信息每时每刻都在产生大量结构化和非结构化数据,这些数据分散在整个互联网网络体系内,体量极其巨大。这些数据中蕴含了对经济、科技、教育等等领域非常宝贵的信息。这就是互联网大数据兴起的根源和背景。

与此同时,深度学习为代表的机器学习算法在互联网领域的广泛使用,使得互联网大数据开始与人工智能进行更为深入的结合,这其中就包括在大数据和人工智能领域领先的世界级公司,如百度、谷歌、微软等。2011年谷歌开始将“深度学习”运用在自己的大数据处理上,提出了“谷歌大脑”计划[53]。此后百度推出了百度大脑计划,科大讯飞提出讯飞超脑计划。2015年百度创始人李彦宏提出了“中国大脑”计划


从上述研究和技术趋势看,互联网将形成一个与人类大脑高度相似的互联网大脑结构。既然大脑最显著的特征是具有智力,那么我们有可能借鉴对人类智力的研究方法对互联网大脑和因为互联网而崛起的人工智能的智力问题进行研究,从而形成互联网,人工智能和人类大脑的联合智商 。

进行互联网,人工智能和大脑的联合智商问题研究,也将有非常重要的现实意义,这些意义包括帮助基于互联网大数据的人工智能系统提高智能发展水平,发现进一步优化和改良的方法;定量分析人工智能系统与人类测试对照组的智力发展差异等。

四。关于互联网大脑智商的定义

在互联网诞生早期,人们只能通过互联网进行简单的Email通讯,或利用ftp工具上传和下载文件。到2013年,以谷歌为代表的搜索引擎能够高效率的识别自然语言文字,并将搜索结果反馈给用户;苹果公司的Sari系统可以以较高的识别率理解用户的语音指令,并执行相应的操作如拨打电话,报告天气等。

这些现象说明互联网已经开始具备初步的智能并不断增长。由于互联网是由互联网诸多系统或应用组成,譬如电子公告牌、搜索引擎、社交网络、电子邮箱、即时通讯软件(IM)等,这些互联网应用具备或高或低的智力水平,它们的智力水平共同决定了互联网智力水平的高低。

衡量互联网智力水平高低的方式主要有两种,第一种是智力水平最高的那个应用决定互联网智力水平;第二种是各互联网应用联合起来,相互弥补对方不足,共同决定互联网智力水平,从实践看,第二种方式更能客观的反应互联网的智力水平,因此本文将根据第二种方法对互联网的智力水平衡量进行研究。

作为一个庞大的系统,互联网经过近45年的发展,已经包含了成千上万的应用和子系统,由于发展迅速,互联网每天也都在出现新的应用。在进行互联网的智商测试时,如果把所有的互联网应用和子系统都囊括进去,在实践中很难实现。

学习股票指数选取样本企业的方法,我们可以选取普及率高、相对成熟的互联网应用建立互联网智商标准评测库进行测试,互联网智商标准评测库根据互联网的发展定期进行增加或删减。这样可以规避互联网应用过于繁多,同时消失和出现过于频繁的问题。譬如我们可以建立如下类似的互联网智商标准评测库(IA),示例如下:


IA={Google,Facebook,Blogger,Amazon,Yahoo,Youtube,sina,Quora,Wikipedia,Twitter,Baidu}
通过互联网智商标准评测库(IA)的建立,测试整个互联网在某一时间点的智商也就成为可能。进行测试时,一个测试题如果评测库中有一个应用能够通过。则认为整个互联网能够通过该题测试;如果所有应用都无法通过该题测试,则认为整个互联网目前无法通过该测试题。根据以上研究思路,参考前人关于智商的研究成果,本文提出互联网和互联网应用系统的智商定义:

定义一:互联网应用智商IQ,是通过一系列标准测试,测量某一个互联网应用(如电子公告牌、搜索引擎、社交网络、电子邮箱、即时通讯软件等)在测试时间点的智力发展水平,也就是该实时间点该应用的互联网应用智商。
定义二:互联网智商IQ,是通过一系列标准测试对互联网智商标准评测库(IA)进行测量,将测试结果加权平均后,得出互联网在被测试时间点的智力发展水平,也就是该时间点的互联网智商。

五。互联网,AI和大脑的联合智商的模型建立和测试方法

人工智能定量评测目前面临两个重要挑战:第一,人工智能系统目前没有形成统一的模型;第二,人工智能系统与以人类为代表的生命体之间目前没有形成统一的模型。

这两个挑战都指向了同一个问题,即对于所有的人工智能系统和所有生命体(特别是以人类为代表的生命体)需要有一个统一的模型进行描述,只有这样才能在这个模型上建立智力测量方法并进行测试,从而形成统一的、可进行相互比较的智力发展水平评价结果。

从2014年开始,中国科学院虚拟经济与数据科学研究中心,北京交通大学研究团队针对如何定量分析互联网,AI和大脑的联合智商进行了研究,研究参考了冯·诺伊曼结构、戴维·韦克斯勒人类智力模型、知识管理领域DIKW(Data, Information, Knowledge, Wisdom,数据、信息、知识、智慧)模型体系等。我们分别在2014年和2015年发表论文提出建立“标准智能模型”,统一描述人工智能系统和人类的特征和属性。

其中,冯·诺伊曼结构的启发是:标准智能系统模型应包含输入/输出系统,能够从外界获取信息,能够将内部产生的结果反馈给外部世界。只有这样,标准智能系统才能成为“活”的系统。

戴维·韦克斯勒关于人类智能的定义给我们的启发是:智力能力由多个要素组成,而非图灵测试或视觉图灵测试那样只关注智力能力的一个方面。

DIKW模型体系的启发是:智慧是一种解决问题、积累知识的能力;而知识是人类不断与外界交互后沉淀下来结构化的数据和信息。一个智能系统不仅仅要掌握知识,更重要的是还要有解决问题的创新能力。这种对知识的掌握能力、解决问题的创新能力与戴维·韦克斯勒理论、冯·诺伊曼架构相结合,就可以形成智能系统智力能力的多层次结构“标准智能模型”,这个模型对于建立互联网,AI和大脑的联合智商奠定了理论基础。如下图所示。


根据上述研究,可提出标准智能系统的判定标准:任何系统(包括 互联网大脑,人工智能系统、人类等生命系统),如果符合如下特征,就可以认为这个系统属于标准智能系统。

● 特征1:能通过声音、图像、文字等方式(包括但不限于这三种方式)从外界获取数据、信息和知识的能力。

● 特征2:能够将从外界获取的数据、信息和知识转化为系统掌握的知识。

● 特征3:能根据外界数据、信息和知识所产生的需求,通过运用所掌握的知识进行创新的能力。这些能力包括但不限于联想、创作、猜测、发现规律等,这种能力运用的结果可以形成自身掌握的新知识。

● 特征4:能够通过声音、图像、文字等方式(包括但不仅限于这三种方式)将系统产生的数据、信息和知识反馈给外界或对外界进行改造。

2014年,中国科学院虚拟经济与数据科学研究中心,北京交通大学研究团队在标准智能模型的基础上构建了互联网,AI和大脑智商评测量表。从信息或知识的输入、输出、掌握和创新等四大方面建立人工智能智商评价体系,并在此基础上建立图像、文字、声音识别、常识、计算、翻译、创作、挑选、猜测、发现等十五个小类,形成互联网,AI和大脑评测量表。用这个对世界50个搜索引擎和3类不同年龄段人群进行了“互联网,AI和大脑联合智商测试”,测试结果发现目前人工智能系统的智商远远低于人类智商,评测最高的谷歌系统尚不及6岁儿童智商的一半,见表1。


2016年2月,中国科学院大学刘颖团队开展“2016年互联网,AI和大脑智商测试”,目前已对谷歌、百度、搜狗等人工智能系统以及苹果Siri、微软小冰等进行了测试,工作还在进行中。不过从已完成的工作看,谷歌、百度等人工智能系统的性能比两年前已有大幅提高,但仍与6岁儿童有较大差距。

作者 :人工智能学家主编   计算机博士 刘锋







2016年7月,人工智能学家AIE实验室基于自身的研究成果和所拥有的顶级科学家资源,筹备建立未来科技学院 (Futurology University)。

未来科技学院的使命和目标:将邀请国内和国际著名科学家、科技企业家讲授人工智能、互联网、脑科学、虚拟现实、机器人等领域的基本原理和未来发展趋势。未来科技学院的目标是研究前沿科技未来发展趋势,培养掌握未来科技动向的企业家和具有独立创新精神的未来科学家。

开始激动人心的学习之旅:无论您是企业家,投资人,还是青年学子,科技爱好者,如果您希望把握科技未来发展趋势,与世界著名科学家,科技企业家,风险投资家进行直接交流。欢迎您加入未来科技学院大家庭。


您可以扫描二维码,进入未来科技学院临时群,然后工作人员邀请您加入未来科技学院的免费学习群,开启前沿科技未来趋势的学习之旅。


朋友 图片 表情 草稿箱
请遵守社区公约言论规则,不得违反国家法律法规