近年来,我们开始把思维科学的研究成果应用到下一代智能搜索引擎,也越来越清楚地看到,这正在开启、引领下一场技术革命——知识技术革命,而钱学森先生正是这场伟大的技术革命的奠基人。
科学大师钱学森先生在20世纪50年代就开始思考并开创了思维科学(认知科学)领域的研究。回顾自己所走过的科研工作历程,我们深刻地认识到钱先生思维科学思想的巨大科学意义。今天终于将钱老的思想深入研究、发展为科学的模型和理论,并进一步用算法和计算机模拟实现。看到这些得之不易的研究成果付诸实践,我们万分感激和庆幸当年这项工作得到了钱老高度的肯定和密切、深入的指导。
近年来,我们开始把思维科学的研究成果应用到下一代智能搜索引擎,也越来越清楚地看到,这正在开启、引领下一场技术革命——知识技术革命,而钱学森先生正是这场伟大的技术革命的奠基人。
思维科学与计算机模拟技术
钱先生提出人的思维是有规律的,可以用科学的方法研究,思维科学是可以成立的,并于上世纪80年代撰写了著名的《关于思维科学》一书。他认为思维科学只研究思维的规律和方法,进一步指出“思维”可以分成抽象(逻辑)思维、形象(直感)思维和灵感(顿悟)思维三个部分。他特别强调要在“形象思维”研究方面有所突破。钱学森先生还认为计算机模拟对研究人的思维有重要的启发,计算机模拟技术是研究思维的有效工具。
钱老当年还提出,力争二三十年后成立中国思维科学院的设想,并指出重要的是在思维科学领域中动手做些踏实的工作。并对思维科学研究人员组成、人才培养和研究规划等给出具体的设想。
当时人工智能研究的焦点是逻辑符号推理系统,日本正在提出第五代智能计算机计划,声称日本不仅能在技术上做得精致,还要用这个计划在基础研究和思想上对作出贡献。
我们把钱学森思维科学的思想深入发展成科学的理论,建立了一个思维的结构模型,详细描述了形象思维、逻辑思维和其对应的存储、运算之间的关系;并发现用网络结构可以实现和模拟形象思维。我们也分析了形象思维和逻辑思维的特性和两者之间的关系,同时更加明确了语言、逻辑的局限。根据这些理论,我们认识到以符号、逻辑处理为基础的人工智能存在不能逾越的障碍,我们认为研制真正智能机的关键在于研究人类的形象思维而不是逻辑计算;那时就已经认识到当时日本的智能机计划是一个不可能成功的项目,因为他们只提高逻辑运算的速度而已。
我们将这些理论写成《论思维与模拟智能》一文,钱老进行逐字逐句的修改,并进行深入、细致的讨论,也提出大量宝贵建议。1989年5月14日,在钱老给我们的信中专门谈到这篇文章,他说:“所论问题十分重要,应写成为一篇划时代的经典性文章。”根据钱老这些建议,我们后将这篇文章扩展为6万字的长文,更进一步实现了形象思维的联想记忆数学模型和人工神经元网络的模拟。
钱学森先生的思维科学也得到了人工智能之父、诺贝尔经济学奖和计算机图灵奖获得者司马贺(Herbert Simon)的高度关注,他写信给钱老,希望能和钱老直接探讨思维科学的问题,并认为可以和钱老共同树立一面旗帜。可惜由于各种原因,两位东西方科学大师没有能够直接对话,可以想象若是两位大师的思想直接碰撞,将产生何等的思想火花!
开放复杂智能巨系统与新一代搜索引擎
进入上世纪90年代,钱老和戴汝为院士等学者提出了“开放复杂智能巨系统”理论,并指出这些系统的建立应当由“人”和“机器”共同完成,于是又提出了“大成智慧的理论”。
计算机的发明给人类带来了信息技术和信息革命,但当前信息性地增长,现有的信息技术已使人无法有效使用已有的信息。互联网正是一个“开放的复杂智能巨系统”,已经拥有数千亿的网页,数十亿的网民,可以用数万台服务器并行分布地来处理这些信息。
只有像人一样理解所有的信息,将巨大的信息转变成有用的知识,才能好地利用信息,这将开启从信息技术向知识技术的巨大转变,从以数据为中心向以人为中心转变。
互联网上的巨大开放信息为知识库提供了数据基础,这几年云计算和并行算法的巨大突破为实现这样巨大的知识库提供了硬件和计算平台基础。本世纪初,我们认识到思维科学思想和理论正是新一代搜索引擎的理论基础,新一代搜索引擎就是智能计算机。我们的目标是要建立类似人的知识库,从而可以提供基于知识的搜索,或者说是知识引擎。于是,我们开始探索这些技术的实现,克服算法和工程方面的许多难题。在此过程中逐步认识到,要把人的知识和算法结合起来才能够达到和规模的要求。这又使我们想到钱老早就提出要建立人机共创的智能系统,真是不谋而合。
那么信息和知识之间的主要区别是什么呢?信息通常是杂乱无章的、静态的,存在冗余,并且是以数据为中心的。而知识是结构化的、关联的、分类的,依据内涵排序,并且是以人为中心的。人工生成的知识系统,如维基百科、网页目录等等很好建立,但这些系统尽管参与者众多但容纳的词条到底有限,只有区区几百万条。而由机器自动生成的知识库系统则能处理上万亿条词目。到目前为止,人工生成的知识库与机器生成知识库之间主要的区别在于后者不如前者。为弥补这一缺陷,我们的方法是把人的知识和机器算法结合起来建立一个的知识库。
早在几年前,我们就预测到现有以信息检索为基础的搜索引擎十年后将会被淘汰,我们写信给当时的科技部门负责人,极力建议就智能搜索问题立项,从而抢占下一代技术革命的先机。科技部也很快在“863”计划中设立智能搜索重大项目,这为智能搜索在中国的发展打下了坚实的基础。
任重道远的成果转化知识技术革命的开端
为了把钱老和我们的这些思想、理论和技术成果转化成为革命性的产品,我们于2008年5月成立耶宝智慧公司(Yebol),开发知识引擎或智能机,这也正符合钱老在《关于思维科学》中提出的二三十年后成立思维科学院的设想。我们也于2009年7月推出涵盖1000万个关键词的英文知识引擎,而Mahalo用人工建立的系统才只有十万个关键词。
这是人类次成功地实现这样大规模的知识系统,我们的知识引擎即将涵盖所有搜索。从钱老提出思维科学以来,经过二十多年的不懈努力,我们今天终于迈上智能机产品的个台阶,这只是知识技术革命的开端。
我们现在可以更加清楚地看到,钱老除了研发火箭和导弹的二十多年外,始终走在科学和技术的前沿,他的思维科学、开放复杂智能巨系统和大成智慧的思想和理论奠定了知识技术革命的基础,他又一次对人类的思想、理论和技术作出巨大的贡献。我们继续坚持不懈地朝着我们的目标努力,必将不断迈向知识技术革命的新高度。
(尹红风:博士、耶宝智慧公司负责人;戴汝为:中国科学院院士、控制论与人工智能专家)