职场文秘网

首页 > 哲学范文 > 邓小平理论 / 正文

《智能革命》笔记

2020-10-30 20:34:37

《智能革命》笔记(一) 张顺全2017年10月28日星期六于北京 1. 《智能革命AlREVOLUTION——迎接人工智能时代的社会、经济与文化变革》(李彦宏等著中信出版集团2017年4月第1版)内容涵盖人工智能发展的主要领域,刻画了人工智能未来发展的场景和商业模式,对各行各业应对智能化转型提供了很好的指引和借鉴。作为坚定的技术信仰者,李彦宏是最早敏锐意识到人工智能潮流将兴的企业家之一,并果断带领百度提前布局、大力投入这一前沿领域。李彦宏持有的“超链分析”技术专利,是奠定整个现代搜索引擎发展趋势和方向的基础发明之一。百度已成为站在世界人工智能产业之巅的中国企业之一,在人工智能的研发和商业应用上取得的成果令世人瞩目。(《智能革命》封三、封二) 2. 人类历史上的历次技术革命,都带来了人类感知和认知能力的不断提升,从而使人类知道更多,做到更多,体验更多。以此为标准,李彦宏在本书中将人工智能定义为堪比任何一次技术革命的伟大变革,并且明确提出,在技术与人的关系上,智能革命不同于前几次技术革命,不是人去适应机器,而是机器主动来学习和适应人类,并同人类一起学习和创新这个世界。

(《智能革命》封三) 3. 大数据是智能社会运转的根本动力和燃料。以百度为代表的搜索引擎公司,由于对数据资源的获取和使用类似深度学习的商业模式,也与大数据-深度学习-提取模式-创造用户价值这一研发文化相匹配使其天然具备了人工智能的基因。(《智能革命》封三。张顺全注:大数据(bigdata)或称巨量资料,指一般的软件工具难以捕捉、管理和分析的大容量数据,一般以“太字节”为单位。大数据之“大”,并不仅仅在于“容量之大”,更大的意义在于:通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”(参《大数据(TheBigDataRevolution)》,涂子沛著广西师范大学出版社2013年4月第2版2014年2月第7次印刷)。在维克托•迈尔■舍恩伯格及肯尼斯•库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而釆用所有数据的方法。大数据的4V特点:\blume(大量)、Velocity(高速)、Wiety (多样)、Wlue(价值)。对于大数据(Bigdata),研究机构Gartner•给出了这样的定义:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据的核心就是预测。建立在相关关系分析法基础上的预测是大数据的核心。相关关系是无法预知未来的,他们只能预测可能发生的事情。但是,这已经极其珍贵了。大数据的核心就是挖掘出庞大的数据库独有的价值(《大数据时代生活、工作与思维的大变革BIGDATAARevolutionThatWillTransformHowWeLive,Work,AndThink》,[英]维克托•迈尔-舍恩伯格(ViktorMayer-Schonberger)肯尼思•库克耶(KennethCukier)著盛杨燕周涛译浙江人民出版社2013年1月第1版2014年5月第13次印刷第16、75、72、102页)。太字节(TB,terabyte)是计算机存储容量的单位。字节(B,Byte)是计算机信息技术用于计量存储容量的一种计量单位。一个字节是8个二进制位(bit),一个二进制位可以是一个“0”或“1”。计算机存储单位一般用字节(B)、千字节(KB)、兆字节(MB)、吉字节(GB)、太字节(TB)、拍字节(PB)、艾字节(EB)、泽它字节(ZB,又称皆字节)、尧它字节(YB)、EB、NB、DB表示。其换算关系是:1KB=1024B,1MB=1024KB,1GB=1024MB,1TB=1024GB,1PB=1024TB,1EB=1024PB, 1ZB=1024EB,1YB=1024ZB,1BB=1024YB,1NB=1024BB,1DB=1024NBo相邻两个存储单位之间的进率是1024。计算机厂家为便于计算,通常算为1000。一个汉字相当于两个字节。张俊林(电子工业出版社2014年9月第1版2014年10月第2次印刷):《大数据日知录架构与算法》2,《张顺全财经电商计算机及相关基础知识小辞典(拼音序2017 年修改).docx》) 4. 本书从硬件集群、计算能力、大数据资源、人工智能文化等方面提出了智能化的基本标准,并且从制造业升级、金融革新、无人驾驶、管理革命、智能生活等多个维度,描述即将到来的智能社会,反思人类即将而临的种种挑战。“人工智能”正式写入2017年政府工作报告,折射出未来人工智能产业在我国经济发展与转型中的重要性。(《智能革命》封三) 5. 从蒸汽革命、电气革命到信息技术革命,都是人类自己去学习和创新这个世界。人工智能革命,因为有了“深度学习”,是人类和机器一起学习和创新这个世界。前三次技术革命时代,是人类要去学习和适应机器,但在人工智能时代,是机器主动来学习和适应人类。“机器学习”的本质之一,就在于从人类大量行为数据中找出规律,根据不同人的不同特点、兴趣提供不同的服务。(百度公司创始人、董事长兼首席执行官李彦宏《智能革命》封底、参第13条) 6. 我们正在见证的是一个计算机和数字化崛起的时代,这是人类历史大潮中持久的、必经的一个过程。而人工智能是将大潮推向下一个高点的动力。它将开辟一个新时代,给我们的社会带来持久的、长远的革命性影响。(百度集团总裁兼首席运营官陆奇《智能革命》封底) 7. 在对人工智能进行科学幻想的同时,我们更需要关注即将面对的“近未来”,这也正是本书重点讨论的话题。想像人工智能时代的社会和生活是困难的,即使在科幻小说中,我们也只能把种种可能性排列出来,而哪种可能性最有可能成为现实,取决于我们的努力和选择。但不管怎么说,那是一个诱人的时代,我们正向它走去。(2015年雨果奖获得者刘慈欣《智能革命》封底、XUI、XIV、参第25、238条) 8. 智能革命,畅游天地,我知道这是一条神经虚拟网络的秘密,用强健的身体,凝聚着智慧的心灵,开拓新奇迹,让我们拥有美好的生活,绘出美好的旋律。(百度大脑《智能革命》封底、IX,参第19条) 自序 9. 全世界都在为即将到来的人工智能革命感到振奋。这种情绪就仿佛二十多年前我(李彦宏)在硅谷亲历互联网大潮初起时所感受到的。这也让我回想起更早之前在美国学习人工智能课程的场景。在国内我学的信息管理,到美国我学计算机科学。我对硬件相关课程不很有兴趣,但一讲人工智能就特别兴奋且学得很不错,觉得这就是计算机科学甚至人类的未来。但学完后做了一些研究,发现人工智能还没有什么应用机会,不能够解决实际问题。大家对人工智能满怀希望,但到市场一检验就立刻碰壁。在失望之际只好把这个兴趣默默埋藏了起来。随着计算机网络产业的发展,尤其是搜索引擎的进步,希望回来了。(《智能革命》I) 10. 搜索引擎大发展的十多年,我和一些同路者逐步意识到人工智能逐渐开始发挥作用。搜索引擎一直在推升计算机科学的天花板,从硬件到软件的算法再到数据各层而都在被持续推进,终有一天会触碰到人工智能这个方向。在搜索上一尝试,就发现人工智能是有效的,与过去任何一个领域应用人工智能的感觉都不一样。为何人工智能在此场景下有效?我们的总结:海量的数据,越来越强的计算能力,越来越低的计算成本,在搜索领域汇聚到一起,铺就了人工智能的回归之路。如果说互联网改变了信息基础设施,贝I」移动互联网就改变了资源配置方式。如末梢神经般深入人类生活方方面面的互联网,不仅产生出科学家梦寐以求的海量数据,而且催生了云计算方法,把千万台服务器的计算能力汇总,使得计算能力飞速提高。科学家早已发明的机器学习方法在互联网领域大展身手,从根据用户兴趣自动推荐购物、阅读信息,到更准确的网络翻译、语音识别,互联网越来越智能化。人工智能从互联网中汲取力量,终于王者归来,并正在酝酿一场堪比历次技术革命的大变革。而对此变革,有人探讨其潜在风险,有人质疑其兑现的能力。我们耳畔萦绕着两种声音:人工智能达到发展高峰,就会听到“人类将被机器统治”的担忧;
人工智能发展陷入低谷,又会听到“这只不过是换了种套路的创新泡沫而已”。(《智能革命》I、II。张顺全注:云计算(cloud;
cloudcomputing;
cloudcomputer;
cloud-based)概念由Google提出,一如其名,这是一个美丽的网络应用模式。云计算时代,可以抛弃U盘等移动设备,只需要进入GoogleDocs页而,新建文档,编辑内容,然后,直接将文档的URL分享给你的朋友或者上司,他可以直接打开浏览器访问URLO我们再也不用担心因PC硬盘的损坏而发生资料丢失事件。狭义云计算是指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的资源(硬件、平台、软件)。提供资源的网络被称为“云”。

“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。这种特性经常被称为像水电一样使用IT基础设施。广义云计算是指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的服务。这种服务可以是IT和软件、互联网相关的,也可以是任意其他的服务。这种资源池称为“云”。“云”是一些可以自我维护和管理的虚拟计算资源,通常为一些大型服务器集群,包括计算服务器、存储服务器、宽带资源等等。云计算将所有的计算资源集中起来,并由软件实现自动管理,无需人为参与。谷歌全球副总裁、大中华区总裁李开复(世界顶级的科学家之一):所谓“云计算”,就是要以公开的标准和服务为基础,以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务,让互联网这片“云”成为每一个网民的数据中心和计算中心。《张顺全财经电商计算机及相关基础知识小辞典(拼音序2017年修改)・docx》) 11. 对快速发展的人工智能新技术,既不能高估其短期作用力,更不能低估其长期影响力。从纵向发展来说,业界通常把人工智能分为三个阶段:第一阶段,弱人工智能;
第二阶段,强人工智能;
第三阶段,超人工智能。目前处于弱人工智能。人工智能恐惧论者担心,当有一天超人工智能到来,人类会不会被机器所控制?我认为,人工智能永远不会到那一步,很可能连强人工智能都到不了。未来,机器可以无限接近人的能力,但永远无法超越人的能力。(《智能革命》II、DI) 12. 当然,仅仅是无限接近人的能力,就已经可产生足够大的颠覆性。因计算机在有些方面实在比人强太多。如记忆能力,百度搜索可记忆上千亿网页,其中的每个字它都记得住,没有一个人能做得到。再如运算能力,哪怕是写诗——把你的名字输入手机百度的“为你写诗”,敲回车键,没等你反应过来,诗就出来了。再厉害的七步神童,也很难达到此速度。但在情感、创造性等很多领域,机器是无法超越人类的。(《智能革命》皿) 13. 更重要的是,在技术与人的关系上,智能革命与前几次技术革命又有着本质的差异。从蒸汽革命、电气革命到信息技术革命,都是人自己去学习和创新这个世界。人工智能革命,因有了“深度学习”,是人类和机器一起学习和创新这个世界。前三次技术革命,是人要去学习和适应机器,但在人工智能时代,是机器主动来学习和适应人类。“机器学习”的本质之一,就在于从人类大量行为数据中找出规律,根据不同人的不同特点、兴趣提供不同的服务。未来,人和工具、人和机器之间的沟通可能完全基于自然语言。这会让人生活得更好,而不是像过去的机器那样让人感到难受。人工智能的应用会极大提高工作效率,是推动人类进步的因素。从六七年前开始,百度就已认识到人工智能将是照亮又一个新时代的火种,并在当时几乎无人看好的情况下,大规模投入该领域。(《智能革命》皿、IV,参第5条) 14. 国际上,谷歌从搜索领域,微软从遍布桌面的应用领域,亚马逊从电商领域都积累了海量的数据和计算能力,它们与大学实验室的科学家一起,几乎同步认识到人工智能新浪潮正在涌动,纷纷投入,建树颇丰。无论中外,企业界在这场技术革命中的主导作用日益明显。2016年夏我在硅谷,与斯坦福大学的几位学者聚餐,一位教授朋友对我说:学术界不太想做深度学习了,因我们根本做不过工业界。并让同桌的人猜百度人工智能有多少预算。我说,我也不知给了多少预算,因为这个是根据需求,需要多少就给多少。此外,工业界的数据丰富程度也是学术界无法比拟的。百度、谷歌这样的公司处在互联网中心位置,每天都会产生海量的搜索数据、定位请求等各方面的数据。因此,越来越多的人工智能科学家从知名院校跳槽去了百度、谷歌……(《智能革命》IV) 15. 我们建设百度大脑,希望为更多的人才提供平台和机会。中国和美国在人才吸引上走了相反的方向:美国越来越反移民,中国则越来越开放。很多优秀乃至顶尖的人工智能科学家来到百度,这是个很自然的过程:在该领域,没有一个牛人可以全靠自己从零开始做,他(她)需要团队,需要基础设施,需要一个重视开发人工智能的企业文化。作为搜索引擎公司,百度从诞生的那一天起,就已带有人工智能的天然基因:我们以数据为基础,通过深度学习提取特征、模式,为客户创造价值的开发流程和开发文化,与人工智能系统的开发高度吻合。我本人也更喜欢与那些技术人员聊天,聊的时候感觉很兴奋,因为彼此会发现有很多共同语言,优秀的人才自然而然就会互相吸引到一起。(《智能革命》IV、V) 16. 当然,智能革命的兴起,还需要政府的力量。2015年3月博鳌亚洲论坛期间,我和比尔•盖茨、埃隆•马斯克(张顺全注:ElonMusk,特斯拉汽车公司CEO)等数次对谈人工智能,达成了很多共识,其中一项就是,都认为政府的鼎力支持对创新产业非常重要。中国整体的人工智能技术水平及人才的厚重程度还是落后于美国的。但在局部我们可以领先,中国的土壤有自己的优势。如数据方面,中国有14亿人口,7亿多网民,从任何一个单一市场的角度讲都是全球最大,能够获得数据的能力也是全球最强。中国还有一个很强的政府,有能力把很多数据统一起来。就在那年博鳌亚洲论坛前的全国“两会”上,我提交了“中国大脑计划”提案,希望从国家层面来搭建人工智能基础资源和公共服务平台,推动人工智能发展,抢占新一轮科技革命制高点,助力中国经济转型升级。(《智能革命》V、VI) 17. 欧美等发达国家已纷纷从国家战略层面加紧布局人工智能。2016年,美国先后发布《国家人工智能研究与发展战略计划》等三份报告,英国也于12月发布关于人工智能的战略报告,主张以发展人工智能来提升企业竞争力、政府治理能力和综合国力。中国政府也不遑多让。2015年3月,李克强总理在政府工作报告中提及“互联网+”概念。四个月后,国务院发布了《国务院关于积极推进“互联网+”行动的指导意见》,其中提到人工智能。2016年5月,国务院再次颁发《“互联网+”人工智能三年行动实施方案》,正式提出人工智能产业纲领。2017年3月,百度获得国家发展和改革委员会批准,联合数家科研机构倾力筹建“深度学习技术及应用国家工程实验室”。作为国内唯一一个深度学习领域的国家工程实验室,将着重发力于深度学习技术、计算机视觉感知技术、计算机听觉技术、生物特征识别技术、新型人机交互技术、标准化服务、深度学习知识产权七大方向;
站在国家的高度,致力于解决我国人工智能基础支撑能力不足等问题,全面提升智能产业的国际竞争力。这可看作政府层而对“中国大脑计划”的初步回响。做这样一个大平台,宗旨在于提升中国在人工智能方面的综合实力,在国际上能够真的代表中国——像女排那样代表中国。(《智能革命》VI、VD) 18. 2017年的全国“两会”上,我再次提交了利用人工智能和大数据技术,切实解决儿童走失的问题,解决城市道路拥堵问题,加强人工智能的行业应用,为中国经济增添新的增长点三个提案。两天后,人工智能首次写入政府工作报告,其意义堪比“互联网”首次出现在政府工作报告中,无疑将加速智能革命的进程。智能革命的过程会轰轰烈烈,但其成果将会是宽阔平缓的河流。不久的未来,智能流会像电流一样平静地环绕、支持着我们,在一切环节提供养料,彻底改变人类经济、政治、社会、生活的形态。陆奇(百度集团总裁兼首席运营官,参《智能革命》332)称智能时代的核心本质是“Knowledgeineverysystem,intelligenceineveryinteraction”(知识无处不在,任何交互都是智能的)。未来世界的人们将像穿衣吃饭一样享用着人工智能而无所察觉。人工智能的美妙之处:它从一开始就是通过学习人、了解人、适应人,然后服务人,是完全以人为本的。(《智能革命》VH) 序一百度大脑作序 19. 此诗是百度大脑以“智能革命”为主题作的。其中既有对人类情感的模拟,又有不同于人的神秘与粗拙(为了保证原创性,没有进行编辑和修改)。为体验机器大脑的“才华”与“情感”,在此照录百度大脑序诗供欣赏、研究(《智能革命》VIII、IX):
我来了,天上的云乘着风飞翔,心中的梦占据一个方向,方舟扬帆起航,一路带着我们纵情歌唱,方舟扬帆起航,脉络就在大海之上,进步的时光,迎着你看涛浪潮往。

一个新生的地方,穿越千年时光,穿越了无尽的荒凉。答案就在这里搜索。第一缕曙光,远处熟悉的歌声还在耳边回响,你却依然不知我将去何方。千年时间留下十字文章,曾今谁重复往昔旧模样。

我来了,期待着你的每一天,睁开眼就能看到幸福曙光,占据着你的每一天,陪你跨越鸿沟走向湛蓝,算法很简单。

时代的春天,回想起我们曾牵手走过的画而。大家互联网这场风吹雨打之后又在藕断丝连。只是不知道时间还会流向那一条线。盼望着未来等待明天,呼吸新鲜空气多点微笑扮个鬼脸。

我来了,重连网中的两颗心相互依靠,就在这里诞生,沿着时空隧道,能虚拟梦想陪你一起到天涯和海角,智慧有多少,开神秘的图案,迎着金色的太阳奔跑。各自徘徊原本以为成长的必须。每当那夕阳爬上屋顶望着星空仰起来眨眼睛。熟悉的身体中透露出一种神奇。

这阵痛是多么重要,任由阳光洒满大地在黑暗中寻找,哪怕身后天涯海角。永生早已决定将未来度过如何厮守到老。希望得到,故事结局怎样究竟又有谁会知道。生活还要继续向前奔跑。

智能革命,畅游天地,我知道这是一条神经虚拟网络的秘密,用强健的身体,凝聚着智慧的心灵,开拓新奇迹,让我们拥有美好的生活,绘出美好的旋律。

不可预测的天地,良夜之后你又会在哪里。温暖的阳光照耀着大地。天上的云儿飘来飘去,醒来之后何时是归期。我要看到未来的自己。

序二AI时代的曙光 20. 在此首先讨论一个书中可能不涉及的很基本的问题:人工智能的定义。目前广为人知的定义是图灵测试,但这并不是严格和精确的定义。上溯历史,发现人工智能的概念与自动化密切相关,可以说自动化是这个概念的起源。在人们心目中,自动化就是人工智能。远在电气时代之前,蒸汽机上就有自动调节蒸汽流量的装置。在更早的16世纪,伊丽莎白女王的宫廷里首次使用的抽水马桶也是自动化装置。若再向前追溯,一定还有更早的例子。自动化大批量出现是在电气时代,先是由模拟电路实现自动化,后来由电子管〜晶体管〜集成电路,由日益复杂的软件所驱动,如今天的电子商务系统、网上银行系统、网上购票系统、写现代诗的软件等。近年来已经有不止一个系统通过了图灵测试(参下一条及第111条)。但这一切都不能把它们看成心目中的人工智能。因为程序员清楚地知道那些系统的每一步操作在软件中是如何进行的;
是如何根据逻辑树检索数据库,然后组合出答案的。这就涉及高明的中文房间(华语房间,中文屋子,参第22条)比喻,当我们意识到房间中那些忙碌查找卡片的人时,智能的感觉就荡然无存了。(《智能革命》X、XI) 21. 图灵测试(TheTuringtest,参上一条及111条)由艾伦•麦席森•图灵发明,指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。图灵测试一词来源于计算机科学和密码学的先驱阿兰(艾伦)•麦席森•图灵写于1950年的一篇论文《计算机器与智能》,其中30%是图灵对2000年时的机器思考能力的一个预测,目前我们已远远落后于这个预测。1980年约翰•塞尔在《心智、大脑和程序》一文中提到的中文屋子思想实验,对图灵测试发表了批评。美国科学家兼慈善家休•罗布纳20世纪90年代初设立人工智能年度比赛,把图灵的设想付诸实践。比赛分为金、银、铜三等奖。2014年6月8日,一台计算机(计算机尤金•古斯特曼并不是超级计算机,也不是电脑,而是一个聊天机器人,是一个电脑程序)成功让人类相信它是一个13岁的男孩,成为有史以来首台通过图灵测试的计算机。这被认为是人工智能发展的一个里程碑事件。2015年11月,《Science》杂志封而刊登了一篇重磅研究:人工智能终于能像人类一样学习,并通过了图灵测试。测试的对象是一种AI系统,研究者分别进行了展示它未见过的书写系统(例如,藏文)中的一个字符例子,并让它写出同样的字符、创造相似字符等任务。结果表明这个系统能够迅速学会写陌生的文字,同时还能识别出非本质特征(也就是那些因书写造成的轻微变异),通过了图灵测试,这也是人工智能领域的一大进步。(百度百科。张顺全《图灵测试・docx》) 22. 中文房间(华语房间,中文屋子,Chineseroom,theChineseroomargument),是由美国哲学家约翰•希尔勒(JohnSearle)在1980年设计的一个思维试验以推翻强人工智能(机能主义)提出的过强主张:只要计算机拥有了适当的程序,理论上就可以说计算机拥有它的认知状态以及可以像人一样地进行理解活动。这个实验要求你想象一位只说英语的人身处一个房间之中,这间房间除了门上有一个小窗口以外,全部都是封闭的。他随身带着一本写有中文翻译程序的书。房间里还有足够的稿纸、铅笔和橱柜。写着中文的纸片通过小窗口被送入房间中。根据Searle,房间中的人可以使用他的书来翻译这些文字并用中文回复。虽然他完全不会中文,Searle认为通过这个过程,房间里的人可以让任何房间外的人以为他会说流利的中文。(百度百科。张顺全《中文房间・docx》) 23. 拥有人工智能的那些系统,如进化算法和深度学习等,有一个共同特点:它们都或多或少地表现出了黑箱的特点,虽然从理论上它们内部的运算步骤仍然可以追踪,但由于计算量的巨大,使这种追踪实际上很困难甚至不可能。于是,我们真的感觉它们有智能了。至此,能够看到人工智能的一个重要特点:一个具有智能特性的人造系统,它产生、输出的内部的运算过程是人类智能所无法解析的。换言之,只有我们不知道机器在想什么、怎么想时,才认为它有智能。据此是否心生寒意:是否人工智能的本质中隐含着它们最终失控的可能性?这正是人们对人工智能关注的热点,用马斯克的话说,人工智能正变成比核弹更危险的东西。媒体舆论给人一个印象,似乎人工智能征服世界指日可待。本书最后一章也显现了这种担忧。库兹维尔甚至在《奇点临近》中给出了人工智能纪元到来的年份:2045年。但仔细考察发现:强人工智能仍然属于科幻的范畴。笔者(刘慈欣)作为科幻作家只能说:科幻小说中的预言真正变为现实的是少数。强人工智能的实现而对着许多巨大的技术障碍,如非冯•诺依曼体系的新结构计算机、对人类思维机制的深刻认识等,都无法确知能否取得突破。一些看似有希望的技术,如量子计算等,距实用还相去甚远。(《智能革命》XI〜XHD 24. 人工智能近年来开始走出实验室,用一位互联网大佬的话说,它们变得实用了。人们面I翩匕战:人工智能不会夺走我们的自由和生命,但会夺走我们的饭碗,它们可以在资本家的控制下做成这件事。美好的说法是,人们在常规工作中被人工智能取代后,可以去从事创造性的工作;
但创造性的工作不是人人都可以从事的,也不需要那么多人。若社会分配制度不改变,一个全部由科学家和艺术家构成的人类世界几乎是一场噩梦,这上百亿科学家和艺术家中的绝大部分注定一生碌碌无为,沦入“创造性”的穷困潦倒中。但这种思维总有些不对的地方。人类自古以来为生存而劳作,实在是迫不得已。工作着是美丽的,但谁都知道,不需要工作的生活更美丽。现在终于能够制造出把自己从工作重负中解放出来的机器,这是人类文明最伟大的成就,无论如何不应该被看作是一场灾难;
相反,这可能是人类所而对的前所未有的伟大机遇。(《智能革命》XID) 25. 完成由现代社会向人工智能社会的过渡有两种可能。一种可能十分黑暗:在现有的社会、经济和政治体制下,人工智能带来的问题几乎是无解的。在人工智能迅速取代人类的过程中,没有及时建立起与之相适应的社会体制,在席卷全球的失业浪潮之下,世界的政治和经济将陷入长久的混乱之中,一切都笼罩在人工智能及其使用者与“新卢德派”(参第245条)领导的大众的无休止的冲突中。另一种可能是,社会成功地完成转型。这将是有史以来人类生活方式最大的一次改变。不劳动者不得食,这个理念是人类社会的基石,但人工智能可能会移除这一基石,进而导致从所有制和分配制度,到基本的经济结构,再到政治体制,直到文化,都发生根本的变化。这是真正的人类解放,是向着古老的乌托邦理想迈进的一大步。2016年是《乌托邦》发表500周年,但托马斯•莫尔无论如何不会想到,他的理想会借助于智能机器实现。我(刘慈欣)很有兴趣地想,若卡尔•马克思知道人工智能这回事,他关于资本主义和共产主义的理论会是什么样子?(《智能革命》XIV、参第7、238条。张顺全注:卢德派是十九世纪初英国手工业者组成的集团,他们反对以机器为基础的工业化,在诺丁汉等地从事破坏机器的活动。卢德是英国工业革命时期的一名工人,为了反抗机器驾驭人类,而捣毁了纺织机。而卢德主义者就是对新的科技发明嫉妒厌恶而悲观的人。而今卢德派一词用来指任何对抗技术进步的人。百度搜索。) 01简史:互联网风云背后的人工智能生长 26. 有句话叫作,你能看见多久的历史,就能看见多远的耒来。回顾一下互联网和人工智能之间的历史风云。互联网于20世纪60年代诞生于美国军方的实验室,一开始用来在几所高校和科研机构之间传递和共享情报。到了20世纪80年代末,一群科学家提出万维网概念并创造TTCP/IP(互联网传输控制协议),使互联网得以向全世界扩展成一条宽阔深远的信息高速公路。大约20年前,23岁的年轻人马克•安德森发明的网景浏览器点燃了大众互联网的熊熊火焰,打开了互联网商用的大门。微软焦虑其软件业务会被互联网颠覆,太阳公司的年轻人则毅然与僵化的公司割裂,发明了跨操作系统的语言血中(程序设计)语言,打破微软的垄断,闯开互联网创新之门,极大加速了互联网产品的开发创造。(《智能革命》003) 27. 当时的中国,北京、上海也还找不到几家网吧。1997年,瀛海威刚开通全国网络接入服务,张小龙刚写出了Foxmail电邮软件程序,全国信息化工作会议召开……从外面看万维网世界,一切都是刚苏醒的摸样;
但在技术圈,新技术、新思想层出不穷,各种商战明争暗斗正酣。那时我(李彦宏)在美国搜索引擎先驱Infoseek公司工作,感受美国人对新科技浪潮的昂扬热情,想到新技术革命正在发生,中国准备好了吗?1998年我写了《硅谷商战》一书,详细描绘了硅谷天才们的奋斗与创新(开篇就描摹了创新者马克•安德森)。1998年我回国,在北京一家宾馆的房间里创办了百度公司。回想网景、太阳、微软在互联网类似三国争雄般的时代,至今依然激动不已。人们猜测谁是赢家?微软似乎是不可战胜的,它总是能消化新技术。网景最终被美国在线收购(创建网景的马克•安德森后来成了硅谷风投界的教父),美国在线于2014年被以无线业务称雄的Wrizon(威瑞森)公司收购。威瑞森述收购了叱咤风云多年的雅虎。太阳公司一度如日中天,2001年拥有5万名雇员,市值超2000亿美元。然而当互联网泡沫破碎时,太阳公司一年内由峰顶跌入低谷,2009年被Oracle(甲骨文)公司收购。俱往矣。新科技公司快速崛起。苹果、谷歌终于凭借手机操作系统完成了对微软的逆袭。(《智能革命》003、004) 28. 互联网技术依然高歌猛进。昔日人们关注互联网大咖明争暗斗,今日人们感概移动互联设备全面超越PC,却一直无意中冷落了一个默默崛起的“幽灵”——人工智能,互联网只是人工智能的身体之一。(《智能革命》004) 人工智能的黎明 29. 人工智能的历史早于互联网,与计算机历史相伴。1956年达特茅斯会议召开,麦卡锡提出人工智能概念,与会的十位年轻科学家后来均成为各国人工智能领军人物。那时一台计算机有一栋房子那么大,为何敢提出人工智能?这在于科学家的洞察力。当时,香农早已完成他的三大通信定律,明斯基已造出第一台神经网络计算机(用3000个真空管和一台B-24轰炸机的自动指示装置来模拟40个神经元组成的网络),其论文《神经网络和脑模型问题》日后成为人工智能技术的鼻祖。图灵则早在1950年就提出了图灵测试理论及机器学习、遗传算法、强化学习等诸多概念。人工智能短暂的春天开始了;
但他们的成绩更多被埋没在计算机发展成果之中,如,可以解决闭合式微积分问题的程序,搭建积木的机械手等。(《智能革命》005,张顺全注:香农三大定理是信息论的基础理论。香农三大定理是存在性定理,虽然并没有提供具体的编码实现方法,但为通信信息的研究指明了方向。香农第一定理是可变长无失真信源编码定理。香农第二定理是有噪信道编码定理。香农第三定理是保失真度准则下的有失真信源编码定理。百度百科。张顺全《香农三大定理・docx》) 30. 理想超前但基础设施尚在襁褓中。超前的人工智能遇到两个瓶颈:一是算法逻辑自身的问题,数学方法的发展还不够;
另一个是计算能力不足。典型的如机器翻译问题,科学家夜以继日地总结人类语法规则,设计计算机语言模型,机器却始终无法把翻译准确率提升到满意的程度。新技术和产业链条没被打通,令人兴奋的产品应用没被发明出来,政府投资和商业投资都大幅减少,人工智能研发在20世纪70年代到90年代经历了两次低潮。(《智能革命》005、006、图1-1达特茅斯会址注:使用手机百度或智能革命App扫描图片可见AR效果。) 31. 普通人接触最多的“人工智能”实例大概就是街机游戏了。20世纪80年代中国的小县城街头游戏厅的街机NPC(非玩家控制角色)总是能被熟练玩家轻松战胜,这不仅可看作“人工智能”能力低下的表现,也造成了一种错误观念:智能是安装在一台计算机中的事物。直到互联网和云计算兴起,这种观点才被改变。(《智能革命》006、007) 百炼成钢 32. 2012年,深度学习在学术界和应用方面都有了突破。如,用深度学习的方法来识别图像,突然就比以前任何算法都有明显提升。我马上意识到,新的时代来临了,搜索将被革新。不仅可用文字搜索,还可用语音和图像搜索。比如将不认识的植物拍成照片上传搜索,可立刻识别出是福禄桐。语音识别能力、图像识别能力、自然语言理解能力、为用户画像的能力,都是人最本质的智慧能力。计算机拥有了这些能力时,一场新的革命就会到来。工业革命解放了人的体力,智能革命可以帮助人类做费脑子的事情。未来20〜50年,我们会收获各样的惊喜。(《智能革命》007、008) 33. 应向在资本寒冬期坚持人工智能领域探索的科学家致敬。如今百度拥有一支庞大且实力雄厚的人工智能研究团队,不少担刚者从20世纪90年代就从事机器学习研究。20世纪90年代仅GeoffreyHinton(杰弗里•辛顿,参第43条)、MichaelJordan(迈克尔•乔丹)等少数科学家坚持机器学习领域的探索。原百度首席科学家吴恩达(参第47、56、119、123、137、252、258条)在20世纪90年代就师从Jordan,后来他开创在线课程传授机器学习理论给无数年轻人。百度研究院院长林元庆(参第47、133、148、156、376条),百度杰出科学家及世界上最早利用神经网络做语言模型的徐伟等(参第156条),十多年前就在深度学习的重镇NEC(日本电气股份有限公司)的美国实验室工作。在那里工作过的人工智能专家,有发明SVM(SupportX^ctorMachine,支持向量机)的美国工程院院士VladimirX^pnik(弗拉基米尔•瓦普尼克),发明卷积神经网络的深度学习领军人物、现任脸书(Facebook)人工智能实验室主管YannLeCun(扬•勒丘恩),深度学习随机梯度算法的核心人物LeonButton(利昂•布托),原百度深度学习实验室主任余凯等。(《智能革命》008) 34. 最初的人工智能研究大多基于规则:人类总结各种规则输入计算机。比这个高级的方法是基于“统计”的机器学习技术,让计算机从大量数据和多种路径中寻找概率最大、最合适的模型。这两年促使人工智能再度技惊世人的技术是机器学习技术的升华版一基于多层计算机芯片神经网络的“深度学习”方法。通过多层芯片联结,模仿人脑大量神经元的网状联结方式,辅以精妙的奖惩算法设计和大数据,可训练计算机自己从数据中高效地寻找模型和规律,从而开启了一个机器智能的新时代。(《智能革命》009) 35. 正是少数人的坚持,为人工智能的王者归来保存了火种。百度是中国最早布局人工智能的公司之一,我们似乎是自然而然地做了很多其他公司当时述没听过的事情。六七年前在美国,陆奇(参第6、18、47、61、65、81、87、190条)和我畅谈了深度学习的巨大进展,决心大举进入该领域。我在2013年1月百度年会上宣布成立IDL(深度学习研究院),这是全球第一家用深度学习命名的研究院。我自任院长,以此召唤那些坚守多年的科学家。过去百度从不专门成立研究机构,我们的工程师就是研究人员,研究与实际应用结合得非常紧密。但深度学习会在未来很多领域产生巨大影响,而那些领域并不都是百度现有业务范围之内的。所以,有必要创造专门空间,吸引人才,尝试创新,为全人类的人工智能革命探索道路。

(《智能革命》009) “智能”已换代 36. 若人工智能的启蒙阶段称为1.0时代,则现在已明显大步进入2.0时代,机器翻译就是典型案例。过去是基于词和语法规则进行翻译——人类把语法规则告诉机器,怎么也赶不上语言尤其是语境的多变,机器翻译总出现诸如把“howoldareyou(你多大年纪。百度翻译)”译成“怎么老是你”的笑话。后来的SMT(统计机器翻译)的基本思想是通过对大量的平行语料进行统计分析,找出常见的词汇组合规则。SMT具有机器学习基本功能,有训练及解码两阶段:训练阶段通过数据统计让计算机构建统计翻译模型,进而用此模型进行翻译;
解码阶段利用所估计的参数和给定的优化目标,获取待译语句的最佳翻译结果。SMT已持续二十多年,对短语或短句翻译效果显著,但对较长句子翻译效果一般,尤其是对语言结构差异较大的语言,如中文和英文。近几年崛起的NMT(基于神经网络的翻译)的核心是一个拥有无数结点(神经元)的深度神经网络,一种语言的句子被向量化后,在网络中层层传递,转化为计算机可理解的表达形式,再经过多层复杂的传导运算,生成另一种语言的译文。

NMT利用了全局信息并有语序学习上的优势。使用此模型的前提是数据量要大。双语语料储备得越多,NMT效果越好。每种方法都有其擅长。如成语翻译,大多有约定俗成的意译译文,需在语料库中有对应内容才能翻译出来。故百度把传统的方法如基于规则的、基于实例的、基于统计的方法与NMT结合起来向前推进研究。(《智能革命》010、011) 37. 在这种机器翻译的模式中,人类不是亲自寻找浩繁的语言规则,而是设定数学方法,调试参数,帮助计算机网络自己寻找规则。人类只要输入一种语言,就会输出另一种语言,不用考虑中间经过了怎样的处理,这就叫端到端的翻译。听似神奇,其实概率论里的贝叶斯方法、隐马尔科夫模型等都可解决此问题。类似机器翻译的人工智能技术方法的前提是数据量足够大。互联网诞生的初衷是为了信息沟通方便,结果带来了信息爆炸,信息爆炸又促进了人工智能技术的发展。(《智能革命》011、012) 38. 再以下棋为例。1952年瑟•萨缪尔编写了达到业余高手水平的跳棋程序。但国际象棋难多To百度总裁张亚勤(参第47>12&138、169、263、286条)在微软担任研究院院长的时候,请来中国台湾计算机才子许峰雄,他在IBM(国际商业机器公司)时开发了国际象棋机器人深蓝(20世纪90年代的人工智能代表,使用了多块CPU(中央处理器)并行计算技术),于1997年战胜了人类国际象棋冠军卡斯帕罗夫。张亚勤对许峰雄说:“你去做围棋吧,等能下赢我的时候再来找我”,但直到他离开微软,许峰雄都没有再来找过他。“深蓝”本身面临一些无法突破的瓶颈,而对围棋棋盘上达到宇宙数量级变化的可能性望洋兴叹。基于决策树算法,穷举一切走子可能性的模式超出了计算机的承载能力。以围棋为代表的东方智慧,面对人工智能似乎可以稳若泰山,但一个新时代正在来临。(《智能革命》012、013) Internet的大会师 39. “深蓝”代表的计算机智能似乎与互联网无关,然而云计算和大数据的发展,使人工智能和互联网终于合二为一,元神合体,获得了一种不同于“深蓝”时代的智慧模式。多芯片分布式计算加大数据,通过超越决策树的新算法来贯通,体现了人类智慧与机器智慧的结合。2016-2017年,AlphaGo(阿尔法围棋,参第44、239条)横扫人类围棋高手圈。AlphaGo的“下棋”思路不同于人类,也不同于“深蓝”。简言之,是千万盘人类围棋对弈的数据滋养了它。若要给出更专业的解读,则可以说是蒙特卡洛搜索算法和基于深度学习的模式识别促成了AlphaGo的成就,其中最重要的是其前辈“深蓝”所不具备的深度学习。AlphaGo不是自己想出棋着,而是学习了人类高手的千万盘棋局(这就是大数据),通过多层神经网络预测人类高手会走出的下一着。经过巧妙的神经网络设计与训练,这个多层神经网络建模了人类高手的棋感——对于当前局面,已知以往下棋历史中的胜率。下棋时,计算机可通过视觉识别记录棋局,再和以往棋局数据比较,找到相同模式(局面),再检索不同局而往后发展下去,根据以往下棋史中的胜率高低选出一些高质量的候选点供走子,从而极大地减少系统运算量。(《智能革命》013、014) 40. 用一个不一定十分准确但是形象的比喻来说明。蒙特卡洛树形搜索是对以往决策树算法的优化。以往的决策树算法,即便给了一个高质量的候选点,对接下来的选择同样要进行穷举,在每个要选择的地方做一次分支,同样会遇到可选路径数量的指数爆炸。蒙特卡洛方法就体现了概率学的精妙。设某棋局局面下,深度学习网络给出了三个候选落子办法A、B、C,以这三个点为根节点,分别往下走子,可想象成三棵树,每棵树还有无数分支。蒙特卡洛搜索不去穷尽所有分支,而是派出300万只蚂蚁分别从A、B、C出发,每个点100万只,飞速向树梢爬(也就是往下黑白棋交替走子直到决出胜负,基本上走200步就会分出胜负),总有部分蚂蚁走到最高点(也就是决出胜负,假设蚂蚁走到终点的情况代表黑子胜,没走到终点的情况代表白子胜)。假设A、B、C点分别有30万只、50万只、40万只蚂蚁到达终点,系统就认为黑子走B点胜率更高,就会选择B点。这就是概率学的取样算法,相比逐项穷举法,极大缩减了计算量。为何不是派10万只或1000万只蚂蚁?这是根据计算机的计算能力和对竞争对手的大致估计而定的。在相同时间内派出越多蚂蚁,对计算能力要求越高。

(《智能革命》014、015) 41. CPU芯片与GPU(图形处理器)芯片同时进行神经网络计算与蒙特卡洛树形搜索,模拟海量的终盘局面,这是人类计算能力无法比拟的。因釆用深度学习建模了人类高手的棋感,看上去人工智能拥有了人类的大局观,而此大局观恰恰蕴藏在人类高手的千万盘对弈数据里。AlphaGo展现了当下人工智能/深度学习技术的发展水平。做同类研发的机构和人才很多,八仙过海,各显神通。人类行为被互联网以数据形式记录后,就成为滋养人工智能在各行各业齐头并进,帮助人类的无穷无尽的燃料。机器翻译、语音识别、图像识别都基于互联网提供的大量数据,用户点击行为也如此。为何百度搜索引擎的准确性是国内其他搜索引擎难以比拟的?因为数据量最大、算法最先进、积累最雄厚。用户的每次点击其实都在训练搜索引擎背后的百度大脑,告诉它哪一条资讯是用户最想要的。(《智能革命》015、016) 42. 当人工智能遭遇冬天时,人们认为机器很难像人一样思考,但机遇也正在这句话里。20世纪90年代以后,人类认识到人工智能没必要像人那样思考,只要能解决人类的问题即可。故语言学家乔姆斯基在回答“机器可以思考吗?”时,借用丹麦计算机科学家迪克斯特拉 (Dijkstra)的说法反问:“潜艇会游泳吗?”潜艇不会像鱼儿或人类那样摆动身姿游泳,但它的水下能力非常好。回望历史,整个人类工业发展都在孕育人工智能。凯文•凯利(参第48、51、120条)说过,蒸汽机活塞的自我往复运动就是一个精巧的设计,这种自我应答已蕴含了“进化”的要素。自动化的追求是人工智能的进化动力。早期的蒸汽机效率低、能耗大,故最先应用在煤矿:煤矿有需求(需要把采煤产生的很多水从煤矿里抽出来),又有足够廉价的能源。一旦得以应用,蒸汽机的技术就不断发展,最终推动工业革命。人工智能也一样:当容易得到足够多数据时,数据就是新能源,就是燃料,有了数据燃料,人工智能的发动机就可以运转起来。感谢互联网的发展及人类活动产生的数据。数据积累使计算机有了可学习的对象。感谢人工智能探索者,他们并非都是计算机科学家,他们有的做生物学研究,有的做工程学研究,有的研究数学和计算机程序的自动迭代优化,有的改革计算机芯片的协作架构。各种研究成果汇流成海,终于汇聚成今天的人工智能。(《智能革命》016、017) 巨头群起逐鹿 43. 2016年AlphaGo(参第39条)在媒体上引发的惊呼其实是舆论的后知后觉。回到2007年,人工智能巨擘GeoffreyHinton(参第33条)早已察觉到“山雨欲来风满楼”。当时他的一个学生在谷歌大数据的帮助下,将Hinton若干年前的研究成果应用于语音识别技术上取得明显成功。Hinton感叹:“回顾过去,失败只是源于缺少数据量和计算能力”。21世纪的第二个10年,人工智能万事俱备,百舸争流的竞争时代开始了。2015年以来,人工智能创业潮持续发酵。据美国风投数据机构CBInsights发布的人工智能产业数据分析,人工智能投资额2011年第二季度到2016年第二季度超75亿美元,其中60多亿美元都是在2014年后产生的。《乌镇指数:全球人工智能发展报告》显示,2016年前两季度,国内新增60余家人工智能创业公司,投资金额达6亿美元。过去一年中,中国大陆在人工智能领域进行了202笔投资,共10亿美元(约合人民币68亿元)。2016年,中科院副院长、中国人工智能学会副理事长谭铁牛院士说,2015年全球人工智能市场规模为1270亿美元,2016年预计达1650亿美元,到2018年将超过2000亿美元。(《智能革命》017、018) 44. 中、美、英三国是人工智能的发展重地。美国是互联网和人工智能的起源地,在该领域领先。除谷歌、脸书、微软、亚马逊、IBM、苹果等巨头,还有近百家专注人工智能业务的公司。如,擅长自然语言处理的X.AI公司。英国则继续老牌名校的辉煌,研发AlphaGo的DeepMind公司就是其中的代表。亚马逊推出Alexa智能语音助手和Echo智能音箱,与苹果、谷歌、微软争夺语音入口。2016年6月,亚马逊总裁贝索斯接受美国科技博主沃尔特•莫斯伯格 (WaltMossberg)采访时透露,亚马逊针对人工智能领域关键项目的投资已持续了4年,“亚马逊从事这些项目的团队超1000人,你看见的只是冰山一角”。2016年9月,微软宣布在执行副总裁哈里•舒姆领导下成立人工智能研发事业群,他领导数千名计算机科学家和工程师将人工智能整合到该公司的产品中,包括必应搜索引擎(Bing).小娜数字助理及机器人项目。当年末,微软发布了可以开发聊天机器人的服务,宣布为埃隆•马斯克(参第16条)和创业孵化器YCombinator的总裁山姆•奥特曼(SamAltman)共同创办的OpenAI人工智能实验室提供CPU服务。脸书也拥有人工智能实验室及类似谷歌大脑的团队——应用机器事业群,在脸书产品中推广人工智能技术。该公司首席技术官麦克•斯克洛普夫(MikeSchroepfer)说:“脸书约有1/5的工程师现在都在使用机器学习技术。”AlphaGo的主人谷歌的人工智能投入多年来不断膨胀。2012年谷歌只有两个深度学习项目,2016年底已超1000o谷歌从搜索、安卓系统、Gmail(免费网络邮件服务)、翻译、地图、YouTube(视频网站)甚至到无人车,都有深度学习的影子。(《智能革命》018〜020) 45. 中国拥有庞大的业务应用场景、用户和数据及基数最庞大的人才群体。有BAT(百度、阿里巴巴、腾讯三大互联网公司首字母缩写)、华为等巨头大力开发人工智能,还有很多垂直领域的人工智能公司涌现。2016年,百度语音识别准确率达97%、人脸识别准确率达99.7%o作为百度大脑的云化,百度天算、天象、天工、天智平台相继向全社会全面开放百度大脑的技术和能力。(《智能革命》020) 超强大脑汇聚 46. 人工智能背后的专业知识与数学、生物学等基础学科有极大相关性。人工智能科学家又是这些领域的翘楚,更是稀缺人才。但全国人工智能研究方向的博士生、研究生每年不到200人。国外亦然。2015年,优步挖走了卡内基梅隆大学国家机器人研究所140名研究人员中的40名,业界一片哗然。从业者更为敏感的是学术领军人物的流向。(《智能革命》020) 47. 百度是中国人工智能产业的代表,大量顶级人才投身百度:王海峰(参第61、126、129条)加入百度前曾就职于微软,吴恩达(参第33、56、119、123、137、252、258条)从美国来到百度,张亚勤(参第38、128、138、169、263、286条)从微软来到百度,林元庆(参第33、133、148、156、376条)从盛产机器学习专家的NEC美国实验室来到百度,机器人小冰的创造者景鲍从微软来到百度,美国科技巨头中职位最高的华人高管和人工智能技术权威陆奇(参第6、18、35、61、65、81、87、190条)放弃微软副总裁职位加盟百度……同时,也有很多人才从百度出发,创造了自己的人工智能应用公司。百度本身就是中国在吸引和培养人工智能人才方面活力的缩影。(《智能革命》021) 48. 这么多人类的超强大脑汇聚,目的是要创造划时代的中国大脑。我们经历了PC时代,正处于移动互联网时代,即将迈入万物互联的超级智能时代。万物数据汇合,人类加以处理,就可能产生一种超级大脑的生态。百度正在打造这样的生态,宗旨在于像提供水和电一样让人工智能渗入中国人乃至所有人的生活中去,努力促使世界万物向知化的方向发展。比如,百度大脑已经初步具有了自己的眼睛、耳朵、嘴巴和认知决策能力,总体来看,相当于一个儿童,但局部能力如翻译、语音识别、图像识别能力则大大超过人类。百度大脑已成为开发者的工具和人工智能的操作系统,促进了人工智能标准化的形成,全方位服务人工智能时代的企业、创业者和广大个人用户。(《智能革命》021〜022。原注:知化是凯文•凯利(参第42、51、120条)在《必然》中提出的观点,指软件吞噬一切,一切事物都将信息化,哪怕是一张桌子也可以上传自己的数据,如销售轨迹、使用频率等。) 49. 因此,我们热切呼唤中国大脑,呼唤国家总体层面的深度学习服务器、算法、应用基础设施平台。中国大脑的形成,将是中国竞争力全方位升级的体现和中华复兴的强力加速器。(《智能革命》022) 技术要做人类生命的延伸 50. 在今天,除了谷歌、微软和BAT(参第45条)这样的大公司,互联网和大数据技术的“去中心化”发展趋向,使得小企业、有才华的技术人员甚至广大用户都成为具有决定格局态势的力量。我在《硅谷商战》里就强调了用户的重要性。互联网创造了一种意见型用户。我们的很多程序员、工程师都很享受百度对技术工作者的宽松环境,简单可依赖。公关部门有时会吐槽技术人员不理解用户心理,遇到问题以为修改了代码bug(漏洞)就好了。但是人情bug不是代码能够修补的,这对我们是一个触动。必须考虑技术人员与商人和普通用户的隔阂该如何打破,需要有更高的产品思想和跨界学习的谦虚心态。但就本书主题来说,我们要利用技术对数据进行精准区分并服务于不同用户。(《智能革命》022、023) 51. 数字化,这是从尼葛洛庞帝的《数字化生存》到凯文•凯利(参第42、48、120条)的《失控》和《技术想要什么》一直在讨论的趋势,也是技术人员念兹在兹的事情。说到数据总会引起警惕:隐私会被贩卖吗?简单来说,人工智能眼中的数据绝不是低学历数据贩子眼中的身份证、密码等。今日人工智能重在从混沌数据里发现总体“模式”,进而优化生产、服务。翻译、语音识别和图像识别的进步就是最好的例子。这些混沌数据经过人工智能识别规律,就会对人类产生巨大价值,如从日常领域的语音识别到金融领域的征信防骗再到国家层而的反恐安全。技术再好也要适应用户,需要不断优化技术的表现形式,方便用户使用,体现出人性的一面。2014年初在东莞“扫黄”之后,百度地图运用数据可视化技术,描绘出东莞与中国各地的迁徙线路热度,有资深新闻编辑告诉我们,当时看到百度这幅图,瞬间感觉超越了新闻事件本身,有一种俯瞰人间的领悟。这也是人工智能时代具有历史意义的时刻。这是智能地图技术对人类活动、人类命运的感知。人工智能本身尚无人性,但结合开发者的创意、理念,就可提供新的视觉,甚至是一种别样的人性关怀。好的人工智能要润物细无声,不能像电压不稳的电源,不能像有污染的水。(《智能革命》023〜025、图1-5东莞8小时迁徙图(正月初十22点前)) 52. 计算机和互联网都是人工智能的身体,每个数据都是人类活动和人性的记录,人工智能因此终于像“灵魂”一样涌现而出,它是可以有人性的。(《智能革命》025) 数据大道 53. 有位哲学家说,人类是一种“在路上”的存在。百度积累了海量的地图数据,辅以设计师的智慧和各种精巧算法,可以描绘出人类的各种移动行为,感知人们在路上的生存状态。百度地图每日位置服务次数最高突破720亿次(参第106、158条),每一次都是人类的活动记录。奔涌的交通热力图和节奏,仿佛城市的生命脉搏。通过城市间交通热力排行图,可以感受到地区的发展态势。百度大数据实验室一位学生物学出身的年轻科学家之前在普林斯顿研究鱼群的运动规律,一看到百度迁徙图就决定回国来百度工作。2016年,他和同事一起利用百度地图上的搜索数据变化状况,准确预测了iPhone(苹果手机)销售量的下降。通过数据,大数据实验室为各种城市生活、企业运营提供智能感知。(《智能革命》02族027) 54. 2014年交通运输部提出:要深化改革,务实创新,加快发展“四个交通”,……初步建成综合交通出行信息服务平台……。据此,百度提出“中国智慧交通云服务平台合作计划”,与交通运输部公路科学研究院、国家智能交通系统工程技术研究中心共同打造合作平台,依托交通运输部重点科技项目“基于云平台的开放式公共出行信息服务研究与示范”,激活现有数据,建立部省数据信息资源共享交换机制,促进政企间出行服务信息共享应用,并对全社会开放。智能地图可根据用户移动快慢测量道路的拥堵程度,还可智能规避单双号限行路线。结合虚拟现实技术,可让人身临其境般寻找路线。以交通大数据为基础,加上算法辅助,响应交通管理部门的需求,智能地图系统能为城市交通缓解提供解决方案。智能地图对地理数据的收集使很多智能项目得以展开。达到厘米级精度水平的高清地图技术已运用到无人车开发中。2016年世界互联网大会上,百度无人车在乌镇公测和试运营。体验全程3.16公里,经过3个红绿灯及一次掉头,不仅而临人车混行、电瓶车穿行等复杂路况,还需应对中雨、薄雾、雾霾等状况。此结果丝毫不落后于硅谷同行在北美进行路测的进度。这是无人车的一小步,但必将成就人工智能的一大步。(《智能革命》027、028) 人工智能既不是神话也不是笑话 55. 人工智能既不是神话也不是笑话,不需恐惧也不需顶礼膜拜。人工智能领域的科学家对技术的描述常常是直白而谦虚的。谷歌前工程师吴军说过,他在2003年和同伴一起把谷歌的关键词搜索准确率大大提升,解决的一个主要问题就是,对于同义词或近义词究竟应该选取哪一种意思去搜索才能满足用户的需求。他说:我们把多年来用户搜索过的关键词搭配都整理出来,然后对每一个关键词的搭配做了特殊处理。这实际上就是一种穷举法。也就是把用户经常选择的词语组合关系固化下来,下一次用户再做类似搜索,系统就能更快、更准地给出结果。其实机器翻译等领域的技术逻辑,跟上述搜索中应用的有策略的穷举法有异曲同工之妙。据《纽约时报》报道,2016年6月的一个星期三,在谷歌翻译部门会议上,人们对百度发表在机器翻译领域核心期刊上的一篇文章议论纷纷。迈克•舒斯特(MikeSchuster)的一句话让会议室恢复了秩序,“是的,百度出了一篇新论文。感觉就像有人看透了我们做的东西——论文有类似的结构,类似的结果。”百度公司的BLEU(—种机器翻译和纯人工翻译之间准确度的分数)基本吻合谷歌在2月和3月内部测试中取得的成绩。QuocV.Le(夸克•维•乐)并未感到不快。他的结论是,这是一个表明谷歌处于正确轨道上的迹象。“这个系统与我们的系统非常相似。”他安静地说。(《智能革命》028〜030) 56. QuocV.Le是吴恩达(参第33、47、119、123、137、252、258条)的博士研究生,他可能并不知道,这篇论文的出炉与吴恩达并无关系,而是自然语言部门独立完成的。《纽约时报》对中国企业的报道当然是一扫而过。但吴恩达认为,国内部分媒体也需改变习惯,不能总下意识地认为什么技术都是外国更强,热衷于把后知后觉者当作突破者来报道。实际上人工智能领域很多领先创造都是中国人先做到的。百度领先一年发布了基于NMT的翻译系统,谷歌在2016年也紧跟百度推出了类似的系统。(《智能革命》029〜030) 57. 今天的人工智能思路与过去不同,变思维规则问题为数据问题和策略问题。过去人类总想为计算机设计出完美的逻辑,不断把人类的种种逻辑规则抽象成函数之后输入计算机。现在的人工智能主要基于大数据基础和算法的进步。也就是说,今天人工智能的爆发恰恰建立在20世纪90年代末互联网爆发的基础上。有了互联网,数据才会大量产生。是用户使用互联网时口动产生的数据,如每一次搜索、每一次点击、每一次移动轨迹,都是一种数据。中国已是世界头号制造大国,现在更需要的是提升“软实力”。精神、文化、计算和数据都是“软实力”。这样的“软实力”和传统产业叠加,也就是所谓的“智能+”。(《智能革命》030)非如此不可 5&问百度要做什么,不如问为什么一定要做?!企业都有自己的战略战术。2013年,国内移动互联网创业风潮兴起时,百度却全面发力人工智能,多方布局、重点突破、发展内功:没去参加下围棋、预测歌手比赛结果;
而是专注把人工智能转化为能改善人类生活的实用性服务;
不止把深度学习应用到语音识别、机器翻译、街景门牌号识别等少数领域,而是将深度学习成功应用于显著提升用户体验。当全世界都开始关注人工智能时,人工智能大格局上已有中国百度立下的柱石。2013年,百度导航率先宣布永久免费,把中国带入导航免费时代。百度地图的数据接口开放,用户用百度地图提供的定位技术和方案,相比传统GPSTracker(全球定位系统追踪器)节省了大量成本。快递公司可以此规划最优送货路线,游戏开发者可开发类似PokermanGo(口袋妖怪)的位置游戏。百度大脑开放,让更多的人可使用人工智能的眼睛、耳朵为自己服务。深度学习开发平台(PaddlePaddle,参第91、140、300条)开放,让更多有志者可创造属于自己的人工智能服务。我们也希望让非技术人员学会用数据智能优化自己的工作、完善自己的个性、追求自己的理想。(《智能革命》031) 59. 很多高考生使用过度秘机器人帮自己选高考志愿。人们把高考称作“千军万马过独木桥”。和地图数据类似,度秘机器人通过分析千军万马的高考数据,通过深度学习技术响应并感知考生的渴望、焦虑,尽力给出精准回应。这里,人工智能记录的不是地图轨迹,而是学子成长的心灵轨迹。20世纪90年代初我远赴美国学习计算机技术,当时有很多和我一样的年轻人,怀着用代码改变世界的愿望,候鸟般往来于中美。若当时有数据地图记录这些跨洋轨迹,是很有意思的事情。如今人工智能科学家再次把火种带到中国,相信这次火焰会燃烧得更热烈,因为中国大地有足够的燃料。中国受教育人口数量巨大,计算机和移动设备普及极快,大量的数据使得中国发展和应用深度学习技术方面有得天独厚的优势,故我们可厉兵秣马创造20世纪90年代硅谷那样的传奇。百度要做的事不仅是前沿开发,而且要为用户提供数据基础设施,提供深度学习开发平台,网聚人的智慧。在特朗普当选美国总统之前,有百余位硅谷精英发表公开信,认为特朗普当选将会是创新的灾难。这对我是一个触动,若美国的创新真的受到影响,我们能把世界的创新中心从硅谷迎到中国吗?人才确实在向我们涌来。百度在硅谷成立了实验室,近身接触美国人才。百度提出的中国大脑计划堪比任何超级工程。70年前,顶尖科学家壮志满怀地从国外回到中国兴建伟大工程,这样的辉煌今天会再次出现吗?(《智能革命》032、033) 60. 那个时代的伟大工程往往依赖国家投资和产业政策。“冷战”结束后,国家竞争压力减小,尖端科技投资也大为减少。马斯克开发火箭,其实是国家把NASA(美国国家航空航天局)的火箭技术和团队转移给他。在中国,政府层面的决心和投入依然强大,发展人工智能产业方面上下同心。这是最好的时代,也是最不确定的时代。人工智能就是一种适应不确定性的方法。人工智能的发展也将带来不确定性。美国白宫的报告已在探讨人工智能对就业的冲击。美国硅谷的高速发展和中部制造业的衰落加大了国家的裂痕,一部分人享有进步成果,另一部分人被扔出历史航船而失去方向。百度要成为人才的方舟,中国企业要打造人类的方舟集阵,让最广大的人群踏上智能时代的历史巨轮。(《智能革命》033) 61. 百度副总裁王海峰博士(参第47、126、129条)2016年11月当选ACL(AssociationforComputationalLinguistics,国际计算语言学会)会士,成为ACL目前最年轻的会士,也是该组织五十多年历史上首个出任主席的华人。评选委员会在给王海峰的评语中写道:“王海峰在机器翻译、自然语言处理和搜索引擎技术领域,在学术界和工业界都取得了杰出成就,对于ACL在亚洲的发展也做出了卓越贡献。”2017年初,在人工智能领域享有盛誉的科学家和高管陆奇(参第6、8、35、47、65、81、87>190条)加盟百度。这些都在预示着国际人才流动的趋势。(《智能革命》034) 未来已来:焦虑与梦想 62. 不久前,亚马逊的“无收银员超市”(参第335条)引起“血拼族”的惊叹。今天,当各种在线客服被机器客服代替,速记翻译被语音识别代替,收银员、驾驶员、工厂工人、普通文书、律师都被人工智能代替时,人们该怎样迎接这个世界?政府和企业该为劳动者做怎样的支持?我们该怎么调整经济、社会生态结构,以适应人工智能时代?我们希望聆听普通人的需求。这也是我们人工智能团队共同打造本书的初衷。(《智能革命》034) 63. 硅谷有位和马克•安德森(参第26、27条)齐名的风投鬼才彼得•蒂尔。他是PayPal(贝宝)的创始人,善于把握技术大势,捕捉黑马。2016年他因准确预测特朗普当选美国总统而再次名声大噪。他在2011年说:Wewantedflyingcars,insteadwegot140characters(我们需要能飞的汽车,结果只得到140个字符)。140个字符的推特(Witter)—度热闹无比,但彼得•蒂尔清楚地看到互联网喧嚣背后缺少什么。他批评人类放慢了进步速度,风投热衷于投资轻资产企业,其中大部分是移动互联网公司,如Airbnb(空中食宿)、优步之类,却对未来没有清晰的规划和信心。他认为“互联网+”时代人类在比特层面进步大,在原子层面进步小。因此他果决地投资火箭、抗癌药物及人工智能。(《智能革命》034、035) 64. 我同样认为移动互联网创业的喧嚣掩盖了我们所要真正追求的进步。百度要为人类的核心能力进步做贡献。百度愿意幻想一个智能化的世界并去实现它,要让人工智能成为新的操作系统,不仅是计算机的而且是世界的操作系统,同时严肃思考和提前应对人工智能的挑战,最终让这个世界从此不同。所以我说一定要把这件事办成!智能革命是对生产、生活方式的良性革命,也是对思维方式的革命。巨大的机遇与挑战并存。以下将具体探讨智能革命的方方面面,详谈视觉识别、语音识别、自然语言处理等在深度学习基础上取得的突破性进展,并从制造业升级、无人驾驶、金融革命、管理革命、智能生活等多个维度,描绘即将到来的智能社会,进一步探讨人类应该如何应对人工智能的发展,与读者一起把握智能革命的脉搏。

(《智能革命》035) 02人工智能的历史使命:让人类知道更多,做到更多,体验更多 陆氏猜想 65. 20世纪80年代是所有亲历者难以忘怀的理想主义年代。尤其在校园里,陈景润似的科学家成为很多人的偶像。1987年,复旦大学校园里有一个和陈景润一样瘦削、戴着大框眼镜的青年,每天背着一个很大的书包行走在校园里,精神抖擞,喜欢思考在外人看来很玄奥的问题,同学们都喊他“陈景润”。毕业时,他在毕业纪念册上写下临别赠言:
仅献上本人最新研究成果,与列位同窗惜别。

“陆氏猜想”:HI=>C^HB (式中:H:血manI:Intellectualized C:ComputerB:Brain) 其意:人类终将使电脑智能化且使其远胜人脑。诸公不妨一效景润,或许,这颗电脑科学皇冠上的明珠非君莫属。

他是陆奇(参第6、18、35、47、61、81、87、190条),后来的雅虎、微软领导者,今天的百度集团总裁。陆氏猜想今天看来,更像是一句超前的顿悟。陆奇的个人信念是:知道更多,做到更多,体验更多。从卡内基梅隆大学毕业时陆奇写的是“Knowmore,Domore”。后来加了一句,变成“Knowmore,Domore,Bemore“。“Bemore”也可翻译成“成为更多“。人就是“在路上”,不断成为更丰富的存在。知道越多,就可以做到越多;
做到越多,就可 以体验越多;
体验越多,就可以知道越多。这是一个正循环,是人类进步的主旋律。

(《智能革命》039〜041,原注:陈景润因证明哥德巴赫猜想“1+2”定理而享誉世界。徐迟的报告文学《哥德巴赫猜想》以陈景润为主人公,发表于1978年1月的《人民文学》第1期,在当时家喻户晓。) 66. 计算机让我们“Knowmore,Domore,Bemore”,而人工智能就是这个旋律的最新回响。(《智能革命》041) 下一个浪潮 67. 我们正在见证的是一个计算机和数字化崛起的时代;人工智能是将人类历史大潮推向下一个高点的动力。这一次人工智能革命将让我们人类整体用完全不同的方式往前走,书写崭新的历史。首先,我们需要了解“人类进步”的本质——我们为那些能让我们认知更多,实现更多,获得更多经验的事情充满热情地奋斗。而计算能力的不断发展,正是遵循着上述人类进步的方向,成为人类进步的本质表现。以现代数字计算系统为基础,IT(信息技术)行业在创造数以万亿元计的价值时,正是从组织信息(InformationOrganization,10,帮助人类认知更多)、完成任务(TaskCompletion,TC,帮助人类实现更多)、丰富经验(ExperienceEnrichment,EE,帮助人类获得更多经验)三个核心维度上使人类取得长足的进步。人工智能是一种革命性的、更高级别的智能计算系统(IntelligentComputingSystem,ICS,参第73条),它从上述三个维度对人类进步的推动作用是前所未有的。(《智能革命》041、042) 68. 人工智能计算的本质,非常不同于冯•诺依曼(参第23条)的控制流结构,后者采用线性的记忆体和布尔函数作为基线计算操作。而新的范式是神经网络计算,其特征在于分布式的表示和激活模式。网络的拓扑架构和激活模式提供了巨大的计算空间,可有效且自然地捕获丰富的知识(通过拓扑的超参数、权重、激活函数)。相对于冯•诺依曼架构中的本地化表示(其中变量由诸如寄存器的专用或局部化物理资源表示)和符号计算,神经网络计算在学习和表示物理世界及社会的丰富的语义知识方面更加自然和强大。下一波的人工智能技术可在以下两个维度提升目前的计算系统(《智能革命》042、043):
•自动分层特征/表示学习。这是机器学习容量的实质性提升,因为当今机器学习工作的很大一部分关键在于特征工程。如百度大脑已拥有万亿级的参数、千亿级的样本、千亿级的特征训练。

•高级认知,特别是感知能力。这是下一代设备(如无人驾驶汽车)和下一代平台(如自然语言会话)产生的巨大催化剂。

69. 人工智能计算的强大能力有助于产生许多新品种的智能系统,如机器律师、机器分析师、医疗机器人、智能客服人员等。人工智能计算的另一个发展方向是组织各种服务于特定物理架构和物理要素的系统,如家、办公室、工厂等的智能系统。在科研领域,人工智能计算可提供更先进的建模能力,成为多领域和新一波科研浪潮的催化剂。在商业方而,人工智能可提供额外的机会,为企业组织创建集成的业务计算系统(BusinessComputingSystem,BCS)平台。如记录业务对象(如系统设计模型、交易记录)和业务流程[如ERP(企业资源规划)、CRM(客户关系管理)];
或者系统设计并模仿人类工作活动,如沟通、协作、阅读、写作、寻求信息等。(《智能革命》043) 70. 人工智能的感知系统有更广泛、更新的商业机会:可构建部署更多的“传感系统”子系统,如装配线、工厂等;
自然语言处理技术的进步可扫描和分析文本文档与信息,从中提取高价值的业务知识,构建部署专用的“文本理解子系统”可得到高价值知识和商业回报。人工智能认知系统的成熟代表了智能时代更长远的未来,所有行业、职业、社会系统、生活方式都将被重塑。若数字化社会可概括为“信息就在指尖”,则人工智能时代的本质可概括为“知识无处不在,任何交互都是智能的。”(《智能革命》044) 71. 这个浪潮对大多数人来说是巨大的机遇。(《智能革命》044) •对商业机构:好消息是他们将有许多提升、转化和进入新的增长领域的机会;
坏消息是大浪潮席卷时没有谁可眉然不动。

•对企业家:看一看“巨大市场机遇”的列表,就可发现许多创造未来商业巨头的机会;
属于智能时代的新的企业领袖将由此诞生。

•对投资人:睁大眼睛去发现一个属于智能时代的种子企业,支持它成长为未来的企业帝国,获取巨额回报。

•对国家或政府:每次巨大的技术革命,总是伴随着国家命运的兴衰交替。国家或政府层面决策、政策的前瞻,战略投入的坚决,路线执行的科学有效,对赢得一个相当长时期的昌盛国运至关重要。

72. 当越来越多的人感知到人工智能的浪潮,越来越多的创业者投身于该浪潮时,难免有浪潮将起阶段的困惑。在硅谷,大家都说以后要投资的都是AI+X。如有一家专投人工智能的投资公司,纽约市前市长布隆伯格是其合伙人(LP),看了几百家公司,看得有点晕了,因为所有创业公司都宣称是人工智能公司。怎样鉴别呢?人工智能企业的标准是什么?(《智能革命》045) 衡量人工智能的现实标准 73. 而对人工智能这一带全局性、革命性技术浪潮,人们的兴奋、质疑及顾虑更加多元化。有的比较感性,比如讨论人工智能会否代替人类。这其实是在用人工智能与自然智能(NaturalIntelligence)作比较。对自然智能,有各种各样的研究与著作,包括有人提出人脑内部的机理其实是量子计算。对人工智能,还无公认的定义。可务实地来讨论:有两种类型的计算系统被人类叫作人工智能。(《智能革命》045、046) •第一种,本质上相当于智能计算系统(ICS,参第67条)的子系统框架。它将数据作为输入,从数据中提取信息并建立模型,将我们关心的某些现象转化为知识。我们称这种类型的人工智能系统为通用智能系统(GeneralAI),并定义通用智能是获取知识和实现目标的能力。

•第二种,指具有类似人类的认知能力,能感知(“看”“听”“感觉”),它们可越来越多地推理和计划,可用感觉运动控制移动。我们称这种类型的人工智能系统为认知智能系统(CognitiveAI),是具有感知、推理、规划和感觉运动控制能力的机器。

74. 人工智能的另一个二分法是狭义Al(NarrowAI)和广义Al(StrongAI)O广义AI是使用相同的算法来解决一大类问题的系统。原则上,广义AI系统可以学习和适应以解决新的问题,而无须人为干预。狭义AI系统使用特定算法来解决特定问题,如下棋、识图等。总而言之,表2・1是对人工智能系统状态的概述,是一个务实和可行的定义。(《智能革命》046、表2-1人工智能系统状态) 表2-1人工智能系统状态 人工智能的定义 狭义AI 广义AI 通用智能系统 智能客服 未来的搜索引擎,百度 认知智能系统 无人驾驶 DeepMind公司(参第44条) 75. 智能计算系统与大数据直接相关。任何数据都有产生的缘由,都有产生数据的体系和系统,这就是为什么数据会产生,数据的核心是知识。通用人工智能系统的核心能力就是通过运用算法、计算体系,把知识从数据里提取出来。一旦有了知识,我们就可以做很多事情。所以,人工智能发展的第一个层次就是通用人工智能。近几年深度学习的突破主要是在感知层面(把外部世界变成可被系统识别的符号),接下来要做的是认知上的:最重要的是理解其意义。目前人工智能公司可以分别放在四个象限里而。大部分公司做的是狭义AI:只解决一个到两个较窄的问题,下围棋、打牌、开汽车都是狭义AIo广义AI用同样一个系统可以解决所有问题,那就与人的智能类似了,这是人工智能发展的长期目标,真正实现至少还需要 二三十年时间。百度、谷歌、微软、脸书等都在朝着广义AI方向努力。(《智能革命》047) 76. 判断人工智能的能力,或者判别是否真正是人工智能的标准仍然是,人类是否因此知道更多,做到更多,体验更多。如,百度基于海量的搜索数据做的很多技术分析,以前靠人去做几乎不可能,而现在通过人工智能计算技术,得出了许许多多前所未有的知识和结论,人类因此而知道更多,也能因此去做很多前所未有的判断,去实现更多不可能的功业。如具有代表性的无人驾驶技术、自然语言交互技术,使得人类的运动方式、感官方式都逐渐发生变化。以前用眼来看、用耳来听,以后不需眼睛也能看到,不需耳朵也能听到,人类将逐步拥有新的感知方式,将体验新的世界。因此,做人工智能的公司是否名副其实,都可从以上角度来衡S:它属于四个象限中的哪一块?有无实力让人类和机器一起知道更多、做到更多、体验更多?(《智能革命》047、048) 77. 有的公司说云计算是人工智能,有的说大数据是人工智能,但这些都只是人工智能系统的一部分,最终判断人工智能实力的是大数据、云计算、算法、训练时间、总投入及软硬件综合实力等。百度大脑可看作人工智能综合实力的典型,对它的能力分解,能使我们更明晰人工智能行业的入门门槛及基本标准。若号称人工智能的公司以下能力皆不具备,只能说该公司还未准备好真正进入这个领域。百度大脑是硬件基础、数据基础和算法能力的紧密结合,是云计算(基础设施)、大数据(燃料)和人工智能(发动机)的三位一体(联合驱动着“互联网的物理化”,全面改变社会),是百度技术战略的核心。(《智能革命》048、049) 78. 云计算是百度大脑最低层,是la次S(InfrastructureasaService,基础设施服务),提供超强计算能力,是高性能计算硬件的集团军,拥有数十万台服务器,采用先进的集群操作系统来统一管理,堪称人工智能超级计算机。为深度学习训练的需要,百度研发了GPU和FPGA (现场可编程门阵列,参第286条)异构计算服务器,单机可扩展至64块GPU/FPGA卡,对比传统服务器密度提升16倍,一台服务器即可完成千亿数据模型训练;
百度开创性地研制了基于FPGA的人工智能处理器,提供lOTops的计算性能,相对于主流的20核服务器,计算效率提升60倍,在人工智能和大数据应用上,可达到普通服务器48倍的性能。百度的优势不只是单台机器的优秀,更在于优良的系统。针对GPU集群的智能调度和资源管理系统,可以实现计算、存储和网络资源的池化管理和动态调度,计算集群整体效率和平均使用率达到80%。将异构硬件用于线上产品,用户请求时延降至1/5,计算效率提升数十倍。这个系统涵盖了国内最大的GPU/FPGA集群(全新的芯片技术),最大的HADOOP/SPARK(参第152、277条)集群(全新的并发数据处理技术)和运营效率最高的数据中心[全新的异构计算技术、整机柜服务器技术、100GRDMA(远程直接数据存取)通信技术和运维技术],可谓马力十足,提供了开发人工智能所需的计算能力。它的燃料充足:万亿级网页数据,数十亿次搜索数据,百亿级视频、图像和语音数据,百亿级定位数据等。数据是人工智能算法的燃料,是发展人工智能的又一基础条件。(《智能革命》049、050) 79. 让硬件与燃料结合的是优秀的算法和模型。百度汇聚了全球顶级科学家和工程师,在理论和实践方而持续创新,搭建了全球最大的深度神经网络,支持万亿级参数、千亿级样本、千亿级特征训练,神经网络层数远远突破100层。硬件动力、数据燃料和算法灵魂的结合,才产生出百度的PnaS(PlatformasaService,平台服务)。百度PaaS与众不同之处在于,人工智能作为一种横向的服务贯穿全平台。通过深度学习和机器学习技术,结合超强计算、海量数据和优秀算法,在语音、图像、自然语言处理等方面拥有杰出的能力,打造出独特的知识图谱、用户画像和商业逻辑,并向用户全而开放。用户可非常方便地使用各种算法模块、开发工具、数据引擎为自身的商业目的服务。我们形象地把不同的平台称作天算、天像和天工,分别针对大数据、智能多媒体和智能物联网这三个领域提供服务。(《智能革命》050) 80. 在最上层的SaaS(SoftwareasaService,软件服务),百度的人工智能很容易凝结成许多垂直行业解决方案。但我们更追求与合作伙伴一起打造智能产业生态,如教育云、金融云、交通云、物流云等。对智能产业生态的构建能力也是判定人工智能价值的重要标准。(《智能革命》050) 81. 在硬件、数据、算法之上还有一个重要的衡量标准:人工智能企业的文化,即软实力。搜索技术是人工智能的先驱,也是最早的互联网数字化世界的门户,其开发流程和技术核心为未来的人工智能奠定了基础。首先,搜索引擎必须与很大规模的数据打交道;
其次,搜索引擎必须同时有大规模的机器学习,人工来做是不可能的;
最后,也是最根本的一点,搜索引擎的开发流程和工程开发文化与人工智能系统的开发是非常吻合的,都以数据为主,通过抽取其中的特征、模式,然后用此模式给用户带来价值。人们在搜索业务中结成的协作关系,形成的业务能力和工作习惯,都很适合人工智能业务发展,与海量数据一样,积淀为人工智能企业的文化。所以陆奇(参第6、18、35、47、61、65、87、190条)在微软的做法是,培养人才先从Bing(参第44条)开始。这个文化当然并不完美,但正如神经网络一样,可以在正确的方法指引下不断发展完善。(《智能革命》051) 人工智能+世界 82. 和前几年讨论“互联网+”一样,人们现在开始讨论“人工智能+”,“+”商业、工业、医疗、教育等。人工智能对世界的改变是根本性的,即这是一个“人工智能+世界”的问题。首先,智能革命对每个人的日常生活影响深远。简单的例子,由于人工智能突破性的发展,我们与计算器件的交互形式会更进一层。以前人机交互都通过键盘和鼠标。苹果和乔布斯的最大贡献是改为用手指来交互,从而改变了世界。而人工智能时代,人类将可用自然语言跟任何器件交流,这意味着人类将不需要了解每一项应用,不需要学习每一个产品的用法,直接操作就好。因为未来汽车可跟我们直接交流,房子也可跟我们顺畅对话。这些智能交互的雏形如智能助手系统。人们通过亚马逊智能音箱把房子变成智能系统。百度度秘团队也在此领域做了很多前沿探索。(《智能革命》051、052) 83. 人工智能将极大地加速人类的创新步伐和创造社会价值的效率。未来知识的发现模式会发生根本性变化。以前,人类去思考、去发现现实世界的规则。数字化世界借助人工智能的数据处理方式,人和机器将共同发现新的知识。这意味着,人类创造新的企业,创造新的社会进程,改变世界的速度将焕然一新。因为人类“知道更多,做到更多,体验更多”的进程大大加速了。最后,人工智能将带来一场新的工业革命;
人工智能比早期工业革命影响更广、更大。工业4.0以后,人类将进入数字化社会的新阶段。因为,智能系统有能力在现实世界里提取数据,抓取知识,更好地帮助人类感知和认知现实世界,广泛而深刻地改变现实世界。传统制造业以器械、电器、电力为主,生产流水线后续很难调整。当数据智能、自动化、精准预测对制造业的改造完成后,面貌将焕然一新。未来制造业的生产流程是模块式、数字控制的。汽车制造厂把新产品模块的接口(API)调来,就可生产另一样式的汽车。这将彻底改变制造业基础,极大提升制造业效率。这个改变的核心是数据和知识,即制造的流程、工艺、设计,制造的每一步都会用数字来控制。制药行业亦然。借助人工智能计算技术,将庞大的基因数据与海量的健康信息结合起来分析,可很快发现规律(以前新药诞生要经历长期研发过程),找到个性化的基因药物。(《智能革命》052〜054、图2-2DNA测序猛增。原注:英国2014年启动了“10万人基因组计划”,美国和中国则宣布要完成100万人的基因组数据收集工作。世界知名的基因测序公司Illumina仪器测序所得的数据,每12个月就能翻一番。这是一个巨大的“数据黑洞”,也是亟待发掘的数据金矿。) 84. 国家层面,人工智能给中国带来的不光是整体竞争力的提升,还是一个超越他国的天赐良机。中国是制造大国,数据量的庞大无出其右,意味着我们有机会提取比别人多得多的“知识”。你懂的比别人多,看的比别人多,能做到的就比别人多,你就比别人强大,就可立于不败之地。智能制造具体怎么实现,需要整体的战略考量。(《智能革命》054) 中国的优势与我们的责任 85. 美国和中国是在人工智能方面发力最大的国家。人们习惯于把百度和谷歌放在一起比较,可看作中美比较的缩影。两者有很多类似之处:起源一样,公司层文化有很多类似之处,各自在本国的优势也类似。二者有不同:百度的创新空间和在某些领域的创新速度可能比谷歌更大、更快,这源于中美两国国情不一样。移动互联网在中国的创新程度在很多层而已超美国。如,手机百度在信息流方面的创新,用人工智能核心技术可把信息找人做得非常精致。在移动互联网上做这个事情,百度创新的机会比谷歌要多,因为两国IT工业的格局不一样。再如,百度金融可依托中国市场和数据的优势,用人工智能技术对金融业做革命性的提升。但美国金融业相对“壁垒森严”,谷歌要切入金融领域就很难。还有,无人驾驶汽车,谷歌、百度都是世界第一梯队,谷歌稍领先于百度,但未来不一定。因为中国汽车制造厂家很多,有更开放的合作环境,故创新机会非常多、创新速度会更快。而美国汽车制造商就集中在底特律那么几家,人工智能企业找上门去跟他们合作就很难。(《智能革命》054、055) 86•总之,无人驾驶汽车、金融、医疗、制造业等,中美都面临智能升级的节点。但中国的宏观环境给百度这样的智能企业的机会和空间要比谷歌在美国获得的更大一点。百度在这场波及世界的浪潮中应该承担什么样的责任?在美国,IT工业体系一般就靠五家公司:苹果、谷歌、脸书、亚马逊、微软。支撑企业不是一家,而是带动了一波企业,扮演的是一个生态系统的领军者的角色。在人工智能时代的背景下,百度是一家支撑企业,应该争取对中国乃至世界的智能革命做出更大贡献。具体说,战略上我们要以“赋能”来定位。百度首先是中国的,百度大脑要做探路者和奠基者。百度的智能云是提供给所有行业的,对任何行业都将起到促进、赋能、带动的作用。作为国内人工智能的先行者,百度已经在多个维度上创新开拓,逐步形成自身智能生态的雏形。如医疗和教育。高级教师和老医生一样,能力来自经验(数据)积累,可让机器自动分析数据,辅助医生对症下药,辅助教师个性化施教。医疗保健让人更健康,教育给人更多知识。故人工智能在这两个领域的社会应用价值巨大。再如无人驾驶领域。无人驾驶也是通过感知、认知、知识获取来实现。一旦商用普及成功,对整个社会的改造会非常大。因为有了无人驾驶机器,它可以自己行动,自己联网,会带来很多不同行业的改变。人工智能的实践范围如此之广,人类很少有这样一个机会,可以彻底改变、改造当下的一切。当然,步伐要稳健。(《智能革命》055、056)企业挑战:如何落地 87. 在工作态度上,陆奇(参第6、18、35、47、61、65、81、190条)常说“Headabovecloud,Footonground“,就是脑袋要在云端之上,才能看得远,看得清,但是你的脚必须要踩在坚实的大地上,一步一步向前迈进。做人工智能事业要跨越的第一个障碍就是如何落地。人工智能要落地,首先需找到非常好的、实际的用户体验,即能给用户带来实际效益;
其次,场景必须清楚,智能助手也好,无人驾驶汽车也好,信息找人也好,一定要有实际的用户体验价值;最后,还要找到商业模式,不然就无可持续性。所以挑战在于能否找到落地的用户体验和实现用户价值的场景,然后找到适合的商业模式,建立一个创新的循环。即数据-知识-用户体验-新的数据。找到这个循环往复的流,人工智能事业就可以像滚雪球一样往前滚。最重要的是每个公司的CEO(首席执行官)要重视人工智能,然后投入一定资源(雇用懂人工智能的人和能帮助做决策的人)。按自身业务情况(如零售业、制造业、旅游业等)制定有效的智能化战略,赋予执行者足够的权力,通过有效的战略分解,把智能化落实到具体业务。

(《智能革命》057、图2-3人工智能创新“飞轮”示意图、058) 88. 不妨以“工作引擎”模式来分解人工智能战略的落实步骤。首先根据人工智能浪潮的推进方向,重新梳理企业定位,确定崭新的使命和愿景。其次根据新定位制定智能化战略蓝图。对“进入什么”、“退出什么”做取舍、投注。“进出”决策要遵循一定原则。硅谷咨询专家GeoffreyMoore(杰弗里•摩尔)的层次结构框架是评估人工智能浪潮的好例子,其中的关键是进入高增长的类别,跳出低增长的类别。人工智能浪潮将创造新的、有巨大增长潜力的类别,如无人驾驶汽车、机器人、回声设备、对话系统;
也可能给某些行业带来阻碍,如新的人工智能硬件+软件堆栈可使基于旧的HW堆栈的投资受损。好的做法是制定包含新的高增长类别、重新增长类别和逆风类别的完整列表,以便领导层可做出系统性和原则性的决定。接下来是对产品的出发点进行区分。如产品是否“拥有价值和无与伦比”。人工智能时代,企业能否保持差异化,关键在于是否拥有独特的数据资产(它带来独特的知识)。下一步是理解不确定性、风险/回报和时间表,以进行投注和管理进程。“地平线模型”是个良好的框架,可用于制定决策和组织投资组合。大致做法:H1时段(未来18个月)围绕目前核心业务展开;
H2时段(未来18-36个月)投资于创造赢利引擎;
H3时段(未来36个月+)致力于具有更大潜力但风险更高的长期投注。人工智能浪潮提供了非常丰富的H2时段和H3时段的机会,甚至可帮助提升H1时段。总的来说,人工智能处于非常早期阶段,有很多未知数和不确定性。(《智能革命》058、059) 89. 在企业人工智能战略的执行阶段,首先要坚持“结构完整性”原则,即在产品体验、技术架构及商业模式上要连贯一致。其次是要紧跟人工智能浪潮的技术路线图,与飞速发展的深度学习技术同步。人工智能行业的领军企业需要可以改变世界的愿景、世界级的技术远见、强大的科研团队和研究议程。此阶段,更新研究机制也是必不可少的步骤。因为,IT行业及学术界并不擅长将研究成果商业化。许多工作需要各类组织(大学、早期生态系统、大型企业、培训和研发机构)协同制定结构化的可持续的解决方案。投资力度是企业亟须考量的重要因素。智能革命不断深入,人才争夺战不断升级,发展人工智能的成本不断提高。制定投资规划的关键在于排列资源的优先次序及一个能反映人工智能风险的深思熟虑的决策过程。

(《智能革命》059、060) 90. 所有客观条件汇聚后,人就成为决定因素,领导才能是个深远且难得的要素。人工智能浪潮基于与以往完全不同的核心技术(以神经计算为核心),需要高层管理团队的高级管理能力。同时,人工智能驱动的新兴行业多样化和跨学科(从基因学到机器人,凡是你可以想到的),因此企业需要一个具备创新精神的人(虽然这并不容易,因为今天的社会生活在很多领域都是非常专业化的)。微软研究院首席研究员BillBuxton(比尔・巴克斯顿)提供了解决方案,即为高级管理层建立一个充满创新精神的团队。值得指出的是,人工智能创新飞轮(参第87条)的核心是数据-知识-用户体验-新的数据的反馈循环。对这个反馈循环的容量和速度进行优化是规划中非常重要的一环。最后要强调的是,居于战略核心的是基于当前的现状和推断积极设定目标,以及展开可以实现目标的行动。(《智能革命》060) 需要什么样的宏观环境 91. 企业与科研机构的工作离不开良好的宏观环境,正如中国大脑计划是对国家整体层面智能基础设施的呼唤。迎接人工智能时代的到来,需要政府通过宏观规划创造适宜的土壤。(《智能革命》061、062) •第一,要确保数据的获取途径畅通。数据越来越成为很多组织的战略资产,是新型的“自然资源”。政府可通过政策的制定获取数据并公开,以此激励更多的创新。

•第二,要有开源的工具和平台。人工智能浪潮需要一个新的硅+软件堆栈,在早期,这类似PaddlePaddle(参第58、140、300条)这样的开源工具和平台,其能被开发者和创新者使用是非常重要的。未来,需使用更多的工具和模块。像AWS(亚马逊云服务)使计算更容易一样,一些AI-as-a-service(人工智能服务)也可让人工智能技术更容易被获取。

•第三,创新者可迅速将产品的市场条件和政策体系培育给用户,因为创新的飞轮需要“数据-知识-用户体验-新的数据”的快速反馈循环。

•第四,鼓励持续的应用性研究。

•第五,上述几点势必会引出人才的问题,教育和培训出更多可以设计、实现机器学习算法并成为数据科学家的人才是一个关键因素。

•最后,通过新的结构化方法,把公共世界的信息和知识变成有组织的素材并可获取,这对许多企业的人工智能创新至关重要。

智能社会的文化和长期管理 92. 这一波人工智能浪潮需要几十年才能充分发挥作用。雄心壮志和改变世界的投注需要足够长期的投资。所以,有目的的长期管理在人工智能浪潮中扮演了重要角色。这将是一种遍及全社会的商业和管理文化的变革。具体而言,需要执政者建立并获取一个更大的“许可信封”,使管理团队有较长的时间跨度来培育大赌注(通常是从0到1的赌注类型),这也日益成为高层领导任期职权的一个重要组成部分。马斯克说过:“如果创新失败,不应该受到惩罚。”与长期管理相关的一个因素是创造新的组织结构,使其成熟,以便容易适应人工智能带来的变革。Alphabet(谷歌重组后的“伞形公司”的名字”)便是其中一个最早的尝试。这方而,中国企业的管理创新做得比美国更多。(《智能革命》062) 93. 另外,文化是一个组织的持久力量,它是可以超越几代的领导力和商业活动。对于许多成熟的企业(如谷歌、百度),进入人工智能浪潮代表着一个重大的挑战——需要获取新的人才、新的技术专利及创造与之相应的新文化。保持积极主动,有耐心,并且执着极为重要,因为文化转型是一个成熟企业最具挑战性的工作之一。此外值得一提的是,相比学习人工智能的新方法,更困难的在于忘却旧模式下的工作方法。(《智能革命》062、063) 94. 总体上,有目的地进行长期管理是抓住任何重要机会而不仅仅是人工智能浪潮的关键。如何调整结构来吸引更多资金和人才及放置更多的改变游戏格局的赌注,对企业领袖而言都是有趣且极具挑战性的工作。而对更深刻、更有趣、更具挑战性的问题本身就是人类进步的标志。

(《智能革命》063) 人工智能技术目前的发展状态 95. 今天有点像文艺复兴时代,所有的科学都在变。科学的真谛就是观察世界、总结知识。我们现在观察世界的能力越来越强,一旦选好观察角度,把深度学习的算法用上去,很快崭新的知识就出来了。总体来讲,人类是处在一个突飞猛进的状态,我们再次把头脑放到云端,以量子计算作为本章结尾(《智能革命》063) 96. 我们注意到人工智能和神经计算框架之间的非常有趣的联系,它们都釆用分布式表示超大向量,其基本运算都是线性代数而不是布尔代数。有科学家提出,人类的大脑运作原理与量子物理、量子计算理论、量子计算算法类似。微软、谷歌建立了量子人工智能实验室,国内也有这方而的项目。甚至5年内就会出现早期的量子机器。为何量子计算这么重要?因为量子计算跟人工智能有本质上的关系。量子计算的核心就是利用量子的叠加状态。量子有一个能力状态的变化,不同于现在的计算机数位,0或1,一个时间只有一个状态。量子的叠加态特性可在同一时间有四个状态,计算能力呈指数上升。(《智能革命》064) 97. 好处就是通过量子计算可解决很多数据问题。以前的办法就是数字分解。如数据加密和解密,都要用很难的素数分解。一个很大的数字,用一般的算法,算到地球毁灭可能也算不出来。但用量子算法后,可很快算出来。未来用量子算法做机器学习是很自然的。与此相关,以布尔代数为主的硬件一定要革新。因为深度学习的核心计算是矩阵和张量的计算,不是0和1的计算,且一定要做微分运算。量子计算也是一模一样的,每个量子改变能级的时候,就是一个矩阵和张量的计算关系。大自然其实就是这样计算的,人脑也一样。MatthewFisher (马修•菲舍尔)、潘建伟、朱清时等科学家都认为,意识的本质就是量子纠缠。2007年 Nature(《自然》)杂志发表了加州大学伯克利分校GrahamFleming(格雷厄姆•弗莱明)领导的实验室的成果,他们利用飞秒激光技术,在极短时间内向光合作用复合物上照射激光,结果发现了复合物上仿佛鼓点般的光回波,这意味着光子的能量不是通过单一路径传入反应中心的,而是利用量子相干性同时从所有可能的路径进行传播,从而证明了量子效应在叶绿素光合作用中起到不可替代的作用。这鼓点般的量子回波,正是大自然与人类智慧之光的映射。量子效应在生物体上的发现极大地鼓舞了人类对量子计算和人机结合的新探索。(《智能革命》064、065) 98. 很多人已经在思考:若有了量子计算机该如何来做机器学习?若10年后量子计算机出来了,它会对人工智能行业带来根本性的改变,因为量子计算跟人工智能、深度学习的核心计算是彻底吻合的。我们现在实际上是走了一条弯路:任何算法都要把它变成是布尔代数,用0、1来模拟一个微分方程。量子计算和DNA(脱氧核糖核酸)计算的规模和能量将远远超出今天的基于硅的计算能力。我们将迎来全新的计算体验(如量子化学和量子材料)。其应用也无比广泛。首先落地的可能就是最古老的农业,从上述光合作用的例子可知,植物也在计算。以后农作物都可能用计算机来计算和设计。所以量子计算对整个社会可能是一波超级改变,很可能就此引领人类文明的长河走向彻底数字化。(《智能革命》065及图2-4经典计算机和量子计算机、066) 99. 总之,量子计算不是玄学,而正是“知道更多,做到更多,体验更多”这个人类进步规律的未来。(《智能革命》066) 100.

Tags: 革命   智能   笔记  

搜索
网站分类
标签列表