李彦宏
中信出版社/微信读书 9787508673219
中信出版社/微信读书 9787508673219
-
下一个浪潮
以现代数字计算系统为基础,IT(信息技术)行业在创造数以万亿元计的价值时,正是从组织信息(Information Organization,IO,帮助人类认知更多)、完成任务(Task Completion,TC,帮助人类实现更多)、丰富经验(Experience Enrichment,EE,帮助人类获得更多经验)三个核心维度上使人类取得长足的进步。
-
目前来说,人工智能的“感知系统”有更广泛、更新的商业机会:一方面,可以构建和部署更多的“传感系统”的子系统,针对的是物理环境或物理系统,如装配线、工厂等。这使得未来人力密集的制造业、商业服务业等,可以采用更先进的信息工具和更强的自动化。另一方面,自然语言处理技术的迅速进步使得我们可以扫描和分析文本文档和信息,并从中提取各种高价值的业务知识,而构建和部署专用的“文本理解子系统”可以得到很多高价值的知识和商业回报。
-
衡量人工智能的现实标准
有两种类型的计算系统被人类叫作人工智能。第一种,本质上相当于“智能计算系统”(ICS)的子系统框架。它将数据作为输入,从数据中提取信息并建立模型,将我们关心的某些现象转化为知识。我们称这种类型的人工智能系统为“通用智能系统”(General AI),并定义“通用智能”的意思是一台机器获取知识和实现目标的能力。第二种,指具有类似人类的认知能力,能感知(“看”“听”“感觉”),它们可以越来越多地推理和计划,它们可以用感觉运动控制移动。我们称这种类型的人工智能系统为“认知智能系统”(Cognitive AI),是具有感知、推理、规划和感觉运动控制能力的机器。
-
智能计算系统与大数据是直接相关的。任何数据都有产生的缘由,都有产生数据的体系和系统,这就是为什么数据会产生,数据的核心是知识。通用人工智能系统的核心能力就是通过运用算法、计算体系,把知识从数据里提取出来。一旦有了知识,我们就可以做很多事情。我们可以预测,可以解决自动化问题,可以解决任何需要解决的问题。因为知识告诉我们人有什么需求,社会有什么要求,有了知识我们就可以找到答案。所以,人工智能发展的第一个层次就是通用人工智能。
-
搜索技术是人工智能的先驱,也是最早的互联网数字化世界的门户,其开发流程和技术核心为未来的人工智能奠定了基础。首先,搜索引擎必须与很大规模的数据打交道;其次,搜索引擎必须同时有大规模的机器学习,人工来做是不可能的事,因为数据规模太大了;最后,也是最根本的一点,搜索引擎的开发流程和工程开发文化与人工智能系统的开发是非常吻合的,都以数据为主,通过抽取其中的特征、模式,然后用这个模式给用户带来价值。人们在搜索业务中结成的协作关系,形成的业务能力和工作习惯,都很适合人工智能业务发展,与海量数据一样,积淀为人工智能企业的文化。
-
企业挑战:如何落地
做人工智能事业要跨越的第一个障碍就是如何落地。人工智能意味着一个非常大的改变,时间会很长。要落地的话,首先必须找到非常好的、实际的用户体验,就是能给用户带来实际效益;其次,场景必须清楚,智能助手也好,无人驾驶汽车也好,信息找人也好,一定要有实际的用户体验价值;最后,还要找到商业模式,不然就没有可持续性。
-
在历史的重复中变化
数据将人与人、人与世界连接起来,构成一张繁密的网络,每个人都在影响世界,而每个人也在被他人影响。
-
大数据——万物皆数
第一,大数据的“大”。毋庸置疑,这个“大”相对于人类传统数据的储存方式,不是一个量级上的大小之分,而是几何量级的差距。
第二,大数据的另一个重要特点是多维度。多维度代表着大数据可以对一个事物进行多方位的描述,从而更准确。
第三,处理非结构化数据的能力。
互联网时代产生了大量非结构化数据,对于图片、视频、音频等内容,它们的数据量巨大却没有清晰的结构。
第四,大数据是生生不息的“流”,具有时间性。它过去就不再回来,就像人无法两次踏入同一条河流。
这一方面是因为数据量太巨大,无法全部存储;另一方面是大数据和人类生生不息的行动相关,瞬息万变。
最后一点,也是最重要的,大数据的“大”表现为无尽的重复。
以往人类无法通过穷举法来把握一个事情的规律,只能采用“取样”来估计,或者通过观察用简单明了的函数来代表事物规律,但大数据让穷举法这种“笨办法”变得可能了。
-
突破:机器学习与人工智能
1950年,阿兰·图灵创造了一个针对机器的测试方法,即后来大名鼎鼎的“图灵测试”。这位充满传奇色彩的科学家认为,如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么就可以认为这台机器具有智能。
-
赫布给机器创造了一套可以简单区分事物的方法,对于每个数据,让决策树程序做出判断,判断对了就奖励(提高函数的权重),判断错了就惩罚(降低函数的权重)。他利用这个方法创造了一个分类器,可以提取数据集的统计特性,把输入信息按照它们的相似程度划分为若干类。