第三届世界互联网大会在乌镇盛大开幕,本次大会评选出了十五项世界互联网领先科技成果,BAT 三家巨头的产品集体斩获:围绕生态创新的微信、电商交易处理平台的阿里云以及聚焦人工智能的百度大脑。某种意义上,这三个产品也代表了当下BAT公司的重要战略走向,既是三家公司自身基因的延续,也是结合当前技术发展的全新布局。归结为一句话:腾讯掌控时间,阿里瞄准口袋,百度布局未来。
掌握「时间」的腾讯
作为以社交关系起家的公司,腾讯很早就确定了移动互联网社交关系的绝对优势——微信。过去几年时间,微信从一个最早的即时通讯工具逐步成长为新一代的超级 App,用户可以在上面购物、 打车、游戏、看新闻等等。尤其是基于海量用户,微信形成了移动互联网新的内容分发渠道——微信公众号,也带动了内容创业的热潮,在过去几年产生了无数基于微信内容创业的「一夜成名」传说。
从产业形态来看,移动互联网天然就是一个内容消费的产业,这里的「内容」泛指于绝大多数在互联网上流动的信息,从新闻文章、视频、电商促销消息再到如今的直播等等。而微信作为移动互联网的重要入口,事实上也具备掌控内容分发的能量——这种能量可以左右你看到什么与看不到什么,也可以让你多看什么或者少看什么。
在这个注意力稀缺的时代,微信几乎以一己之力调控你「花费在不同内容上的时间」。一如在刚刚结束的美国大选中,围绕 FB 是否通过算法干预选民在 FB 看到什么新闻的争议还在持续发酵。
但不管如何,微信从一个内部创新项目到现在影响 6 亿用户的巨无霸,其背后所引发的经济效益和创新效应不容小视。比如通过「对话界面」这个看似不起眼的创新点,却直接催生了一个基于聊天界面的全新产品类型——可以通过对话完成客服,也可以通过对话实现交易,当然可以是人与人的对话,也可以是人与机器的对话等等。
当亚马逊工程师决定将亚马逊为季节性购物而准备的软硬件资源打包出租的时候,或许连贝佐斯也不会意识到这个产品居然会成为亚马逊的未来,而当 2009 年阿里云工程师写下「飞天系统」第一行代码时,或许也不会想到,彼时的那一颗种子竟然会长成现在的参天大树,就在前几天阿里的财报中,阿里云的增长速度惊人,此次入围世界先进科技成果,阿里云也是榜上有名。
与亚马逊类似,阿里云的起步同样是为了解决阿里内部电商产品的技术难题。随后,阿里云根据中国市场的新情况,不断推出针对中小企业特别是互联网企业的产品,2013 后开始陆续延伸到其他行业。事实上,脱胎于阿里巴巴内部系统的阿里云,在电商产品类的 SaaS、PaaS 方面有着不晓得优势,特别是将云计算与阿里内部大规模电商业务的经验相结合,比如阿里云已经支持阿里巴巴多年的双十一活动,其积累的运维经验对于很多以电商为切入口的企业非常有吸引力。
综合来看,当前云计算的竞争正步入全球化、混合云化和争取大企业客户的阶段。阿里云通过立足中国,以电商切入云计算市场后,接下来也将面临诸多挑战,比如如何增强云产品的特点,从而不仅局限在几个特定领域,而是延伸其更多行业;再比如如何在扩充海外数据中心的同时提供云服务,毕竟云计算是一门服务而非一锤子买卖。
马云今年在多个场合表示阿里巴巴明年起不再提「电子商务」这个词,这并非说明阿里巴巴不再重视电商业务,而是要从电商的基础层面重新出发。马云的新王牌其实就是阿里云,以支撑阿里巴巴日常电商业务为起点,并在双十一的高并发的应用场景中得以成长。今年以来,阿里云陆续在产品集成了语音识别、图像识别等人工智能技术,所有这些其实也构成了马云所言的「新零售」的逻辑起点——用云改造原有的零售业态,从而推动阿里巴巴电商业务的再次升级。
如果说腾讯在努力赚钱,阿里在双十一狂欢,那么此次百度入围的为百度大脑,可以视作在领跑未来。百度大脑是百度在今年9月首次向外界全面介绍的人工智能研究成果,换言之,百度大脑代表了百度人工智能研究的集大成者。一个细节是,在百度大脑正式公开一个多月,《财富》杂志在一篇深度报道中全面分析了人工智能发展的现状,并将百度 、Google、微软、Facebook 称之为当前人工智能的「四巨头」。
仔细去看百度大脑的底层架构,算法层面来自 PaddlePaddle 深度学习平台驱动,计算能力由专门为人工智能定制的超高速异构计算集群「AI超级计算机」提供,再加上百度作为「互联网入口」所掌握的海量网页数据、搜索数据、语音视频数据等等,共同构成了目前业界领先的人工智能系统架构。
由上述底层架构延伸出的是四大基础能力,其目标是让机器「能听、会说、会看」,这就涉及到语音识别、语音合成、图像识别以及自然语言处理等。比如让机器听懂人类的语言,就涉及到语音识别。在《麻省理工科技评论》评选的「2016年十大突破技术」中,基于语音识别的对话界面(Conversational Interfaces)成功入围,而要让人机对话有效,不仅要让机器听懂人的话,还要做出适当的反馈,《麻省理工科技评论》认为:百度硅谷实验室研发的语音识别引擎——「深度语音系统2」(Deep Speech 2),拥有一个大型深度神经网络,基于端对端的深度学习技术,可在数百万转录语言库的基础上学习如何将声音和语句联系起来,语音识别率精确度极高。目前的语音识别准确率为97%。
而进一步来看,人工智能各项能力的竞争并非单项比赛,而是各个单项互相促进形成的团队作战。比如图像识别的显著进步直接推动了百度OCR识别技术的发展,这也不难理解当百度人脸识别准确率达到99.7%后其OCR技术在国际文档分析与识别大会(ICDAR)最具挑战性的自然场景类文字识别任务中,斩获五项冠军。而由此带来的长远效益则是百度无人驾驶领域的核心技术之一——高精地图。
只有在图像识别技术的基础上,才能让机器自动进行目标识别,实现百度地图中的POI、导航等信息的快速更新。而实时完成全景图片的识别,对于整个后端的计算能力要求非常高,这也正是深度学习系统PaddlePaddle 和AI超级计算机的功劳,这些技术对于汽车实时感知周围环境、快速实现路径规划并预测车辆、行人行为有重要意义,也从根本上保障了自动驾驶的安全。
事实上,人工智能领域的竞争才刚刚开始,而这场变革将引发的深远影响却值得期待,比如无人驾驶汽车的研发。当汽车在上世纪初成为大工业生产的代表时,或许没有多少人能意识到这个机器居然塑造了 21 世纪人类社会的方方面面。毫不夸张地说,正是在汽车的带动下,城市化才得以真正意义地展开。从每个城市到城市里的每个街区,再到每个办公楼,汽车成为整个城市运转的重要力量,由此而来的是城市道路、立交桥、环路、高速公路等等基础设施的完善。
现在各大公司对于无人驾驶磨穿擦掌的样子颇有20 世纪初的样子,彼时,汽车行业正在步入大工业发展的轨道,由此带来的是对人类交通的改变,与交通一起被改变的,还有人类生活的城市,因此,无人驾驶多引发的行业变革、产业变革乃至社会变革,或将重新塑造人类生活、工作的环境。各大巨头都着眼于未来三到五年实现大规模商业应用,而百度也制定了「三年商用、五年量产」的目标,其接下来的发展也颇为引人瞩目。这次在乌镇,百度建立了全球首个无人驾驶体验站,邀请记者试驾,朝着商业化的路径又前进了一步。
华龙网的一篇报道指出,这次乌镇无人车测试和试运营,也是国内首次在全开放城市道路上行驶,体验全程3.16公里,共经过三个红绿灯以及一次调头,不仅面临人车混行、电瓶车穿行等多种复杂路况,还需应对中雨、薄雾、雾霾等多种天气状况。运行过程中,无人驾驶汽车使用的全球领先L4级自动驾驶技术实现红灯识别、行人避让以及超车并线等,保证无人车的安全运行。
写在最后
这份由互联网大会评选出来的世界先进科技成果还包括特斯拉的增强型自动辅助驾驶、IBM Watson、微软 Hololens 等,基本都是这些公司押重金打造的战略级产品。而透过对 BAT 此次入围项目的梳理和盘点,也构成了对于中国互联网格局乃至世界互联网格局的全新认识,如果说互联网的上半场已经结束,那么下半场的新战场中腾讯还将在社交领域持续发力,阿里的电商优势仍将扩大,百度以未来为导向,全面拥抱人工智能,BAT 手中的王牌早已更新,接下来的厮杀也将更精彩。