蒋炜教授:人工智能,一个形而上的命题

时间:2016.07.18 来源:EMBA中心

小编:近年来人工智能已经取得了巨大的进步,其发展可以用“方兴未艾”来形容。我们现在关注人工智能,很多人都会假设未来人工智能对人类以及所有产业链业会有些什么颠覆。会有一些忧患型的想法猜测未来人类可能彻底被机器取代。而部分学者认为,机器未来还是很难战胜人类,因为机器永远是基于分析人类思维来做计算,针对人类掌握的知识做分析。对于这些观点,似乎学界也有一些争鸣,您怎么看呢?

 蒋炜:人类和计算机之间的关系,是形而上的。我并不认为这是技术性的问题,就如同问人之初,是性本善还是性本恶。这是没有确定答案的问题。总体趋势来看,近十年间技术进步的速度远远超出了我们的想象。因为基于大数据的一些创新,包括算法、深度学习(Deep Learning)等发生了很大的变化。十几年前,人们谈论到“神经网络”时觉得已经没有什么研究可开展了,但突然之间它又火热起来。其实现在的深度学习就是基于原先“神经网络”的深入研究。最主要是算法上的一些创新,基本框架其实并没有发生变化。

小编:曾经看过一则新闻,位居多年世界排名第一的卡斯帕罗夫在和IBM公司的国际象棋电脑“深蓝”对决输掉两局后,曾经彻夜难眠。

蒋炜:深蓝是早期运用AI和神经网络的电脑,但它完全是通过遍历所有已知路径来获得最优的计算方法。所以从某种角度来讲,其实不算是人工智能,只不过是借助计算机设备本身计算速度快、存储量大的优势,在有限时间内遍历已知路径来找到最可能制胜的棋招。围棋或者国际象棋都属于确定性的问题,不属于随机性问题。所有信息都是已知的,过往人类在一类博弈游戏中的行为路径信息也都是公开的。在公开信息的情况下,唯一不确定性就是人类下一步棋会走什么以往棋谱里没有的招数,但其实眼前只有几个空可以走。所以计算机就可以迅速计算出你可能走哪一步,以及该怎么应对。计算机通过把所有“下一步”的可能性组合计算出来,并在这些组合中寻找最佳方案,而这些都是基于计算机存储中现有的棋谱。

小编:这是不是意味着在过去人机大战的棋类赛事中,人类之所以失败,是因为计算机其实在很短时间内默默计算了所有的可能性?

蒋炜:其实并不是,计算机其实是希望遍历所有的可能性,但是它做不到。人类大脑有一千亿个神经原,有5000个的连接,每个连接触发每秒钟两次的简单计算。人类大脑计算能力是10的17次方。现有的计算能力做不到把所有可能性全部搜寻一遍。所以计算机的大数据技术意义就突出了,应用方式是基于以前的棋谱来计算概率,即判断最有可能“下一步”怎么走。然后见招拆招,计算出这些大概率步骤的最佳应对棋招。

我们可以想象,从技术角度分析,因为计算机不可能遍历所有可能性,所以如果出现了过去棋谱中没有出现过的博弈,计算机就会卡壳。要战胜计算机就必须尽可能出奇招。一旦出现奇招,在已知的棋谱中找不到历史数据,那计算机可能就要做出猜测性的应对。

小编: 您之前做过一些大数据在工业生产方面的应用,能简单介绍一下吗?

蒋炜:工业生产是一个相对比较规范化的事情。所谓规范化,意味在在从事工业生产前,很多东西就被定义清楚了。你必须要按照固定的工艺流程,参考一系列质量体系和指标来进行生产,才能满足产品的要求。所以这些比较容易定义清楚。在传统的工业生产过程中,人们会收集很多数据,比如生产过程中的压力、各种传感器端的的数据等等。比如生产可口可乐,整个生产线大概有100多个传感器,从测量可乐容量的瓶子,到吹瓶,灌装,流水线上的瓶子运动速度。速度会直接决定了气压能不能灌进瓶子,以及可乐灌进去多少。低了高了都不行。

小编:所以每一环都需要很完美的结合?

蒋炜:是的,需要非常完美的结合起来。生产线一般都是事先设计安装好,然后再大批量生产之前试运行几个小时后开始正式生产。整个生产线上会涉及很多数据,而在今天的工业4.0时代。大数据的运用可以帮助我们更好的控制整个流程和保证质量标准。

小编:这是不是就达到了我们通常所说的精益化运营?

蒋炜:在工业4.0时代,工业生产中将有更多的传感器。未来大数据在工业生产中的运用发展会越来越快,技术也会越来越成熟。除了刚刚提到的可乐,我们研究过大数据怎么控制红酒的生产。整个红酒生产过程大概涉及几十种指标,包括生产过程中的压力,过滤时候的压力,温度、酸甜的程度等等,这些都会影响红酒的质量。所以我们的研究就是帮助红酒制造商通过大数据控制这些变量,生产出高质量的红酒。其实除了这些在工业生产当中的运用,今天大数据在服务行业当中的运用也有很多。

像电商类的服务行业,和客户接触中也会产生很多数据。相较于工业生产类的数据,这些数据有一个特点,即规范化和标准化程度较低。工业生产类的数据会要求流程标准化,否则会出现次品较多。但服务业有太多随机性,在服务行为开始之前数据是不能被预估的。比如在电商网站上,商户可能想预估一下客户上网时会花多少时间看网页。但电商不可能要求客户只能花5分钟浏览网页,否则就页面关闭。所以只能事后分析各类人群的客户会花费多少时间,然后通过这些特点,加上其他数据分析。比如从客户性质来分析,普遍来说母亲和未婚女性花费时间的差异。

现阶段人们怎么通过大数据挖掘消费行为的规律,并且及时、准确地帮助企业带来可以付诸于行动的决策仍然是非常具有挑战的命题。以1号店和京东为例,如何通过大数据让后台系统来控制库存、店面设计、消费者购物流程等。如何通过分析各类消费者要买什么、商品的款式需求量,来调整仓储备货情况。这些数据不单单与消费者当下购买商品的行为相关电商还可以关注更提前的数据,比如从POS机抓取到的购买记录数据,比如从浏览记录确定客户的购买意向和购买习惯,随着数据量增大和精准度提高、数据时间跨度的增长,可以帮助对电商的数据分析更为细致,也更可能降低库存水平、调整价值策略、产品定价、店面设计等等。大数据将为未来服务过程的个性化带来极大的可能性。

小编: 曾经听到一些观点,认为未来优秀的企业CEO也可能是机械化。比如公司上市或并购等决策方面, CEO的角色是否可能被机器人替代?大数据或者机器人能否在更复杂的人类活动中发挥作用?

蒋炜:决策有两种不同的类型。大部分决策选项都是在不确定事项中选择最大化收益和最小化风险的选项。而 CEO的决策往往并非是基于事先已知的决策选项,更多地是取决于其经验和一些无法量化的因素。这些是人工智能无法做到的。在战略性决策中,CEO的工作很难被计算机替代,相反CTO、CMO和CFO的工作却很容易被计算机替代。他们的决策选项比较固定,虽然也有不确定性,但相对来说,大部分的决策因素容易用数据来量化的,计算机可以通过分析这些数据得到最优方案甚至有动态分析的能力。优秀的CEO在做决策时,通常很少有选择范式,考虑的因素也比较复杂,比如合伙人和董事会的意见。

小编:您觉得人工智能未来还会对哪些产业有所颠覆?是不是人类的很多职业都会被取代?

蒋炜:颠覆早已发生。在二三十年前已经发生了,比如在动画设计方面,机器的效率比人工要高,且画的更好。每个人都需要思考,自己的职业生涯规划是否能保证自己所从事的工作未来至少20年内无法被计算机替代。跟数据处理相关的工作很容易被机器替代,比如互联网端的广告自动投放。目前自动化交易处于非常微观的层面,现在大部分还只是在互联网段选择广告投放的位置。未来数据分析可能涉及到跨平台的广告投放,比如分析哪个平台效益最大,以及某些平台的受众是否和目标客户匹配。

这对我们每个人都是一种冲击,每个人都需要思考我的工作哪些是可以被替代的,哪些是不可以被替代的。这是一个很值得讨论的命题。比如教师行业能否被替代?现在有很多幕课教育平台。慕课平台使得老师可以把自己的思想传播给更多人,成本也比较低。像我们这样的老师可能都面临着挑战,我们会自问,未来授课的形式是否还会依然是小班制教学吗?

小编:很多老师认为上课不仅仅是知识的灌输,更多是激发学生的思维,以及根据学生的反应,针对不同学生做个性化的教学。所以他们觉得教师这个职业其实很难被人工智能替代。

蒋炜:这就是自然科学和社会科学的差别。在某种角度上,自然科学教授的知识大多是选项固定的,在教授知识的时候,是在确定的选项中告知学生哪一个是正确答案,告知学生解答方法。而社会科学的命题和选项本身是都模糊的,老师和学生的选项认知不同,需要相互了解彼此对于选项的理解,在交互和讨论中理解选项。与自然科学相比,社会科学的解决方案本身并不是唯一的和具有确定性的。这也是为什么在自然科学领域里,许多命题的结论是没有异议的,而在社会科学里常常存在异议。

我在给EMBA学员上课的时候也会强调这一点,虽然EMBA学员大部分已经事业有成,在企业里拥有较高的职位。但面临未来科技发展的压力,职业发展也会有许多不确定性。对于我们的全日制本硕博学生来说,现在还处于全身心投入的学习阶段,未来的职业生涯还没开始。在做职业规划时,更加需要考虑未来应该把自己塑造成为什么样的人。有一点是肯定的,面对未来不可预知的挑战,我们要把自己培养成为时时刻刻准备学习的人。与十年前相比,大数据在商业应用蓬勃发展,在人工智能和数据挖掘的技术方面,数据量的激增也使得计算的根本思想发生了改变。

小编:互联网金融P2P平台现在发展很快,国内已有3000多家。但是行业内负面新闻层出不穷。其实P2P从实质意义上来应该是点对点式信息中介。在中国征信系统信息比较缺失的很多互联网金融公司都声称在利用大数据技术自建信用评估系统。您觉得在这方面未来是不是会有很大发展?

蒋炜:大数据的应用在金融行业确实会更加广泛。我曾经和平安银行小微贷款的信用评估人员交流过,其实相关信用数据很难获取,数据质量也很难控制。所以首先需要解决的问题是,如何更好地收集到有效的信息,否则只有计算机是很难发挥作用的。其次才是在思考产品设计方面,如何最优化风险。目前谷歌是搜集到数据最多的公司,国内除了BAT外很难有公司可以企及。平安曾经透露,现在对他们来说一个难题就是,银行可以查阅到的央行公开征信数据差不多有3亿左右,还有10亿是没有信用记录的。

如果说通过许多人的上网浏览网页行为来判断,那针对网络行为较少的人,给如何贴上信用标签呢?自建完善的信用体系很难做到。互联网金融行业的核心竞争力在于信用评估体系,但是行业本身的欺诈和跑路现象很严重。即使像平安这样的巨头,也非常忧虑借款人申请借款的信息不真实。确实,如果互联网金融公司能获取更好的更高质量的有效数据,信息覆盖面越来越广,这种公司未来肯定是越来越有竞争力的。

编辑:EMBA中心  徐静