我们已经看到移动互联网是个巨大的市场,但它连人工智能的十分之一都没有。十年后,如果我们回顾人类的发展,会发现没有任何市场比人工智能来得更大。
我从30年前就开始探索人工智能,但是没有天时地利人和——机器不够快,大数据中心不存在,数据不够多,算法不够先进……30年来,不断有科学家发明新的技术,虽然人工智能还有很多局限,没有情感,一次只能涉足一个领域,不能跨领域思维,但是从最近四五年开始,这些技术在很多狭窄领域里已经远远超过了人类。
如何用一个更通俗的方法解释什么是人工智能?想象一台机器是刚出生的小宝宝,人类的小宝宝是用教育、用知识、用书本让他们慢慢成长,但人工智能用什么来帮助他们成长呢?就是大数据。
但是机器一次只能专注在某一个领域,在单一领域它可以做得非常好,但是跨领域做不到,所以人类还是有机会的。美国科学家发明的深度学习在中国已经普遍开始使用,就是这个道理。
由于我们可以统筹各种知识和经验,姑且认为人的大脑还是比机器优秀。但是机器有一个特别大的优势,即“过目不忘”,不仅可以储存大量数据,而且能够从数据中学会推理。
我们投资的一家做人脸识别的公司,训练的是50亿张人脸,比我们多看了1000倍,我们要用一辈子时间,它可能是只用三天时间就记住了。所以现在保安这一类用人脸来做的工作根本比不上人工智能。
再以无人驾驶为例,一个人,即便一天开100公里,一年365天地开,三五十年累积起来可能也就几百万公里的经验。但是今天特斯拉已经有20亿公里数据,比我们多了1000倍,而且算法还在不断演进,它已经超过了人类。
海量的大数据在很多狭窄的领域远远击败人类所能够做的极限,可以说,人类永远不会有任何机会胜过机器。比如我们读一本书的速度是很慢的,而IBM人工智能参加电视比赛的时候,一天就能够把全部美国国会图书馆的所有藏书读完。
大数据正在各个领域帮助人类创造价值。今天人们都在做大数据的人工智能,如百度的一条搜索,今日头条的排序,淘宝推荐的每个产品,滴滴每次对接司机……这背后都是人工智能。
结合大数据的人工智能,可以广泛应用于传统领域,比如银行、保险、券商、机器人炒股。我个人的投资已经两年没有给人,都是机器人帮我理财,但回报一定比人要好,这些领域人类根本不是对手。
在医疗、教育等其他传统领域也存在着大量数据,机器算法、人工智能可能几天之后就能比人做得更好,产生的商业价值是不可想象的,超过互联网和人类所有的历史累积。
创新工场不只是在做预测。我们所管理的基金投资孵化的项目,超过一半是针对这个领域的,我们是真金白银在赌即将来临的人工智能时代。
这个时代即将来临,我们能做什么事情呢?
首先是建立好一体化大数据中心。这个事情最重要,为什么呢?所有应用需要的数据不是一个公司能够收集的,这个数据中心必须一体化,因为除了应用里面的数据之外,用户填的数据,外面还要抓取各种数据。
我们还希望收集在一体化数据中心里的数据能得到很好的保护,从而能够探索将这些数据变成服务,帮助创业公司创造价值。
比如说要做一个贷款的APP,不能只是依靠用户填写的几样数据就决定贷不贷,背后还要有整个征信数据,包括出行数据、消费数据等等。它可能提交一个要求,让大数据人工智能判断这个人还款概率是多少,欺诈概率是多少,有否犯罪记录,这些都可以算清楚,而且并不需要暴露用户隐私数据。
二是计算资源。这对创业公司来说特别重要。APP时代,我们常说中国创业成本达到历史新低,很不幸,人工智能加大数据,创业成本将会达到历史新高。我们投资的一家公司,七个小朋友,没有人超过三十岁,他们成立的第一天,就把我们打的款花完了,还只是买了一些机器,因为做的是无人驾驶。
但我们不可能让成千上万的双创项目都买机器。要把这些机器放在数据中心里,将CPU和GPU的功能很好结合,谈个更好的采购价钱,不同的时段按照使用收费,这个也是未来大数据能够提供的潜在机会。
第三是数据量需要非常多。数据收集是一个逐渐的过程。有些数据可能不能公开,有些公司数据可能需要保护隐私,但是可以用API做一个接口,不泄露数据。这些数据怎样整合起来?首先要有一个一体化数据中心。
谷歌成立了一家公司,旗下有100万台数据库服务器,是世界上最大的一体化数据中心,它把所有数据加以利用,用在搜索就是谷歌,用在诊断就是谷歌健康,用在汽车就是无人驾驶……背后都是人工智能加上一体化大数据。
四是要培训大量人才。人工智能听起来非常高深,但是培养一个人工智能工程师,需要多久呢?这么高深的技术也许至少要十年、二十年?做网络安全的都是要有十五、二十年的工龄,做计算机网络和其他的领域都要读博士再做十年工作吧?实际上,一个优秀的理工学生半年就可以成为AI工程师,应该做一个更大的平台培训年轻人。
创新工场看到了这些机会,正在策划成立一个产业联盟,我们非常希望把这个联盟建立起来。在计算方面,数据中心方面,和北京供销大数据集团合作,在购买大数据方面政府能提供多少,业界能买多少,能够授权多少,我们希望也能统筹大数据这件事。
这几件事情里特别核心的一件就是大数据中心和人工智能算法的整合。让我们一起来引领人工智能和大数据时代的来临。