第一是要有好的算法,这个是核心,就像是软件。
第二是要有充分的大数据,这个就相当于是软件里的输入素材。而且深度学习型软件是可以自我优化自我进化的,输入素材越多、数据标示越好最终的效果就越好越精准。一旦某一方面的大数据有优势,未来的巨头可以很快形成滚雪球效应,跟后来者拉开差距。
第三,就是要有处理这些天量数据的硬件处理速度——以目前的人工智能运算量来看,哪怕是解决最简单的图片识别,或者语音智能识别,甚至只是输入法频次统计反馈,都不是任何一个单独的服务器可以承载的。或许每一个需求,都要用一个数据中心的处理能力去处理。
但是同时,每个数据中心处理的多个问题又可能有很高的重复率,数据处理过程量的复用率会很高。所以拥有越多处理需求、越多处理硬件资源的企业,在处理效率上就会有明显的优势。这时候,我们就会发现,依靠传统的‘为每一个新的业务需求购置一批服务器、搞一个专门的数据中心’,效率会非常低下,成本会非常高昂……”
顾诚刚说到这儿,被不怎么懂技术的马风给打断了:“那么怎么解决这一点呢?如果只是钱贵的话,那也不是什么大问题,我们费钱别人也费钱,大家一起涨价不就行了?”
“呵呵……如果是‘你贵我也贵’,确实问题不大,涨价就是了。但是如果人工智能的应用成本太高,它对传统产业和传统咨询类人工岗位的替代效应就不明显了。用人工智能大面积解决问题,必须是其成本明显低于雇佣人类客服、记者、编辑、老师、咨询师、查法律文书卷宗的基层律师、只会开票的基层会计师……
资本家才会把这些重复脑力劳动的基层白领开除掉,改用机器人。不解决成本问题,或许你不会被其他人工智能竞争对手同行甩开,但对于整个人工智能行业消灭人类岗位的进程,起码会造成三到五年的延后。”
马风还在琢磨其中的算计,丁三石却已经听懂了:“确实,就跟今年我看到滨江咱黄易总部隔壁,有几家做新兴产业led的公司,虽然大家都贵,但是卖不出去的主要原因不是因为比同行贵,而是‘买了led的产品之后,售价减去产品全生命周期内省下来的电费,依然比节能灯都贵’,所以那些物业老板才不买。我跟其中一家叫罗莱迪斯的公司老板喝过几次功夫茶,就听他说起过这事儿。
还有隔壁的海康威视,早几年也是这个情况——一套监控卖那么贵,之所以卖不出去,不是因为它比竞争对手大华家卖得贵,而是因为多装这几套监控的成本,比多雇佣一个保安都贵了,才卖不出去。这两年成本下来了,那些精明的企业主才开始多装监控少雇保安。”
马风的见识还是很广博的,他做电商起家,各行各业都了解一点。听了丁三石举的例子,他马上就想通了。
人工智能的普及,说到底是跟人力成本在pk价钱,不是跟同行pk价钱。比人便宜才有资本家用。
于是他诚恳地追问顾诚:“那小顾你觉得,有什么快速降低人工智能运算成本的办法呢?总不能让我们去投资英特尔,指望硬件厂商把单位计算效能的cpu价钱加速猛降下来吧?”
“当然不是。”顾诚端起茶杯,作势喝了一口,表情很淡定,“首先,cpu的架构模式,处理深度学习算法需要的并行数据处理时,效率还是太低了。就算要在硬件上下手,也不该找英特尔。”
应该找英伟达,但是这句话顾诚就敝帚自珍了,没必要告诉马风和丁三石。
他从02年就收购了agiea公司,在人工智能用gpu领域的布局,已经占到了先机。未来不管是挖英伟达的技术团队、积累技术储备,还是直接想办法到英伟达投资,都很灵活。
这事儿,他自己就能做,不需要马风和丁三石的配合。
他今天需要说出来的,都是些他不愿意啃的硬骨头。
“其次,即使不在硬件的物理指标上争取跨越式发展,我们还可以在资源配置效率上做文章——这个解决方案,就叫做云计算。利用未来网络的进一步便利,把各大互联网公司的数据中心整合起来。
或者让专门的服务器/数据托管公司形成虚拟服务器/虚拟数据中心的架构,实时优化调度计算资源,把闲置的计算力量以一个相对较低的价格临时、分时租赁给出现处理需求的人工智能公司——用这些招数,可以轻松做到在硬件物理性能没有飞跃的情况下,靠优化配置节约数倍的计算资源成本。”
“你说的这招,目前技术上实现得了?”马风和丁三石异口同声地狐疑道。
顾诚淡定地耸耸肩:“比较难,但是已经有机会——年初的时候,英特尔公司就开始力推双核cpu处理器了,对多线程计算的分配效率和架构也做出了很大优化。我们公司,目前就基于此基础,尝试了内部代码编译服务器的‘分布式编译’架构。你们不信的话可以去参观一下。”