算法、算力和数据,是人工智能快速发展的三个要素。首先在算法上的突破,才让人工智能的商业化发展看到了希望。其次,计算能力的提升,使得复杂的算法得以实现,快速得出训练成果,降低成本。最后,大数据时代为人工智能的训练学习提供了大量的资料。离开其中任何一样,人工智能都无法实现大规模商业化应用。
1. 算法
算法是人工智能发展的基础,现在主要应用的深度学习算法。算法框架中诸如Caffe、TensorFlow、Torch等大多数已经实现了开源,成为大多数工程师的选择,对行业的加速发展和人才的培养起到了非常大的作用。
全球的开源平台的成熟,也使得中国企业能够快速地复制其他地区开发的先进算法。就应用层面而言,中国的算法发展程度与其他国家并无太大差距。事实上,中国在语言识别的人工智能算法上取得了突破性进展,在世界上领先。
2. 算力
计算能力是人工智能的基础设施之一,因此具有较高的战略意义。GPU(图形处理器)强大的并行计算能力显著提升了计算机的性能,而且降低了成本。英伟达最新的GTX1080游戏显卡拥有9TFLOPS的浮点性能,但是价格只要700美元。每GFLOPS的算力成本只有8美分。而1961年的IBM1620要提供1 GFLOPS的算力,费用大概是9万亿美分。
在算力部门,英伟达、英特尔和AMD这全球最大的三家芯片供应商,负责提供GPU和CPU。硅谷也在针对性发展FPGU(现场可编程门阵列)和ASIC(专用集成电路),应用于人工智能计算。云计算和超级计算机也在为人工智能的发展提供服务。
3. 数据
人工智能系统必须通过大量的数据来“训练”自己,才能不断提升输出结果的质量。拥有的高质量数据越多,神经网络就会变得越有效率。
人工智能的根基是训练,就如同人类如果要获取一定的技能,那必须经过不断地训练才能获得,而且有熟能生巧之说。AI也是如此,只有经过大量的训练,神经网络才能总结出规律,应用到新的样本上。如果现实中出现了训练集中从未有过的场景,则网络会基本处于瞎猜状态,正确率可想而知。比如需要识别勺子,但训练集中勺子总和碗一起出现,网络很可能学到的是碗的特征,如果新的图片只有碗,没有勺子,依然很可能被分类为勺子。因此,对于AI而言,大量的数据太重要了,而且需要覆盖各种可能的场景,这样才能得到一个表现良好的模型,看起来更智能。