2016年,人工智能技术被推上了研究和商业的风口浪尖,
从“深蓝” 到Master,从驾驶辅助到自动驾驶,从Alexa到Google
Home,从大学教授到企业领袖,人工智能技术在互联网行业遍地开花,同时也对人们心目中的传统行业--制造业带来了巨大的冲击与商机。
从“深蓝”到Master
继IBM“深蓝”在国际象棋对决中战胜世界冠军卡斯帕罗夫,Waston在危机边缘战胜人类冠军Ken和Brad,Eugene挑战图灵的“TheImitation
Game”后,人工智能在一个更加复杂的领域—围棋中再次超过了人类的最高水平,AlphaGo以4:1的比分战胜了韩国围棋大师李世乭,其升级版Master更是在弈城网上取得60:0:1的不败战绩。同样是在对弈比赛中战胜顶尖人类选手,“深蓝”到Master的发展充分体现出了人类科技进步在计算方法和计算资源上的长足进步。如果说“深蓝”是凭借其运算速度通过遍历战胜了人类,那么Master是在此基础上通过优化的搜寻算法,决策支持和计算架构遍历了当时觉得不可能实现的所有可能。Master所用到的Deep
Reinforcement Learning结合了当今AI领域研究的两大前沿技术Deep Learning(DL)和Reinforcement
Learning(RL),创造性的使用DL的方式,通过棋局的图片评估落子的优先级,再结合RL,通过自我“对弈”的方式更新深度神经元网络的参数,最终带领人类真正意义上站在了“智能”的门口。AlphaGo最重要的成就并不是采用了性能多么优秀的电脑,而是第一次让程序可以近似人类的方式去感知、学习、思考和决策。
无论是Master这样已经存在的,还是在《西部世界》中的BICAMERAL
MIND,人工智能已经大跨步的走进了我们的生活。目前来看,人类所有的外部感知能力例如温度,加速度等都早已可使用现有的传感器技术实现,基于机器学习,统计学习的方法更是帮助机器在听(语音助手),看(computer
vision),读(NLP),写(handwriting
recognition),思考(Optimization)等多方面超越人类平均水平。有人预测奇点理论正在以很快的速度成为现实。我们不去探讨人工智能的技术本质或是它的伦理问题,如果人工智能真的被规模化地应用,那么能够对人类社会带来什么样的改变和价值?
走出“楚门的世界”
在与Master交手前,棋手柯洁在自己的微博上如是说,可谓一语道出了智能化的真谛。如果智能化仅仅停留在遍历搜索,相似度分析的层面,那对人类的进步又有何意义。作者看来,人工智能和大数据分析最重要的核心就是要能够为人类提供全新的认识问题和解决问题的方式,用机器纯理性的“思维”方式去辅助人类的思维与决策。
决定人类社会进步速度的最本质的制约要素是“认知的边界”,所谓知识的边界则是基于前人的经验与规则所构建的无形的域。
就像《楚门的世界》当中,剧组为楚门所构建的整个生态,无形的禁锢了他认识问题,解决问题的能力。而当人的认知和判断无法满足不断增长的数据维度和问题复杂度时,依靠人的知识和经验去驱动和创造的过程就会有边界。以图像识别为例,基于人类经验的数据分析方法,首先使用滤波器对原始图像经行降噪,在使用滤波器经行图像边界识别,最终使用模式识别的方法分辨图像中不同的物体。这样的方式,其核心在于滤波器的选择,滤波器的参数配置以及分类器的选择都需要经验支持,不同的组合形式其最终模型输出的结果差距明显。如今使用的基于深度学习的CNN方法,将滤波器的类型及参数选择基于依赖于最终分类器输出结果的表现,使用反向传播算法,不断优化模型结构与参数。这样的方法,基于大量原始数据,从数据中发现规律,提取有效特征,最终实现更加准确地决策支持。
除了深度神经元网络研究,机器学习和人工智能领域的研究包括迁移学习,无监督或半监督学习,特征工程,增强学习,对抗网络等的不断创新,为人工智能在更多领域的应用和价值创造提供了有力的理论支撑。迁移学习,无监督或半监督学习的研究实现了将统一的模型或模块的推广和启发式应用,类似于人类知识积累到一定程度之后触类旁通。特征工程的研究,提供了在海量数据当中依照业务需求或者既定规则抽取或者重构有效信息的方法,为认识和研究高维度下的数据科学问题提供了有效地工具。增强学习,对抗网络等研究领域的不断创新为在数据样本不足,数据不完善前提下的智能化问题提供了全新的思路。
从“人工智能”到“工业智能”
从计算机,互联网行业出身的智能化技术,正在以势不可当的势头横扫全球各个领域。智能化与工业的结合更是引得全球瞩目。从德国的工业4.0到美国的工业互联网,从GE的Predix到IBM的PMQ,可以看出,工业与智能化技术的结合也必将是下一个风口。
智能的核心在于决策和执行,而决策的核心在于感知和判断。在工业系统中,IoT技术,
包括传感器技术,数据传输,数据管理等不断发展,为智能化技术实施提供了可靠的感知基础。但是目前的工业界大都以人的决策和反馈为核心,这就导致系统中有很大一部分的价值并没有被释放出来。系统越是复杂,人的学习曲线就会越缓慢,而当人的学习曲线比技术的进步速度慢时,人就会成为制约技术进步和应用的瓶颈。而人工智能为工业带来的第一个革命性的改变,就是摆脱人类认知和知识边界的限制,为决策支持和协同优化提供可量化依据。
现阶段,工业智能的应用尚处于探索阶段,结合工业领域的特性,在实施阶段需要着重考虑以下几点:
一.问题的定义
在应用人工智能方法解决工业问题时,首先要确定需要解决的问题,一定要避免“拿着锤子找钉子”的情况,不能为了使用算法而徒增问题的复杂度。首先需要将实际问题抽象成可用建模方法解决的问题,需要人员的经验辅助。微软亚洲研究院郑宇博士也强调“培养一个真正的数据科学家需要七到十年时间”。这里的时间其实是对个人基本功以及实战经验的非强制指标。
二. 问题的边界
工业问题与围棋问题不同,其解决问题的边界定义不明确,没有明确的规则。这样就为解决方案的设计带来了很大的不确定性。一切模型可以解决的问题都是在前提条件所包含的问题域内,没有一个方案是可以涵盖所有的情况,所以在制定工业智能方案时一定要紧密结合业务来定义问题边界,最终确定解决方案。
工业智能,在智能化算法和技术层面也拥有自身的特点和挑战:
一. 机理模型是关键基础
工业智能所要解决的问题大都是针对特定设备的特定问题,其数据表征应该符合设备运行的机理。在大量杂乱的数据当中,依照设备运行机理可以帮助选择、构建出更加有用的变量,为决策支持提供有效依据。特征工程,非监督式学习很大一部分研究工作就是针对如何从海量数据提取有效特征。基于机理的特征提取方法在传统的故障诊断上应用广泛,例如轴承故障诊断中所用到的失效频率。在大数据分析,人工智能冲击传统行业的同时,传统行业的分析方法也在人工智能领域得到应用,在2017年的AAAI荣获outstandingpaper
award的文章“Label-Free Supervision of NeuralNetworks with Physics and
Domain Knowledge”就是将机理模型加入神经元网络的训练当中得到优化的网络模型。
二. 数据的标准和技术仍有待发展
在工业领域,数据资源是发展智能化的一大障碍。众所周知,在图像识别领域有ImageNet,手写识别有MNIST,UCI的机器学习数据库也提供了大量标准,有标注的训练数据组。在工业领域,数据获取需要投入较大资金和时间,同时数据的标注需要专家知识协助,更增加了获取大量标准数据组的难度。除此之外,受限于传感器技术,设备使用状态等,经常会出现关键数据无法获取的情况。上述条件就导致在模型开发时,经常会遇到样本量小,不平衡数据组,数据质量差,数据不完整,缺少失效状态数据等问题。所以,IoT、迁移学习、增强学习、半监督式学习的研究对于工业智能技术的发展至关重要。
三. 一体化解决方案 - 从“产品”到“能力”的全方位交付
在解决方案的设计上,工业智能是多层次,高准确度的解决方案,有时还需要实时计算与回馈。这样的特点就要求所训练和部署的模型计算速度快,结果准确,不确定性小。因此,需要有能够灵活重构的工业数据应用模块,以快速开发解决工业系统中碎片化问题的应用。同时可以看出,工业智能的解决方案不是仅仅依赖于智能算法,整个链条上的每一环节的共同进步才可以保证技术的进步。那么,可以通过可视化的编程环境降低数据分析和应用开发的门槛,以及通过培训,是企业的工程师可以根据自己的经验和需求开发个性化的预测和分析应用,来保证持续地解决企业在发展过程中遇到的问题。
中国特色工业智能之路
我国工业智能化起步较晚,工业基础相对落后,但是我们是设备使用大国,设备保有量和设备使用数据保有量都是当之无愧的世界第一。结合设备、业务场景和智能算法,依靠成熟的CPS理论框架,相信我国一定会在工业智能引领世界发展。