人工智能 是引领新一轮科技革命和产业变革的战略性技术,具有溢出带动效应很强的“头雁”作用。在十四届全国人大二次会议上,开展“人工智能 ”专项行动被首次写入《政府工作报告》,这为人工智能赋能新型工业化提供了深刻的理论支撑。当前,人工智能飞速发展,大语言模型(以下简称“大模型”)凭借强大的文本推理和迁移学习能力已成为人工智能发展新的里程碑,有望下沉到研发、生产、运维、测试等制造业各环节,实现对新型工业化的高效有力支撑和赋能。
作者: 中国工业互联网研究院 王骁 顾维玺 吴文昊(通讯作者)
工业大模型是人工智能深度赋能新型工业化的重点方向
随着高质量训练数据的不断扩充、高性能计算技术的发展以及模型训练架构的更新迭代,大模型在自然语言处理、图像识别、语音识别和多模态识别领域接连取得重要突破。自2022年以来,全球范围内大模型市场规模迅速增长,迎来爆发期。根据相关机构测算,到2030年全球大模型市场规模将突破千亿美元。因此,国内外龙头企业成为了大模型高地争夺的主角。以美国为代表的国际科技巨头纷纷加入大模型竞赛,OpenAI(美国开放人工智能研究中心)作为业界领先机构发布大模型ChatGPT(基于生成式人工智能预训练模型的聊天机器人)和GPT-4、文生视频大模型Sora;微软将GPT-4相关能力整合入Windows 11系统、Office365、Bing(必应)等重点产品,形成Copilot系列应用;谷歌推出新一代多模态大模型Gemini;Meta发布LLaMA(基于人工智能的大型语言模型);Anthropic发布Claude 3系列大模型。国内大型科技企业亦相继加入大模型角逐,“文心一言”、“通义千问”、“星火认知”、ChatGLM(基于通用语言模型的聊天机器人)等国产大模型经过迭代更新,也实现了性能飞越。
然而,目前国内外推出的主流大模型仍为公共数据集训练出的基础大模型,知识面够广但不够专,在工业各垂直领域的性能表现并不突出。根据中国工业互联网研究院2024年3月发布的《人工智能大模型工业应用准确性测评》报告,国内外主流大模型的工业应用准确性平均得分低于60分,处于明显领先位置的GPT-4、“文心一言”等大模型总体评分也仅在70分上下,可见基础大模型在赋能新型工业化方面还有较大的提升空间。
面向智能制造新需求,以基础大模型为技术底座、工业应用为切入点的工业大模型正成为人工智能深度赋能新型工业化的新方向。工业大模型依托基础大模型的结构和知识,融合工业细分行业的数据和专家经验,形成垂直化、场景化、专业化的工业应用模型。相对于基础大模型,工业大模型具有参数量少、专业度高、落地性强等优势,可以为工业垂直领域的技术突破、产品创新、生产变革等提供低成本解决方案。
工业大模型深度赋能新型工业化的三大方向
一是工业大模型推动生产制造高效化发展,大幅缩短生产周期。
大模型可以依托自身强大的知识储备和推理能力,代替传统生产中大量重复性、机械性的劳动,从而大幅缩短生产周期,使生产效率产生质的飞跃。
在研发环节,大模型可以通过对产品结构数据进行分析,从微观层面探究产品的构型和机理,并创造性地生成具有新结构、新特性的产品。例如在石化行业,人工智能大模型可以在对大量已知材料的分子数据进行训练的基础上,找到适合目标场景的最优候选材料,并生成适合的催化剂分子设计方案,从而大大缩短催化剂研发时间,降低催化剂研发成本。在药物研发的核心环节——靶点发现环节,需要对靶点做大量的生物学假设,并设计一系列实验进行验证,周期非常漫长。用药物分子结构数据和与疾病相关的知识图谱对大模型进行微调训练,使模型掌握与疾病靶点相互作用的分子特征,从而可以自动生成新的药物分子设计方案。
在设计环节,大模型可以生成创新性的产品设计方案,更好地辅助技术人员将设计构思和意图快速转化为具体实施方案。以传统工业设计为例,大模型可以嵌入在CAD软件的后端,实现设计草图的快速生成,并辅助进行布局优化、参数校核,大幅缩减工业设计耗时,提升产品研发效率。例如,国内某头部家电制造企业目前已探索基于自研工业大模型的工业信息生成系统,根据用户需求交互,进行产品工程图等可视化文件的辅助生成,后续可利用文生视频大模型实现标准三维产品模型的快速制作及动态仿真,提升产线的智能化水平和研发设计的效率。
在工艺优化环节,传统方法需要采用不同的工艺参数组合进行多轮次测试,以获得最佳结果,而这需要花费大量时间进行人工调试和实验。大模型可以利用历史工艺数据进行微调训练,结合新的工艺参数组合,在碰撞测试中快速预测出碰撞响应情况。这有助于在短时间内缩小最佳工艺参数的筛选范围,以缩短测试优化周期。
二是工业大模型将有效降低生产制造的成本消耗,推进制造业绿色化、集约化发展。
在产品仿真环节,大模型可以利用自身的生成能力提供符合设计要求的虚拟化仿真测试场景/环境。近期OpenAI推出的文生视频大模型Sora已经展示出模拟真实世界物理环境的能力,并能实现符合简单物理规则的人-物、物-物互动,后续有望通过文字提示,快速构建工业级三维仿真场景和产品设计模型,辅助进行工业设计、测试等,实现对生产过程的真实模拟,从而大幅减少传统工业设计中因构建三维虚拟环境所消耗的人工和计算资源。
例如在汽车制造中必不可少的碰撞测试环节,通过引入前期积累的车辆结构、碰撞数据以及材料特性等数据并进行微调训练,大模型可以了解车辆结构、材料属性与碰撞响应程度之间的内在关系,并模拟生成特殊场景中的碰撞情况,减少传统生产中因构建此类测试环境而花费的大量人力、物力成本。
在生产调度环节,大模型可以对产线的关键节点进行智能化调度和控制,以减少因流程冗余而导致的物料消耗。生产方可以利用产线流程的历史数据对大模型进行微调,使其更好地理解生产需求、资源可用性、任务优先级之间的复杂关系,从而优化各节点的任务分配和调度,减少物料和能源的消耗。
例如在大型制造产线的多机协同中,大模型可以利用不同工序机器人的生产流程数据进行微调训练,掌握机器人的技能、任务复杂性、工作站之间的转移时间等复杂信息,并预测不同机器人执行不同任务的效率。当新的任务或物料到达时,模型可以快速决策分配给哪个机器人,从而减少因机器人闲置、物料冗余配送所带来的成本消耗。同时,大模型自身就可以对不同格式、不同来源的数据进行快速整理分类,辅助制作微调训练的数据集,降低人工整理数据的成本,实现数据和模型的良性互动。
三是工业大模型推动生产制造柔性化发展,实现解决方案在不同场景中的快速适配。
在质量检测环节,大模型强大的迁移学习能力可以助力实现对不同生产场景中产品质量缺陷、人员违规操作、零部件装配误差等的快速高效视觉检测。
例如在印刷电路板的缺陷检测中,通用视觉大模型可以凭借强泛化能力,在不依赖工厂样本数据和本地化训练的情况下,直接对原始图像进行像素级分割,再配合简单的规则,实现对短路、焊桥、开路等瑕疵的识别,从而规避本地化训练调参带来的数据获取难、训练调参慢等问题,并可快速适配到不同批次、不同型号的其他电路板检测中,实现柔性生产。同时,技术人员可以通过语言提示细化检测需求,实现对同一块电路板不同类型、不同区域、不同等级缺陷的检测,扩展检测范围,提升应用灵活性,实现定制化检测。
在运动控制环节,生产人员可以通过文本、语音等交互方式,根据不同的任务需求,通过大模型快速生成定制化的运动控制代码,以控制机器人执行不同的任务。例如,在大型结构件的装配中,给大模型输入指令“请写一段PLC程序,控制机械手抓取零件A,并通过最短路径放置在零件B的上表面”。这种基于大模型的运动控制指令生成模式可以大幅提升工业机器人的灵活度,实现柔性化的产线控制。
在供应链管理环节,可以利用大模型对供应链中各类别、各模态的数据进行管理和整合,提升货品信息流的运行效率,打造更便捷、响应更快速的工业产品供应链体系。例如在仓储管理中,使用以多模态大模型为“大脑”的机器人进行货架管理、库存管理和订单拣货等操作,通过人工进行简单的场景需求提示,结合模型的强视觉泛化能力,可以由同一机器人执行自主货架定位、货物分拣和货物转运等操作,并能根据提示词快速应用到不同类型的货仓中,提升仓储管理的柔性化程度。
工业大模型深度赋能新型工业化的发展建议
当前,受制于计算资源、工业数据、模型可解释性等因素,我国对工业大模型的探索还处于初期阶段,深度赋能新型工业化还有较大发展空间。在工业大模型的应用推广中,主要面临三个突出问题:一是缺乏高质量的工业语料数据为大模型的微调训练提供支撑;二是工业需求方与基础大模型技术支持方难以深入场景形成有效合作,缺乏具备明显成效的工业大模型应用范式;三是缺少工业大模型的应用性能、测试评估等机制。针对上述问题,建议从以下三方面进行突破。
一是构建大模型工业数据集供给体系。鼓励信息技术龙头企业、工业企业、高等院校、科研院所及其他具备相关研究基础的机构,构建工业语料库公共平台,聚焦重点行业的典型场景,沉淀高质量工业语料数据,为工业大模型供给必要数据。通过资金补贴、税费减免、政策倾斜等措施,引导钢铁、电子装备、电力和石油化工等重点工业行业的市场主体,将工业场景数据开放至公共平台,形成涵盖国内重点工业领域的数据资源池。
二是加强大模型工业应用的生态推广。整合碎片化的工业场景,提炼出以产品辅助设计、精细化质量检测、智能供应链管理等为代表的大模型工业应用典型场景,明确各场景对大模型的量化需求指标,并推动建立相关行业标准。建立大模型供给侧与企业应用侧之间的供需对接机制,促进形成若干大模型研发与制造业协同发展的特色产业集群、企业联合体,并推动树立一批工业大模型的标杆性、示范性应用。
三是完善大模型工业应用的评测机制。在模型侧,建立标准化的大模型工业应用问题测试集,构建高效可信的评测体系,围绕大模型知识能力、稳定性、安全性等关键性能进行周期性评估工作;在企业侧,制定工业大模型应用渗透度等指标体系,辅助进行大模型应用实施情况的评估诊断。根据产业结构、数据要素分布的变化对评测评估指标进行动态调整,以促进工业大模型持续赋能新型工业化。