程荣健,方毅翔,赵怡,张天助,李俊,王俊祥
(景德镇陶瓷大学 机械电子工程学院,江西 景德镇 333403)
摘 要:现代瓷砖生产过程可被看作是一个复杂的系统,其中一些调控行为会影响瓷砖最终的产品质量。传统瓷砖生产过程的工艺参数通常是通过多次实验确定的,这些实验一般基于工程师的经验行为。然而,经验行为往往难以准确确定工艺参数,同时最优工艺参数会随着实际工况(例如外部氛围)进行动态变化。在瓷砖产线中多变的工况影响下,很难保证产品质量的稳定性。为了解决经验主导的人工调控问题,并实现实际过程(工况)中的参数动态更新,首次提出了一种基于深度强化学习(DRL)算法的瓷砖产线智能调控框架。所构建的框架包含环境(Environment)模块和智能体(Agent)模块。其中,环境模块基于数据挖掘技术来模拟、更新瓷砖产线中的各种工况,并通过随机森林(RF)预测模型及时预测相应的产品质量。智能体调控模块能够根据预测的产品质量快速自适应调整工艺参数,使瓷砖产品达到预期产品质量。实验结果表明,该方法构建的预测模型准确性相较于其他同类方法的产品质量预测模型性能更好,平均提高率为2%。同时,经过多次迭代后,瓷砖产线智能调控算法可以将生产工艺参数合格提高到95%,具有较好的调控效果。
关键词:深度强化学习;瓷砖生产;工艺参数;森林随机