当前位置:   article > 正文

制造业数据挖掘的一些思考(2023年)

制造业数据挖掘的一些思考(2023年)

        笔者在2023年入职宁波某插座龙头企业,岗位是数据挖掘工程师;在这里把近一年的工作感悟和各位分享一下。

        一、AI和制造业数字化。

        chatgpt将NLP技术真正的推向成了GDP创造工具,看似爆火其实是必然;chatgpt的关键技术-transformer其实不是个新玩意儿,它在NLP领域早已是顶流算法;openAI将NLP与RL算法结合并找到了一个落地且绝对广泛的场景,于是chatgpt诞生了。我在2021年的时候曾经考虑过是否转型做NLP,但是当时自身算法水平确实太差,连transformer的英文论文都无法真正理解,最后权衡后还是放弃。

        chatgpt等类似的AIGC技术,其实对制造业的数字化影响并不大,因为两者解决的问题并不完全相同。但是我发现很多方案服务商和制造业从业者将两者紧密结合(PPT里不加个AI或大模型都不好意思),我认为这是一个误区。AI技术想要在制造业真正发扬光大,仅凭AIGC技术是远远不够的。

        二、数据挖掘和制造业数字化。

        数据挖掘到底挖个啥,我在入行时,对这个问题也不太清楚。从我目前的工作经验来看,制造业的数据挖掘只有两个核心点: 1、预测  ;2、决策。

        典型的预测场景包括: 销售预测、出货预测、设备故障预测,产品质量预测等;

        典型的决策场景包括:生产调度、物流调度、安全库存设定、库存水位设定、工艺参数优化等;

        如果再简化的话,只有一个核心点:决策; 预测,最终也是为决策服务。

        如果读者有在制造业工作的经历,你一定会熟悉这么一些场景: 根据销售预算做销量预测(拍脑袋)、根据历史出货记录做备货预测(拍脑袋)、根据经验做调度(拍脑袋)、根据经验更改工艺参数(拍脑袋);基本上拍脑袋做决策贯穿于整个产品生产周期;更可怕的是如果最有经验的人离职了,连拍脑袋的人也没有了。

        基于以上痛点,数据挖掘工程师的作用是以算法+模型来辅助决策,当然前提是有一定量的数据(但是大部分企业连这一点也无法保证)。

        三、制造业数据挖掘难在哪

        制造业数据挖掘项目难以落地的原因大概有以下几个:

        1、业务人员不知道自己的痛点能用什么技术来解决,也就是说,一个公司压根就不知道他的拍脑袋问题可以用算法来解决,也就无法寻找相关资源解决。

        2、数据, 没有数据或缺失数据。 我的亲身感受是: 需要的数据找不到,不需要的数据一大堆。

        3、业务复杂, 随便挑一个问题出来,仔细研究都是非常复杂的问题,如果工程师对业务理解不深刻,无法给出合适的模型或方案。

        4、工程落地难,不管训练了一个多么好的模型,不可能让用户自己学Python调用模型,最后还是要封装成一个系统与用户做交互,那么就涉及到项目管理,不同编程语言融合,模型管理,数据管理,并发管理等等。

        四、前景

        虽然吐槽了这么多,但是仍有非常乐观的发现:

        1、绝大部分场景并不需要高深复杂的算法,甚至非常基础的算法就可以解决。比如在注塑机工艺参数优化课题中,我只用了一个简单的决策树+BP神经网络+遗传算法就使得试验机提升了1%的效率(不要小看1%,如果你有1000台注塑机,都提升1%,一年下来可以节省很多成本)。BP神经网络只有几千个参数就能非常好的拟合工艺参数与成型周期的函数;整个建模阶段比我设想的顺利很多,耗时最大其实的是数据清洗。

        2、万金油--遗传算法。  遗传算法、蚁群算法、粒子群算法、模拟退火算法等等类似的算法在绝大部分场景都能适用,且效果良好;但是如果想要更好效果,可能需要深度强化学习或之类的高阶算法。

        所以在制造业实现数据决策、数据智能其实并不难,找准一个场景且可复制,能够在短期就为企业带来效益。

总结: AI不代表数字化,但是数字化不能离开AI的思想,model for decide可能是制造业数字化转型的主要方式,希望我在新一年中能够成功落地几个项目,实实在在的为公司实现决策智能化。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/347600
推荐阅读
相关标签
  

闽ICP备14008679号