赞
踩
从2016年起,以深度学习为代表的机器学习大火,直到现在,算法工程师、数据科学家、机器学习工程师、数据工程师越来越成为市场上的香饽饽。或许你是他们中的一员,或许你想加入他们。你需要保持一种对AI领域新方向的敏锐感知,才不会一次次错过时代的发展时机。
他们早已脱离了一味追求实验室理想环境下的超高准确率、召回率、F1-score,而是寻求商业环境下的高质量、低风险的规模化部署,敏捷、标准化的交付流程,实现机器学习全生命周期的闭环。这样一套管理过程脱胎于软件工程项目管理DevOps,但难度远高于DevOps,它的名字就是MLOps。
1.DevOps的管理围绕代码展开,而MLOps需要对代码、数据、算法、模型等多种过程物和制品进行管理;
2.DevOps的代码优化迭代的变化过程相对平缓,而MLOps机器学习中的训练数据、推理数据是动态变化的,存在着潜在的数据漂移的问题,模型上线后会面临着降级退化的风险。
3.DevOps的团队成员是业务需求方、软件开发工程师、软件测试工程师,而MLOps涉及到的团队成员有业务需求方、数据工程师、数据科学家、机器学习工程师、模型评审团队,可能也会有IT相关的软件开发工程师、测试工程师、运维工程师,不同团队之间的流程和工具各异,跨团队沟通协调存在巨多的障碍。
无论你是机器学习相关的在校学生、从业者,还是企业中下游业务部门的同事,只要你所在的单位使用机器学习赋能业务,机器学习不是run一下而已,而是期待产生业务的增长点和新价值,你都应该了解这一套机器学习全生命周期的管理体系和文化理念。在工作中,笔者发现,从2021年底到2022年上半年,越来越多的AI团队的项目经理甚至组织的管理者开始关注MLOps,希望通过MLOps提高机器学习项目的研发效能,用尽可能少的人力、财力、管理成本来实现生产环境下模型的规范化、标准化、一体化的平稳流畅运行。
在未来三到五年,笔者预计,对MLOps方法论的理解掌握会成为机器学习入行者或转行面试的加分项。同时MLOps必将孕育着新的工作机会,未来可期!
ML、DevOps都是专业领域,而结合两者的MLOps更是高强度的专业,工程师需要具备数据分析、模型开发、测试、整合、部署、运维等知识。那么这个专栏的开设的目的,就是我对于MLOps的总结和思考会持续分享。这个专栏的第一阶段会围绕MLOps国内外大咖观点进行整理总结。
另推荐几本MLOps经典书籍,清单如下:
总结整理不易,记得一键三连(关注哦,欢迎一起交流探讨!)
通过本书,读者能理解MLOps的关键概念,有助于操作ML模型,并随着时间的推移优化模型。
此书是目前最完整的应用人工智慧书籍之一,内有大规模建构可靠机器学习解决方案的最佳实践和设计模式。
许多分析与ML模型并未进入生产阶段,而此书解说导入ML的四步骤:建构、管理、部署/整合、监控,帮助读者导入ML模型。
此书分为四大部分,分别为如何规划ML应用,如何建立ML模型,如何改进模型,以及部署与监控策略,协助读者打造ML驱动的应用程序。
通过本书,读者能学习如何使用TensorFlow生态系,实现机器学习管道自动化。
这本书带读者了解什么是MLOps,以及它与DevOps的差别,并解释如何操作ML模型,是MLOps工具与方法的入门书。
本书涵盖MLFlow以及将MLOps整合到现有代码中的方法,以追踪指标、参数、图形和模型。
本书介绍数据科学–ML–AI项目的生命周期,涵盖ML模型的建构,AI项目生命周期的监测等。
本书提供真实的案例,分享深入的MLOps知识,以帮助读者写程序,训练强健和可扩展的ML模型,并建构ML管道,用以训练并部署模型。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。