java使用python模型_PMML，JAVA调用Python算法模型

作者：IT小白 | 2024-08-04 23:48:19

踩

java怎么调用建模的结果

公司大部分应用的使用的是JAVA开发，要想使用Python模型非常困难，网上搜索了下，可以先将生成的模型转换为PMML文件后即可在JAVA中直接调用。

PMML简介

模型预测标记语言(Predictive Model Markup Language)是由Dr. Robert Lee Grossman 提出的一种基于XML的存储模型的格式标准。这里的模型是指那些由数据挖掘和机器学习算法生成的预测模型。PMML为不同的数据分析软件或者编程语言，提供了一种轻松共享预测分析模型的方式。它支持常见的模型，比如逻辑回归和前馈神经网络等。

PMML是一套与平台和环境无关的模型表示语言，是目前表示机器学习模型的实际标准。从2001年发布的PMML1.1，到2019年最新4.4，PMML标准已经由最初的6个模型扩展到了17个模型，并且提供了挖掘模型(Mining Model)来组合多模型。作为一个开放的成熟标准，PMML由数据挖掘组织DMG(Data Mining Group)开发和维护，经过十几年的发展，得到了广泛的应用，有超过30家厂商和开源项目(包括SAS，IBM SPSS，KNIME，RapidMiner等主流厂商)在它们的数据挖掘分析产品中支持并应用PMML。

PMML的作用

一个机器学习的上线过程，主要包括：分析、特征工程、模型训练、调优、上线。其中，PMML的便捷性，主要体现在模型上线的过程中。

模型上线是将训练好的模型有效地应用于生产环境的过程。一般而言，生产环境和数据分析人员所使用的环境差距巨大。

例如，线上DMP是基于Hadoop的，计算框架用的Spark + MR。线下人员建模主要使用的是R、Python 中的sklearn库以及部分使用keras。如果没有PMML，因为不同的系统采用不同的方式呈现其计算，模型上线时就必须经历一个漫长的、容易出现错误和误呈现的翻译过程。此外，还需要对模型结构了解非常深入的工程人员。比如，将R中的LR迁移至Java中，就需要工程人员根据训练好模型的参数，裸写一个JAVA类。

以最简单的LR为例，就是一个数据表示权重向量，权重向量和参数向量相乘之后求一次激活函数。但复杂一点的模型，就要求对模型结构了解非常深入的工程人员，严格按照模型的计算逻辑，来编写该类。

有了PMML，就可以从应用程序A到B再到C轻松共享模型，并且在训练完成之后，迅速将模型上线(只需替换模型文件即可)。现在的实践就是，线下分析人员，使用R等训练好一版的模型之后，导出为PMML，在线上只需替换该PMML文件即可。

PMML 包含数据预处理和数据后处理(即模型预测结果的处理)和

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/IT小白/article/detail/930000