赞
踩
前言:本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。
如下图所示,在AIGC生成阶段,有4种溯源场景:
1)生成模型溯源训练数据
2)微调模型溯源预训练模型
3)AIGC溯源训练数据/训练概念
4)AIGC溯源生成模型
下面分别对不同溯源场景下的相关工作进行介绍。
Scenario: 生成模型溯源训练数据
RQ1:模型的训练数据为 real data / fake data?
RQ2:若模型的训练数据为 fake data,则由哪个 GAN 生成?
目标:判断 target model 的训练数据来源
核心思想:
Real dataset 分成:training data, probing dataset,testing data.
若为溯源问题,则对于步骤3:
Scenario: 微调模型溯源预训练模型
Code: https://github.com/IBM/model-attribution-in-machine-learning
核心思想:通过联合微调模型与预训练模型生成结果与提示词的特征,训练分类器,采用集成学习的方式确定微调模型对应的预训练模型。
Page: https://github.com/peterwang512/GenDataAttribution
Scenario: AIGC 溯源训练数据
核心思想:首先构建具有对应关系的溯源数据集,然后使用对比学习的方式,优化特征提取器。
特征提取器训练的目标是:使得具有对应关系的合成图像+范本图像距离更近,而无对应关系的合成图像+范本图像距离更远。具体使用对比学习损失来进行训练。
Scenario: AIGC 溯源训练概念(概念水印)
核心思想:使用水印嵌入的方式,实现概念水印的嵌入和提取。
Scenario: AIGC 溯源生成模型
核心思想:训练二/多分类器,溯源生成模型。
(1)Image-Only: image 特征提取,后训练(ResNet-18)
(2)Hybrid: image 和 prompt 的特征联合提取拼接,后训练(CLIP+MLP)
参考文献
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。