试试TextLogoLayout生成自己的logo_aesthetic text logo sythesis via content-aware lay

作者：IT小白 | 2024-03-24 05:15:02

踩

aesthetic text logo sythesis via content-aware layout inferring

文本徽标布局

这是论文的官方 Pytorch 实现：

通过内容感知布局推断的审美文本标志合成。2022 年简历。

论文：arxiv 补充：链接

演示

我们的模型将字形图像及其相应的文本作为输入，并自动为它们合成美学布局。

英文结果：

中文结果：

数据集

TextLogo3K 数据集

我们通过从中国领先的在线视频平台之一腾讯视频收集数据，构建了一个名为 TextLogo3K 的文本标识数据集。该数据集包含 3,470 个从电影、电视剧和漫画的海报/封面中提取的精心挑选的文本徽标图像。

我们为这些文本徽标中的每个字符手动注释边界框、像素级掩码和类别。

下载链接：Google Drive、PKU Disk（密码：1VEn）

请下载它，解压缩，并将文件夹'TextLogo3K'放在'./dataset/'下。

请注意，此数据集只能用于学术目的。

除了我们论文中解决的布局合成问题外，我们的数据集还可以用于许多任务，例如（1）文本检测/分割，（2）纹理转移，（3）艺术文本识别，和（4）艺术字体生成。

英文数据集

我们使用的英文数据集来自 TextSeg（Rethinking Text Segmentation: A Novel Dataset and A Text-Specific Refinement Approach, CVPR 2021）。请按照其主页中的说明请求数据集。

安装

要求

Python3.8
Pytorch 1.9.0（它可能在一些更低或更高版本上工作，但未经测试）

请使用Anaconda搭建环境：

conda create -n tll python=3.8
 source activate tll

按照说明安装 pytorch 。

其他

conda install tensorboardX scikit-image jieba

培训和测试

训练

训练我们的模型：

python train.py --experiment_name base_model

训练日志会写成./experiments/base_model/logs，可以通过 Tensorboard 可视化。检查点将保存在./experiments/base_model/checkpoints. 所有超参数都可以在中找到options.py。

我们的代码支持多GPU训练，如果你的单GPU内存不够用，check multi_gpuin options.pyisTrue并运行：

CUDA_VISIBLE_DEVICES=0,1,2...,n python train.py --experiment_name base_model

预训练模型

我们训练有素的检查点（在 epoch 600）可以在Google Drive和PKU Disk中找到。我们发现不同步骤的检查点可能会给出不同的样式，鼓励自己训练模型并测试更多检查点。

测试

在 TextLogo3K 测试数据集上测试我们的模型：

python test.py --experiment_name base_model --test_sample_times 10 --test_epoch 600

结果将保存在./experiments/base_model/results.

测试您自己的数据

（此功能正在开发中，将很快升级）用您自己的案例测试我们的模型：首先，从Chinese-Word-Vectors下载中文嵌入，即 sgns.baidubaike.bigram-char，放在'./数据集/嵌入”。

然后，从输入文本和字体文件生成数据：

python gen_data.py --input_text 你好世界 --ttf_path ./dataset/ttfs/FZShengSKSJW.TTF --output_dir ./dataset/YourDataSet/

最后，使用我们的模型来推断：

python test.py --experiment_name base_model --test_sample_times 10 --test_epoch 500 --data_name YourDataSet --mode test

结果将写入./experiments/base_model/results/500/YourDataSet/

致谢

引文

如果您使用此代码或发现我们的工作有帮助，请考虑引用我们的工作：


<span style="color:#24292f"><span style="background-color:#ffffff"><span style="background-color:var(--color-canvas-subtle)"><code>@inproceedings{wang2021aesthetic,
  title={Aesthetic Text Logo Synthesis via Content-aware Layout Inferring},
  author={Wang, Yizhi and Pu, Gu and Luo, Wenhan and Wang, Yexin ans Xiong, Pengfei and Kang, Hongwen and Wang, Zhonghao and Lian, Zhouhui},
  booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
  year={2022}
}</code></span></span></span>

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/IT小白/article/detail/300096