研究人员尝试用稳定扩散方法压缩图像 结果竟然优于JPEG

来源:cnBeta.COM #压缩图像#
1.3w

上周,瑞士软件工程师 Matthias Bühlmann 发现 —— 流行的图像合成模型“Stable Diffusion”,可实现较现有的 JPEG 或 WebP 格式更高的位图图像压缩比、且视觉伪影也更少。即便如此,Stable Diffusion 也不是那么完美。作为一种 AI 图像合成模型,其通常根据文本描述(所谓的“提示”)而生成图像。

AI 模型通过研究从互联网上提取的数百万张图像来学习这种能力,在训练过程中,模型在图像和相关词之间建立了统计关联。

然后对每张图像的关键信息添加更小的“表示”和赋予“权重”,后者代表了 AI 图像模型所掌握的数学值。

当稳定扩散分析、并将图像“压缩”为权重形式时,它们就处在了所谓的“潜在空间”中 —— 它们以一种模糊潜力的形式存在,且能够在解码时于图像中复现。

这项研究中用到的 Stable Diffusion 1.4,其权重文件大小约为 4GB —— 代表了该 AI 模型掌握的数亿张图像的知识。


责编: 爱集微
来源:cnBeta.COM #压缩图像#
THE END
关闭
加载

PDF 加载中...