谷歌keras作者推荐:使用「风格迁移」合成高分辨率多尺度神经纹

  • Number of octaves (where 1 means "Consider only 1

    [--layers LAYERS [LAYERS ...]] [--max-iter MAX_ITER]

    我们使用简单的优化过程来合成我们的图像。其他研究已经表明,可以训练前馈神经网络来近似这种优化(Johnson等人于2016年提出),因此,用我们的多尺度目标来尝试这些方法是很有意思的。对于该网络的架构可能需要一些类似的多尺度方法,否则相同的感受野问题将适用于该前馈网络。

    [--if-shift IF_SHIFT] [--if-order IF_ORDER]

    Synthesize image from texture

    在75张照片中对格拉姆矩阵求平均值,图为秋天的多伦多Dundas 西街

    isbn = {978-1-4503-5406-6/17/11}

    --seed {random,symmetric}

    --source SOURCE [SOURCE ...], -s SOURCE [SOURCE ...]

    --max-iter MAX_ITER, -m MAX_ITER

    How to combine gram matrices when multiple sources

    Pixel height of generated image. If not specified,

    [--count COUNT] [--mul MUL] [--if-weight IF_WEIGHT]

    What boundary condition to use for convolutions

    url = {},

    配置

    year = {2017},

    KERAS_BACKEND=tensorflow python3 synthesize.py -s bark.jpg

    当源图像具有高分辨率,或包含多个有趣特征的尺度时,它始终执行Gatys技术。

    更多信息在研究页面()。

    Prefix to append to output directory (default: out)

    最直接有用的标志:

    论文简介

    --output-width OUTPUT_WIDTH, -ow OUTPUT_WIDTH

    Maximum iterations for the L-BFGS-B optimizer

    --layers LAYERS [LAYERS ...], -l LAYERS [LAYERS ...]

    Save an in-progress optimization image every

    floyd init subjective-functions

    --if-weight IF_WEIGHT

    --tol TOL Gradient scale at which to terminate optimization

    --save-every SAVE_EVERY, -n SAVE_EVERY

    2.0)

    [--output-dir OUTPUT_DIR] [--tol TOL] --source SOURCE

    然而,只有当图像中语义显著的特征处于一个适用网路的正确尺度时,这种方法才会奏效,而且在实际应用中,通用CNN架构中间层的特征接受域相对较小[Luo等人于2016年提出]。由Gatys等人使用的来自Simonyan和Zisserman [2014]的流行VGG架构是在224×224像素的图片上进行训练的,其中它的相关特征会相当小。

    [--source-scale SOURCE_SCALE]

    由格拉姆矩阵表示的这些中间层间的特征映射之间的相关性,被证明是纹理表示的一种强有力方法。通过合成一个新的图像,其格拉姆矩阵接近于样本图像(例如通过梯度下降得到),我们可以得到具有相似纹理的图像。

    7])

    来自高分辨率来源Halei Laihaweadu的纹理合成算法的演示

    论文概述

    在GPU上快速运行,如果你有一个FloydHub的帐户;

    [SOURCE ...]

    --octaves OCTAVES, -o OCTAVES

    点击链接获取更多样本图片(包含多项分辨率)

    如果你正在进行神经文理合成(texture synthesis)的相关工作,那么你可以使用多尺度高斯金字塔表示法(multi-scale Gaussian pyramid representation),这样的话一切事情就会变得更加美好了!

    在撰写本文时,输出:

    source-scale (default: None)

    Which layers to match gram matrices on (default: [2,

    location = {Bangkok},

    --data-dir DATA_DIR, -d DATA_DIR

    publisher = {ACM},

    代码实现

    pip3 install -r requirements.txt

    --output-width, --output-height, output dimensions in pixels

    我们表明,与其在CNN的多层匹配统计属性,不如跨越多个高斯金字塔的尺度匹配少量网络层以获得更好的结果,这导致了高质量合成的高分辨率纹理。

    List of file to use as source textures (default: None)

    --mul MUL Multiply target grams by this amount (default: 1.0)

    --join-mode {average,max}, -j {average,max}

    自然延伸将尝试多尺度风格转移(Gatys等人2015a),随后使用我们的目标函数来代表“风格损失(style loss)”。

    (default: 1e-09)

    研究结果证明,将这两种想法结合起来用以构建高分辨率图像的方法既简单又强大。我们想要最小化的损失函数的框图如下所示:

    这段代码希望有一天会有所改进。

    对平铺图像和烟雾图像中的格拉姆矩阵进行组合

    --source-width SOURCE_WIDTH, -sw SOURCE_WIDTH

    在传统的纹理合成领域中,这个问题已经用高斯金字塔(Gaussian pyramid)多尺度图像表示的概念得以解决。

    安装要求

    -h, --help show this help message and exit

    equal to output-width. (default: None)

    最近,在训练一个卷积神经网络进行图像分类中,烈焰公益服,通过充分利用中间表示(intermediate representations)的优势(Gatys等人于2015年提出),基于样本的纹理合成技术在质量上有了很大的提升。

    How to seed the optimization (default: random)

    [--source-width SOURCE_WIDTH]

  • 共2页:
  • 上一页
  • 1
  • 2
  • 下一页