都做了很多工作但依然是一种非常有损的生成方式信息从像素世界中获取时损失很大。 中间阶段有一个非常著名的工作那个时候有人第一次实现了实时化。 年一篇叫《神经算法的艺术风格》的论文由 领导发表。他们展示了将现实世界的照片转换为梵高风格的图片。 我们现在可能习以为常但那是在 年那篇论文突然出现在 v 上震惊了我。我感觉大脑中被注入了一种“生成 的病毒”。我心想:“天哪我需要理解这个算法玩一玩试着把自己的图片变成梵高风格。” 于是我花了一个长周末重新实现了这个算法让它能够正常运行。
其实它是一个非常简单的算法我的实现大概只有 行代码当时是用写的因为那时候还没有 h我们用的是 h。 不过尽管算法简单它的速度很慢。每生成一张图片你都需要运行优化循环耗费很多时间。生成的图片很漂亮但我就是 乌拉圭 whatsapp 数据 希望它能更快一点。最后我们确实让它变快了。 还有一点我非常自豪的是在生成 真正走向世界之前他在博士研究的最后一部分做了一个非常前沿的工作。这个项目是通过输入自然语言来生成完整的图像这可以说是最早的生成 工作之一。我们使用的是但当时它非常难用。问题是我们还没有准备好用自然语言来描述一幅完整的图像。 于是他采用了一个场景图结构输入方式输入内容是“羊群”、“草地”、“天空”等并用这种方式生成了一幅完整的图像。
从数据匹配到风格转换再到生成图像我们逐渐看到了一个完整的转变。你问这是否是一个巨大的变化对于像我们这样的人来说这是一个持续的过程但对于大众而言成果确实显得突然且具有冲击力。 我读了你的书真是一本很棒的书我强烈推荐大家去读。而且-我想说的是长期以来你的很多研究和方向都聚焦于空间智能、像素处理等领域。现在你在做的 W 也和空间智能相关。能谈谈这是你长期旅程的一部分吗?你为什么现在决定去做这个?这是否是某种技术突破或个人原因?你能否带我们从 研究的背景过渡到 W ? 对于我来说这既是个人的追求也是智力上的旅程。