研究人员开发神经网络 可读取食谱并生成熟食产品的图像
导读:来自特拉维夫大学的一组研究人员开发了一种神经网络,能够读取食谱并生成烹饪完成后的熟食产品的图像。
来自特拉维夫大学的一组研究人员开发了一种神经网络,能够读取食谱并生成烹饪完成后的熟食产品的图像。嗯,好像可以更换人头拍色情片的DeepFakes还不够糟糕,现在我们无法确定我们在网上看到的美味食物都是否是真实的了。由研究人员Ori Bar El,Ori Licht和Netanel Yosephian组成的特拉维夫团队使用名为StackGAN V2的生成对抗网络(GAN)的修改版本和巨大的recipe1M数据集中的52K图像/配方组合创建了他们的AI。
该团队开发了一种人工智能,只需要列出任何配方和说明清单,就可以运算成品食品的样子。
这一切都是一名研究人员在向祖母询问她传统的番茄酱炸鱼排配方时开始的。由于她年事已高,她不记得确切的食谱,所以吃货科学家就建立了一个能够给出食物图像的系统,方便输出食谱。由于人们很难从饭菜中获得具有实际数量和“隐藏”成分的精确配方,如盐,胡椒,黄油,面粉等。因此基于配方生成食物图像就成了有用的做法,这项任务对于人类来说非常具有挑战性,对于计算机更是如此。
由于目前大多数人工智能系统都试图在人类易于完成的任务中取代人类专家,解决一项甚至超出人类能力的任务会很有趣。
值得一提的是,与CUB和Oxford102数据集中的图像相比,recipe1M数据集中的图像质量较低。这反映在许多模糊的图像上,光照条件差,“粥状图像”以及图像不是方形(这使得训练模型变得困难)。这个事实可能会解释这两个模型成功生成“类似粥”的食物图像(例如面食,米饭,汤,沙拉),但却难以生成具有独特形状的食物图像(例如汉堡包,鸡肉,饮料) )。
如果有足够的配方,特拉维夫团队的人工智能现在可以将它变成一个看起来足够好的图像,根据研究论文显示,在盲测中,人类有时更喜欢计算机生成的图片而不是真实照片。
该团队打算继续开发该系统,希望扩展到超越食物的领域。包括完善当前的数据集质量,还考虑构建一个包含儿童书籍文本和相应图像的数据集,这样就可以让计算机看文章画插画了。