但问题在于,从无到有创造一个东西需要想象力,而这正是人工智能技术一直难以实现的能力。
直到 2014 年,当时还是蒙特利尔大学博士生的 Ian Goodfellow 在酒吧里与友人进行学术辩论时,他突然想到了这个问题的答案。这种名为“对抗式生成网络”(GAN)的手段会使用两个神经网络(一种简化人脑数学模型,是现代机器学习基石),然后让这两者在数字版的“猫捉老鼠”游戏中相互拼杀。
这两个网络会使用同一个数据集进行训练。其中一个神经网络叫生成网络,它的任务就是依照所见过的图片来生成新的图片,比如一个多长一条手臂的行人。而另外那个神经网络叫判别网络,它的任务则是判断它所见得图片是否与训练时的图片相似,还是由生成模型创造出来的“假货”,比如,判断那个长着三个手臂的人有没有可能是真的?
慢慢的,生成网络创造图片的能力会强到无法被判别网络识破的程度。基本上,经过训练之后,生成网络学会了识别并创造看起来十分真实的行人图片。打印机自动打印
这项技术已经成为了在过去十年最具潜力的人工智能突破,帮助机器产生甚至可以欺骗人类的成果。
目前,GAN 已被用于创造听起来十分真实的语音,以及非常逼真的假图片。就拿一个很有名的例子来说,来自芯片公司英伟达的研究人员们用明星照片训练出了一个 GAN 系统,而这个系统则生成了数百张根本不存在、但看起来十分真实的人脸照片。另外一个研究团队则生成了看起来十分逼真的梵高油画。在进一步训练后,GAN 可以对图片进行各种修改,比如在干净的马路上盖上一层雪,或者把马变成斑马。
但是 GAN 的成果并非完美:它们可能生成有两套把手的自行车,或者眉毛错位的脸。但由于有些图片与声音实在太逼真了,一些专家相信,GAN 在某种程度上已经开始理解它们所见到,所听到的世界的底层结构。而这意味着,随着人工智能开始获得想象力,它们也可能开始理解它在这世界上所看到的东西。
Ian Goodfellow发明出GAN后,获得Facebook首席科学家Yann LeCun、NVIDIA创办人黄仁勋、Landing.ai创办人吴恩达等大牛的赞赏,吸引了诸多的机构及企业开始研究。在中国部分,学术机构致力于研究GAN理论的近一步改良及优化,像是中科院自动化所研究人员受人类视觉识别过程启发,提出了双路径GAN(TP-GAN),用于正面人脸图像合成,而商汤-香港中大联合实验室在国际学术大会上发表多项GAN相关研究成果。
中国企业界则是更倾向于把技术应用在服务中,相关案例不胜枚举,比如,百度使用GAN构建语音识别框架,科大讯飞通过GAN与传统深度学习框架的结合在语音合成领域获得了很大的进展。而阿里巴巴的城市大脑项目团队在ACM MM2017会议上,其中发表的一篇论文便是使用GAN来生成用以进行车牌识别的训练数据集。
解读:
商汤—香港中文大学联合实验室教授李鸿升:GAN 未来可能对计算机图形学产生冲击,发展三年多的 GAN,在已经发展了 60 年的人工智能领域中,虽然还是很新的技术,不过已经有各种变体或进阶版出现,而且在诸多研究人员及企业的投入下未来仍有许多的可能性。例如有机会从二维的图片进展到三维的视频等等,在更远的将来,有可能会对图形学产生冲击或挑战。
给所有人的人工智能
入选理由:将机器学习工具搬上云端,将有助于人工智能更广泛的传播
技术突破:基于云端的人工智能正在降低这项技术的使用难度和价格
重大意义:目前,人工智能的应用是受到少数几家公司统治的。但其一旦与云技术相结合,那它将可以对许变得触手可及,从而实现经济的爆发式增长。
主要研究者包括:亚马逊、谷歌、微软、百度、腾讯、阿里巴巴、科大讯飞、第四范式等
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/ruanjian/article-87993-6.html
真的真的很爱你
桃子的演技好赞啊
这样吧
是1888年