当前位置:首页 > 健康科普

背后的AI系统被命名为SketchRNN【威尼斯正规官网】
本文摘要:Eck是蒙特利尔大学(被视为人工智能的温床)的教授,也在谷歌工作。但是,被拒绝画猪车的话,可能会直观地混合两者的明显特征,画笔看起来不知道,但是这个混合的产物只是利用人工智能系统SketchRNN输入的成果有点相似。

今年4月,谷歌发售了AutoDraw的绘图功能,让AI协助人类绘画,只需几笔就能制作出艺术家级的线画。这种有趣的AI应用于兴奋行业。从现在流入的成果来看,AI的笔画还不为人所知,但这不妨碍谷歌对背后的AI系统向大众展开高调的科学普及。

例如,发表了科学普及偏向的Paper等。背后的AI系统被命名为SketchRNN,是谷歌新设立的Magenta项目的一部分,测试AI能否用于艺术。为了更好地理解这个项目及其背后的故事,theatlantic大西洋杂志访问了Magenta项目的负责人Dougeck。编译了采访内容。

Eck是蒙特利尔大学(被视为人工智能的温床)的教授,也在谷歌工作。他以前管理谷歌Music,现在从谷歌Brian工作。2000年在印第安纳大学取得计算机科学学士学位后,Eck在音乐和机械学习方面有着非常丰富的就业经验。

谷歌

关于SketchRNNN这个AI系统,如果想更有形象地解读的话,从以下3幅画来看,人类被拒绝画小猪和卡车的话,可能会变成这样的画风。但是,被拒绝画猪车的话,可能会直观地混合两者的明显特征,画笔看起来不知道,但是这个混合的产物只是利用人工智能系统SketchRNN输入的成果有点相似。正如Eck和他在谷歌的合作伙伴DavidHa的说明一样,SketchRNN的工作原理可以解读为以类似人类的方式总结抽象概念。

以前的例子是谷歌想制作画猪的机器,但是制作的机器可以识别和描绘猪的概念和特征。一言以蔽之,人类在画一个物体时,不会在大脑中储存这个物体的概念和明显特征,而是让如何画和储存特征之间产生联系。

SketchRNN的意义是让机器学习人类的综合能力。因此,谷歌命名为Quick,Draw的游戏,人类玩游戏一样,谷歌为这个游戏制作了很多人工图形数据库。训练资料包括7斧5种,猫头鹰、蚊子、花园和斧头,各资料包括最少7斧的个别例子。

依赖Quick,Draw!获得的绘画数据,谷歌开发了SketchRNN。当人类在草绘时,丰富多彩的喧闹世界不能传输到铅笔的几条线上。

这些非常简单的笔画是SketchRNN的数据集。每种物体的绘画,如猫、瑜伽姿势、雨等,可以用于谷歌的TensorFlow开源平台软件库,训练某种类型的神经网络。

当机器以梵高或完整的DeepDream风格呈现照片时,人类总是觉得有点奇怪,因为机器对物体的概念或明显特征不能融合,或者没有痕迹。这些项目可以以谜题和主观的方式感受到人类,但有趣的是,对现实世界的感觉接近人类,但不完全相同。但是,SketchRNN的输入结果并不奇怪。

Eck说:我想说那个方法是非常人类的,但是感觉比像素分解的照片要多。这也是Eck领导人Magenta队的核心洞察力。人类理解世界的方式不同于像素,而是用抽象的概念来代替我们看到的东西,Eck和Ha在他们的论文中说明,从小就开始用绘画开发了我们看到的东西的能力。

素描

所以,如果人能做到这一点,谷歌相信机器能做到一定程度。去年,谷歌的CEOSundarPichai宣布了AIFirst的未来发展战略。对该公司来说,AI是其完整愿景的自然延伸,组织世界的信息,标准化简单。因此,谷歌以试图用于人工智能的方式组织信息,以便人们可以采访和使用这些信息。

但是,Magenta项目是谷歌在这个愿景下的尝试。机器学习是谷歌近年来常用的方式,其中特定的机器学习方式是基于人脑连接系统建模的神经网络。多层次的神经网络在解决问题时特别有效,特别是在翻译和图像识别方面。

谷歌已经在这些新框架上修复了许多核心服务。以谷歌翻译为例,已经建立了10年以上的简单系统,谷歌最后通过深度自学修复了9个月。

因此,在这种情况下,神经网络的用途和类型近年来构建了爆炸性的快速增长。基于神经网络,SketchRNN用于分解反复神经网络。

谷歌在论文中说明,这种类型的神经网络可以分解非常简单的物体素描,目的是训练可以绘画概念和总结抽象概念的机器,其思维方式与人类相似。叙述训练最简单的方法是以此为代码方式。输出数据(素描)后,该神经网络试图总结处理的数据中的概括规则。这些概括规则是数据模型,不存储在描述网络神经元特性的数学中。

这个过程被称为潜在空间和z(zed)。可以吸收猪、卡车、瑜伽姿势的特性等训练过程中学到的东西,z进行取样。

那么,SketchRNN能教什么呢?以下是拒绝接受消防车训练的网络神经分解新消防车的例子。该模型具有温度变量,研究人员可以降低或提高输入的随机性。

在以下图像中,稍微蓝色的回应温度低,稍微红色的回应温度高。或者你不想看更多的猫头鹰:或者最糟糕的例子——瑜伽姿势:从上述情况来看,SketchRNNN输入的结果已经与人类的风格非常相似,但它们本身并不是人类画的。或者,用可能画人的东西来修复。当然,有些修复非常好,有些修复不完全。

同时,SketchRNN也可以以人工图像的形式拒绝输出。当人类运送一些内容时,SketchRNN不会尝试理解它。以下是一个拒绝接受猫咪数据培训的模在这个三眼猫的图像中找不到什么变化?从上图可以看出,从左到右的各种输入中,第三只眼睛被移除。模特告诉我们,猫咪有三角形耳朵,胡子,圆脸,而且只有两只眼睛。

谷歌

当然,模特不知道耳朵是什么,脸是什么。对这些素描右图的世界一无所知。但而,它显然告诉人类如何描绘猫、猪或帆船。

Eck说:开始分解帆船图时,模型不会输出数百个其他模型的帆船。这些帆船可能来自这个图。这对我们来说是有意义的,因为模式早已从这些培训数据中分解出理想的帆船。

训练可以画雨点的网络,输出云素描,雨滴不会从输出模型的云中掉下来。那是因为很多人在画雨滴的时候,不会画云彩,也不会画掉落的雨。因此,如果神经网看到云,雨就不会落在这种形状的底部。(有趣的是,先画雨,模型就会产生云。

)这是一项有趣的工作,但在人类思维偏差项目中,这个项目有什么意义呢?Eck之所以对用笔感兴趣,是因为丰富,但包含的信息很少。画笑脸只有几幅笔画,甚至是像素集,但3岁以上的人都能发现是脸,区分是幸福还是悲伤的脸。

Eck指的是SketchRNN可以解码的代码,也可以是新的代码。OpenAI研究员Andrejkarpathy也对SketchRNN的工作感兴趣。OpenAI也是人工智能研究的中心。但是,他也认为这个项目必须满足很多前提条件。

这意味着对企业开发人工智能有很大的协助。我们开发的分解模式一般不会尽量与数据集的细节有关。无论输出什么样的数据,都必须使用。

还包括图像、音频、文本和其他东西。不仅仅是图像,还不是笔画。Eck和Ha正在开发,不是能玩游戏象棋的AI,而是能玩游戏的AI。

因此,对于Karpathy来说,他们目前的工作范围可能受到限制。但是,线图是人类思维方式的基础。谷歌员工不是唯一被素描的力量所拥有的研究者。

2012年乔治亚理工学院JamesHays与慕尼黑理工大学Mathiaseitz和Marc的Alexa合作设立了草图数据集和机械学习系统。对他们来说,素描是标准化交流的形式,具有标准理解功能的人都可以。

他们指出,自历史时代以来,人类已经以素描岩画或洞穴绘画的方式叙述了世界。这种象形文字比语言的频繁出现早了几十万年,现在绘画和识别素描的能力已经是基本。多伦多大学神经科学家DirkWalther在论文中认为,非常简单抽象的素描不会以与现实刺激相似的方式转录我们的大脑。Walther的假设是,线图代表了我们自然世界的本质。

在像素的基础上,猫的线怎么看都看起来像猫。草图可能是控制存储对象概念水平的方法。

谷歌

也就是说,我们说的本质。也就是说,他们可能会告诉我们,在过去十万年里,当我们的祖先逐渐现代化时,人类是如何开始思考的。素描、洞穴壁画可能会描绘我们如何从日常经验中南北抽象化。

大多数现代生活都有语言、金钱、数学和计算。因此,草图确认在构建最重要的人工智能方面发挥最重要的作用也是合理的。

当然,对人来说,素描是对现实事物的描写。我们可以更容易地解读抽象线与实际的关系。

这个概念对我们来说意义的根本性。SketchRNN,素描是笔画的序列,形状由时间构成。机器的任务是提取图纸上描绘的东西的本质,试着理解世界。SketchRNN团队在许多方面进行探索。

他们可能会建立一个系统,试图通过人类对系统取得更好的结果。他们可以使用各种草图来训练模型。也许他们不会找到一种方法来考虑他们的模型是否能推广到细致的图像。

但他们自己否认SketchRNN是第一步,有很多东西需要自学。人类艺术的历史并非技术时代可以比拟的。

对于Eck来说,他们更好地理解人类思维的基础。显然,艺术的核心部分代表了基本的人性。要解读深度自学,也必须解读人类生活的基本机制,即我们如何看待世界,如何聊天,如何理解面孔,如何将单词包含在故事中,如何编曲。

看起来和特定的人没有关系,但代表抽象化的人。最后,如果想更好地理解SketchRNN这个AI系统的话,(公共编号:)兹给予小福利→_→切断这个链接获得谷歌官方Paper。


本文关键词:信息,人类,威尼斯正规官网,的人,神经网络

本文来源:威尼斯正规官网-www.tiger3a.com