登录
首页精彩阅读AI艺术的发展:让艺术通过人工智能变得更具创造力和人性化
AI艺术的发展:让艺术通过人工智能变得更具创造力和人性化
2019-07-31
收藏
AI艺术的发展:让艺术通过人工智能变得更具创造力和人性化

出品 | CDA数据分析研究院,转载需授权

人工智能和深度学习对大量领域产生了巨大影响,并在过去几年中引发了很多破坏和进展,这一事实对于许多人来说并不会让人感到意外。

然而,有些人可能会感到惊讶的是,即使是艺术和创意领域,一直被视为明显是人类的领域,也不会受到这些最新进展的影响。

人工智能取代工作的恐惧是围绕这些技术最常见的问题之一。现在,它甚至正在侵蚀我们的创造性追求。这是否意味着我们不仅要担心AI失去工作,还要担心我们的人性?

虽然许多人担心AI会取代或替代人类,或者认为人工智能永远不会具有创造性,并且人工智能产生的任何东西在定义上都不是艺术,我想提出另一种观点。我相信先进的人工智能将使我们能够专注于我们独特的才能和优势,为我们提供创造性探索和表达的新工具,让我们享受更高品质的休闲时光。

最终它将使我们变得更加人性化。

在本文中,我首先想要向您介绍深度学习与艺术交叉的非常简短(并且非常不完整)的介绍,并向您介绍一小部分采用神经网络作为首选媒介的艺术家。

然后,我想向您介绍我目前公司Qosmo过去几年一直致力于的一些项目,以及我自己的一些个人项目。

最后,我想与大家分享一个未来的愿景,不仅是人工智能和创造力,还有更广泛的工作和人性。

我希望在本文结束时,我会说服你们,我们既不应该害怕人工智能正在削弱或贬低我们的人性,也不应将其视为只影响日常工作但不会对我们的创造能力产生任何影响的东西。相反,我希望最终你会对AI的未来感到兴奋,并且愿意接受它而不是作为竞争者,而是作为重获和巩固我们人性的有力工具。

旁注:本文基于我在日本SciPy 2019和日经AI 201峰会的扩展版本中进行的一系列会谈。如果您更喜欢观看视频,可以在YouTube上找到SciPy演讲。但是这篇文章既是最新的,也是更深入的,特别是关于知识工作和创造力未来的最后一节,我在SciPy谈话期间没有时间去讨论。


AI艺术的一个非常简短的历史


人工智能和创造力之间的联系第一次从相当深奥的圈子渗透到主流意识中,这可能是谷歌在2015年宣布推出DeepDream的时候。

AI艺术的发展:让艺术通过人工智能变得更具创造力和人性化

想象一下盯着云,过了一会儿,你会感觉到你可以在那里看到一种模式,也许是一张脸。你盯着云看的时间越长,你对脸部的想法越多,你就越能说服自己,云中真的有一张脸盯着你看。

DeepDream本质上就是这种现象的神经网络

通过反复增强神经网络在图像中拾取的图案,最初非常微妙的图案(或其想象的暗示)逐渐变成这些图案的完整表现。通过这种方式,眼睛开始长出狗,蜗牛似乎从建筑物中萌芽,风景变成奇异的城市景观与童话塔。

从高中开始,一直到我的博士学位我偶尔会为乐队制作音乐视频。我的第一个使用深度学习的项目是在2016年我的博士学位结束时,当时我使用DeepDream网络在我为“The Void”字母和树所做的视频中实现了一种有点新颖的视觉效果。

虽然今天没有人会对此感到兴奋,但你必须记住,2016年是史前的深度学习术语。那时候它是一个非常酷的效果(至少这是我的想法),这对我来说是一个很好的方式让我熟悉TensorFlow(当时还处于初期阶段)以及一般的深度学习

最近,我们已经超越仅仅操纵现有图像。特别是,我们已经看到神经网络生成图像的惊人突破。很大程度上,这归功于一类称为GAN生成性对抗网络的网络

GAN基本上是通过使两个网络彼此相互作用,生成虚假数据的生成器和必须判断数据是真实的鉴别器或评论者还是由生成器网络创建的伪造,已经达到了令人震惊的准确性和可信度。在他们可以产生的那种图像中。

特别受欢迎(和奇怪的)是(半)真实面孔相互变形的幻觉图像,导致令人着迷的视频。

由于最近实现了这种GAN伪造品的真实性,所以像thepersondoesnotexist.com这样的网站的整个家庭手工业如雨后春笋般涌现。每次刷新该特定站点时,都会生成由神经网络设想的新的照片级真实肖像。虽然玩起来很有趣,但它也是围绕Deep Fakes日益增长的问题和近乎完美的AI伪造时代的真实数据可信度的焦点。

这是我将在下面再次回到的一点。虽然人工智能艺术本身既有趣又有趣,但它也 - 就像其他形式的艺术一样 - 使我们能够突出问题并表达我们的关注。通过将这些问题或失败点作为我们工作的基础并将其置于极端,我们作为艺术家可以传播意识和教育。

最好的艺术品不仅美观,而且还邀请人们思考。

2018年10月,当法国集体“Obvious”能够以432,500美元的价格在着名的拍卖行Christie's拍卖他们的GAN生成的艺术品“Edmond de Belamy”时,AI艺术首次成为主流。

AI艺术的发展:让艺术通过人工智能变得更具创造力和人性化

这引起了艺术和人工智能社区的骚动,并提出了人工智能能否真正产生艺术的问题。

然而,这远远不是它提出的唯一问题,拍卖结果的大部分注意力都集中在Obvious接近并实施该项目的路上。他们因为拿走别人的代码,在一个结果有问题的简单数据集上进行训练,并在画布上销售生成的输出而面临严厉的批评。

我不想深入讨论Obvious是否应该获得金钱和关注(如果你感兴趣,网上有很多讨论,例如伟大出版物Artnome中的这篇文章)。然而,我想说,在我看来,无论我们是否将最终作品视为艺术,Obvious都不是我看到真正艺术家的艺术家。

非常有说服力的是,他们甚至没有用自己的名字签名,而是使用了GAN算法的关键方程之一。就好像他们想说“我们没有这样做,人工智能成功了”。

这与真正的AI艺术家正在做的完全相反。

像画家一样研究他的画笔和画布,并改进他的笔画,就像钢琴家研究她的乐器的复杂性和练习她的技巧一样,真正的AI艺术家深入研究他正在使用的网络以及他需要操纵它们的方式为了实现他所想到的创造性成果。

从这个意义上说,AI和神经网络不是创造者!它们是钢笔,刷子,相机,小提琴,凿子等。它们是工具。

由于它们的高度复杂性和新颖性,它们看起来像魔术一样,像自主创作者一样,但最终它们仅仅是(希望)熟练创作者手中的工具。

对我而言,Obvious做的非常巧妙地利用这种新颖性和高复杂性来做出好的销售。无论你怎么想他们的艺术天赋,他们肯定是聪明的企业家。

有点像有人在1985年推出它的边缘,在MS Paint上做了一个简单的草图,将它印在一块大帆布上,并将其拍卖下来。纯粹的新颖性和(当时)看似高度复杂的创造它的过程可能会带来很高的价格并给人们留下深刻的印象。但它可能不会是“好艺术”。而MS Paint肯定不会是创造者。

就像数码相机不再是模拟相机的创造者一样,或者Photoshop不再是前数字图形设计师的笔和纸的创造者,人工智能和深度学习也是如此 - 至少我们可以实际想象它们的方式在可预见的未来 - 不是创作者,而是创作者使用的工具。

对于那些对真正的自主创造力感到兴奋的人来说,这可能会让人有点失望。但我对此感到高兴,并认为这绝不会减少围绕这些技术的兴奋。它们为创作者提供了真正全新的创作表达方式。它们不仅仅是作为固定工具,它们几乎是一个元工具,它使我们能够不断创造新的工具和流程,以实现我们的创造性愿景。

有了这个关于我认为真正的AI艺术家不在乎的人的咆哮,让我简要介绍一下我认为属于这一类的少数人。

这份清单绝不是详尽无遗的,人工智能艺术家社区也在不断发展。开始研究更广泛的人工智能艺术的好地方是由Luba Elliott组织的创意和设计机器学习NeurIPS研讨会的画廊。

为了简洁起见,我也不会深入了解任何艺术家的细节,但鼓励你为自己检查他们的艺术(和想法)。


认识AI艺术家


可能最成熟的AI艺术家是Mario Klingemann。

Klingemann就像Obvious一样,把注意力集中在GAN相关艺术,尤其是肖像画上。然而,与Obvious相反,他真正成为他们错综复杂的大师,确切地知道如何建造,训练和操纵它们以达到他所希望和设想的精确艺术成果。

他的许多作品都具有令人难以置信的微妙之处,让人联想到更传统的艺术形式,通常将艺术美学与更抽象的艺术形式混合在一起。

AI艺术的发展:让艺术通过人工智能变得更具创造力和人性化

“神经小故障”; 正如他在接受艺术市场大师采访时所描述的那样,他对人工智能艺术追求的动力在于寻找“有趣” 。

“我试图找到一种有趣的东西,这种搜索永远不会结束,因为一旦你抓住它就会像手中的雪花一样融化。兴趣隐藏在陌生的,不常见的和不可思议的之中,但是一旦你发现它并把它拖到聚光灯下,你看它越久,它就越熟悉或正常,最终失去它的趣味性。

我正在使用机器作为探测器来帮助我搜索不断增长的信息,这些信息以加速的速度传播到我们的世界。与此同时,我通过使用机器来生成有序的信息模式,而不是将其留给我自己的设备,从而增加了这一堆。有时在这个过程中,我决定并有时将其留在机器上。“

这种搜索方面是AI艺术中反复出现的主题。

我们可以想象所有可能的艺术作品的抽象空间。这个空间是令人难以置信的高维度和巨大的(可能是无限的,取决于我们考虑的媒体)。传统上,艺术家只能非常缓慢地探索这个空间中的无限小区域。

神经网络本质上提供了工具,使我们能够更快,更广泛地探索这个空间。人工智能艺术家的技能往往在于知道如何引导这种网络化探索向“高度兴趣”的地区。

克林格曼最近还在苏富比拍卖了他的一件艺术品---记忆路人。这件作品不仅仅是一件静态的艺术品,而是实际上包含了生成机制本身,导致了一个完全生成,无限期发展的装置。

最终,该片获得了“仅仅”32,000英镑,这导致了一场广泛的媒体风暴,文章名为“人工智能艺术品拍卖,机器人大灾难尚未到来”,宣称短暂的AI艺术场景已不复存在而不是好奇心,基本上已经到了最后。

但是,我个人认为这对AI艺术界来说是一个好兆头(我认为Mario Klingemann同意这一点)。32,000英镑是一个合理且非常可观的价格,而不是表明人工智能艺术的终结,它标志着人工智能艺术炒作的结束以及对注意力/新奇经济的利用。

这表明AI艺术已经成为一种严肃而受人尊敬的艺术形式,而不是过分夸大的好奇心。

与马里奥·克林格曼的作品截然不同,但同样有趣的是土耳其媒体艺术家Memo Akten的作品。

虽然克林格曼的作品非常“专注”(缺乏更好的词汇)并且与美术相关,但阿克滕的作品更具概念性和多样性。虽然他的最终结果可能看起来不那么“精致”,但它们都是基于通常非常简单但巧妙和具有挑衅性的想法。

我非常鼓励你看看他的作品目录,但是我想与你分享我最喜欢的作品,他称之为“学习”。

这个想法非常简单,但结果既惊人又发人深省。

在训练过程开始时,神经网络通常是随机初始化的,这意味着它们绝对没有“现实世界”的概念。在训练期间,通过反复暴露于数据,他们然后形成世界的图像(或至少是数据集中表示的世界)。如果此数据集存在偏差,那么受过训练的网络的世界观也是如此。

在学习中,Akten将这个想法发挥到了极致,并在非常不同的图像数据集上训练了各种神经网络

一个网络只看到海洋和海岸线的图像,另一个网络只看到火灾图像,而另一个网络只看到了鲜花图像。

结果,一旦网络完成了他们的训练过程并在“真实世界”上发布,被展示出更多的通用图像,他们只能根据他们学到的东西来解释这些。

例如,“花卉网络”并不知道如何解释它在花朵方面所看到的一切,看到它看起来到处都是鲜花。

就好像一个孩子从孤立的环境中出生,只被花朵包围,然后突然释放到现实世界中。它的视觉皮层和模式识别系统可能会很难解释新的模式,并且可能同样看到各处的鲜花。

虽然这是一个思想实验而仅仅是推测,但众所周知,我们人类对视觉感知中的某些模式具有自然(且非常有用)的偏见,例如看到面部的偏见。

学习观察提出了一个有趣的问题,即由于我们独特的成长和文化背景,我们每个人可能有多少偏见。

我们所看到和感知这个世界有多么不同?

虽然不太可能像Akten网络的偏见那样强烈,或者思想实验中的孩子,但几乎可以肯定的是,人与人之间存在微妙的差异。

算法的偏差在过去已经引起普遍关注。种族聊天机器人或性别歧视图像识别/分类模型只是一些例子。它们实际上是数据驱动科学和深度学习中最基本的问题之一。

在某些情况下,偏见非常明显。虽然这些案件肯定令人震惊和担忧,但它们不太可能成为问题最严重的案例,仅仅因为它们非常明显。随着数据驱动技术变得越来越普遍,特别是微妙但全部存在的微小偏见既重要又难以发现和根除。

虽然我们可能没有直接的解决方案,但作为艺术家,我们有能力在这个问题上引起关注,并让外行人(以及经验丰富的从业者)更容易接近,将其推向极致。

这就是我认为很多有趣的AI艺术生活的地方,特别是Memo Akten也参与其中的更具概念性的类型:采用完善的神经网络,并将它们推向(或超越)它们的突破点或适用范围。这不仅会带来有趣和意想不到的结果,而且还可以让我们更深入地了解这些模型在现实世界场景中盲目松散时可能会产生的问题。

我想在这里介绍的最后一位艺术家是计算机设计讲师Tom White。

他的项目Perception Engines,顾名思义,侧重于感知在创造力中的作用。用他的话说,

“人类感知是创作过程中经常被低估的部分,因此设计一个将感知放在首位和中心的计算创造过程是一项有趣的练习。”

同样,它本质上是一种欺骗神经网络的做法,通过巧妙地改变应用它们的域来做它们最初不打算做的事情。

它使用了对抗性例子的概念,并对其进行了有趣的艺术转折。特别是,White建立了一个反馈循环,网络的感知引导创作过程,然后反过来再次影响感知。

简而言之(并且有点简化),怀特采用经过训练的神经网络来识别图像中的对象,然后使用第二个系统,该系统可以生成抽象形状并搜索可以“欺骗”网络进入高确定性预测的结果一个特定的对象类。结果看似抽象的形状(白色后来变成真正的屏幕打印)仍然说服网络是某些对象的照片级真实表示。

AI艺术的发展:让艺术通过人工智能变得更具创造力和人性化

有趣的是,一旦我们知道网络认为它看到了什么,我们就可以在大多数情况下突然看到大多数图像中的对象(尽管我怀疑是否有人被欺骗与真实的东西混淆)。

白色使用的真正过程实际上比我在这里给出的项目的缩略轮廓更加聪明和深刻。如果您对细节感兴趣,我强烈建议您查看他的文章。


Qosmo:计算创造力和超越


现在您已经对AI艺术的内容有了一些了解,并了解了一些在这个新兴领域工作的人,让我简要介绍一下我如何参与其中的故事。

我实际上是以物理学家的身份开始了我的学术生涯,在量子信息理论方面攻读博士学位。但是在这样做的过程中,我意识到我想做更多应用的事情。通过我共同创办的初创公司获得了一些创业经验,我认为AI从纯粹的学术角度来看似乎既有趣,也是解决一些非常酷的现实世界问题(并赚取一些钱)的非常有前途的工具。

因此,在我获得博士学位后,我在一家创业公司工作了几年,这家公司将人工智能应用于广泛领域的商业问题,例如金融和医疗保健。虽然在这些领域肯定有一些有待解决的问题,但我个人对AI的创意方面越来越感兴趣。

最终,在2019年2月,我终于决定辞掉我以前的工作,并和他的朋友NaoTokui一起在他的Qosmo公司工作。

Qosmo是一个位于东京的小型创意团队。该公司的核心理念是“计算创造力”,重点关注人工智能和音乐(但当然不限于这些领域)。

在这里,我想简要介绍一下我们过去的三个项目。


AI DJ


到目前为止,Qosmo最着名的项目可能是我们的AI DJ项目。

AI DJ最初始于2016年,是人与人之间的音乐对话。

在DJ中,“背对背”的演奏意味着两位DJ轮流选择和混音。在我们的例子中,我们有一个人类与AI一起背靠背。

具体来说,人(通常是Nao)选择一个轨道并混合它,然后AI接管并选择一个轨道并混合它,依此类推,创造一个自然和连续的合作性能。

这种增强人类创造力和玩人与机器创造力关系的想法是我们在Qosmo所做工作的核心。我们对自主创意机器并不特别感兴趣(我们也不相信它们在不久的将来是可能的),而是人类如何与人工智能和机器进行交互以达到创造性目的。

AI DJ由几个独立的神经网络组成。核心是一个系统,可以根据以前播放的曲目的历史选择一个曲目,以及一个可以进行节拍匹配和混音的系统。

至关重要的是,我们不是使用数字音频而是使用实际的黑胶唱片。AI必须学习如何物理操纵光盘(通过使用强化学习训练的微型机器人手臂),以便对齐节拍并获得匹配的速度。

虽然该项目已有几年历史,但我们仍在不断开发该系统。例如,使用相机来分析人群行为并尝试通过调整此信息的轨道选择来鼓励人们跳得更多。

我们在过去的许多场地都采用了这种表现,包括本地和全球。到目前为止,我们最大的表现是在Google I / O 2019上,我们在主要舞台上进行了一小时的演出,在CEO Sundar Pichai的主题演讲之前让人群热身。

您可以在我们的网站上阅读有关AI DJ细节的更多信息。


虚构的Soundscapes


作为人类,我们将视觉和听觉经验联系在一起。看看海滩的图像,你可以很容易地想象出海浪和海鸥的声音。看着繁忙的十字路口可能会引起汽车喇叭声和施工噪音。

Imaginary Soundscapes是一个让人工智能具有与图像相关的类似想象声音的实验。这是一个基于网络的声音安装,让用户可以探索谷歌街景,同时沉浸在AI梦寐以求的想象声景中。

从技术上讲,它基于跨模态信息检索技术的思想,例如图像到音频或文本到图像。

该系统使用视频(即视觉和音频)输入的两个模型进行训练:一个完善的,预先训练的图像识别模型处理帧,而另一个卷积神经网络将相关的音频作为谱图图像读取,具有力的损失其输出的分布尽可能接近第一个模型的分布。

经过训练,这两个网络允许我们从我们庞大的环境声音数据集中检索特定场景的最佳匹配声音文件。

生成的音景有时很有趣,有时很有趣,有时候会发人深思。其中许多符合人类的期望,而其他人则让我们惊讶。我们鼓励您自己迷失在想象中的音景中。


神经Beatbox


我们最近的艺术项目是Neural Beatbox,这是一个视听装置,目前在伦敦Barbican举办,作为“AI:More Than Human”展览的一部分(其中还有Mario Klingemann和Memo Akten的作品)。

就像AI DJ一样,这件作品以音乐对话为中心。然而,除了在AI DJ中,AI在这里不是参与者而是仅仅是辅导员,并且对话发生在安装的不同观看者之间。

节奏和节拍是人类之间最基本和最古老的交流方式。Neural Beatbox使任何人,无论他们的音乐背景和能力如何,都能用他们自己的声音创造复杂的节拍和节奏。

当观众接近安装时,鼓励他们录制自己的短片,制作声音和拉动有趣的面孔。使用该视频,一个神经网络将观众的声音分段,分析并分类成各种类型的鼓声,其中一些然后被集成在当前播放的节拍中。

同时,另一个网络不断产生新的节奏。

通过以这种方式结合后续观众的贡献,人们之间的直观音乐对话展开,从而产生不断发展的作品。

AI的轻微瑕疵,例如偶尔的错误分类或不寻常的节奏,实际上增强了创作体验,并产生了有趣和独特的音乐体验。作为观众,试图通过制作“非鼓声”来推动系统超出其预期的领域可以产生非常有趣的结果,其中一些实际上是令人惊讶的音乐和鼓舞人心的。

目前,Neural Beatbox仅限于在巴比肯展览等公共场所展出,但我们正在考虑将其打开为基于网络的互动作品。我们只是担心互联网上的人们可能会为这种安装做出什么样的声音和视频...虽然结果可能很有趣和有趣,但他们可能还会很快包含一些NSFW内容。;)


生成模型和VAE


除了我(仍然是最近)在Qosmo的工作,我还做了一些我自己的艺术作品和更多与AI有关的一般创意相关项目。在向您展示其中的一些内容之前,我简单地想要进行快速简单的技术游览。

创作场景中使用的许多模型都属于“生成模型”的广泛范畴。上面介绍的GAN是其中的一种变体。

生成模型本质上是模型,正如其名称所示,学习如何生成更多或更少的真实数据。物理学家理查德·费曼(Richard Feynman)在一篇引述中非常清楚地概括了这背后的一般思想。

“我无法创造,我不明白。” - 理查德费曼

作为使用AI的研究人员和工程师,我们希望如果我们可以教我们的模型来创建至少模糊的数据,那么这些模型必须对现实世界的样子或行为方式有所了解。 。

换句话说,我们使用创造和生成有意义的输出的能力作为智能的标志。

不幸的是,这种“理解”或“智能”仍然常常如下图所示。

AI艺术的发展:让艺术通过人工智能变得更具创造力和人性化

虽然我们的模型肯定是在了解现实世界,但他们的知识领域往往受到严重限制,正如我们在偏见的例子中已经看到的那样。

在我之前从事实际业务应用的工作中,这是个坏消息。您不希望您的财务或医疗预测看起来像上面的图像!

然而,作为一名艺术家,我发现这令人兴奋和鼓舞人心。事实上,正如已经指出的那样,许多艺术家故意寻求生成模型的这些突破点或边缘情况。

我个人最喜欢的生成模型类型是所谓的变分自动编码器,或简称VAE。从信息理论的角度来看,我发现它们既非常多才多艺,又美丽而优雅。

简而言之,VAE作为输入馈送原始数据,然后必须通过信息瓶颈压缩和传输该数据,并最终尝试尽可能准确地重建它。

由于信息瓶颈(更具技术性:潜在空间的维度低于数据空间),模型不能直接传递数据,而是必须学习有效的抽象和概念。

例如,如果我们想将它应用于狗和猫的图像,而不是简单地传输每个像素值,模型就被迫学习抽象,例如“狗”和“猫”的概念,腿和耳朵的概念,毛皮颜色等,它允许更紧凑(尽管通常不是完全无损)的数据表示。

作为这个过程的一个简洁的副产品,我们得到了一个紧凑的数学描述,我们的数据,一个所谓的潜在向量或嵌入。这允许我们做各种有趣的事情,例如有意义的数据比较以及数据点之间的实际插值,如上面的GAN面的示例中那样。

如果你想更详细地了解所有这些,我从两个玩家之间的合作游戏的角度写了一篇关于VAE的深入讨论。


个人项目


我想在下面向您展示的项目都以某种方式使用VAE。


潜在的脉动

当VAE初始化时,它的数据表示是完全随机的,因为它尚未学习任何有关训练数据的信息。随着训练的展开,网络逐渐学会了不同的概念和抽象,类似数据的集群在潜在的空间中开始形成,随着模型的收敛,越来越多地结晶出来。

潜在脉动可视化一个这样的训练过程,从初始随机混乱,模型经历变换阶段尝试不同表示的各个阶段,到最终建立在表现出相当明显的聚类的阶段。

潜在空间中的每个点代表大约30万个消费者投诉文本中的一个,该文本涉及由不同颜色代表的约12种不同的金融产品(例如“信用卡”,“学生贷款”......)。

除了自然的学习过程中,我还添加了一些周期性的随机噪声的嵌入物,以创建与轨道同步跳动模式“2个头脑”的InsideInfo,时间拉长从原来172bpm到160bpm,以更好地匹配视频的帧速率。我选择了轨道“2 Minds”,因为标题让我想起了VAE的编码器 - 解码器关系。

通常在使用生成模型创建艺术时,我们会考虑模型创建的实际输出。然而,潜在的脉动将这一概念转移到它的头部,表明潜在的空间本身可以具有固有的美感和艺术品质,即使模型训练的数据显然是枯燥的,例如在这种情况下使用的消费者投诉文本。


潜在的风景

另一个相关的作品更深入地描绘了隐藏在潜在空间中的优雅和美丽的潜在风景

我喜欢将这些视为神经网络的“脑部扫描”。

AI艺术的发展:让艺术通过人工智能变得更具创造力和人性化

从技术上讲,这些图像是通过分析潜在空间的基本指标而生成的这件作品实际上是[我们正在研究的研究论文的副产品)。粗略地说,潜在空间不是“平坦的”,并且它们内的距离不均匀。潜在景观可视化潜在空间中不同位置处的曲率,距离失真程度。

上述结果也基于在同一财务投诉数据集上训练的VAE,显示了提醒外星人景观或宇宙气体云的抽象形态。

就像Latent Pulsations一样,网络本身,而不是生成模型的输出,成为艺术品。


NeuralFunk


我想提到的最后一个项目是迄今为止我最大的个人项目。由于我之前已经在媒体上广泛撰写了这个项目我只想给你一个非常简短的概述。

NeuralFunk是一个使用深度学习进行声音设计的实验。这是一个完全由神经网络合成的样本制成的实验轨道。

同样,神经网络不是轨道的创造者,但它们是用于构成轨道的唯一工具。因此,结果不是AI制作的音乐,而是使用AI作为探索创造性表达新方式的工具制作的音乐。

我在样本的创建中使用了两种不同类型的神经网络,一种是在频谱图上训练的VAE和一种WaveNet(另外还可以用来自VAE的频谱图嵌入)。这些网络共同提供了许多工具,用于生成新的声音,从重新设想现有样本或将多个样本组合成独特的声音,梦想完全无条件的全新声音。

然后将得到的样品用于产生最终的轨道。

标题为NeuralFunk的灵感来自鼓和低音子类型Neurofunk,这是我最初的想法。但在整个项目过程中,它变成了更具实验性的东西,与声音设计过程本身的实验性质相匹配。

如果你想了解这个项目的全部细节(包括代码),请查看我的文章。

那么下一步对我来说是什么?

我对使用AI的扩展现场表演有一个很大的愿景,它将与上面介绍的许多概念(和项目)相结合并将它们提升到一个新的水平,同时给我一种全新的音乐表现手段。

到目前为止,这只不过是一个愿景,考虑到项目的规模,我甚至有点害怕开始。

然而,我现在非常积极和热情地工作的是一本关于Time Off重要性的书。

虽然这似乎有些切合实际,但它实际上在几个方面完全与人工智能和创造力的关系联系在一起。

为了让你相信这一点,让我们继续一下。起初看起来似乎是随机的和无关的,但是请稍等一下,希望到最后你会同意我并对这个未来的愿景感到兴奋。


工作,休闲和创造力的未来


在人类历史的大部分时间里,工作的概念基本上等同于体力劳动。首先是田地和农场,后来是工厂。

在20世纪初,普通工厂工人每天工作超过10小时,每周工作6天。

这一切都在1926年发生了变化,当时亨利福特推出了8小时工作日和5天工作周(同时显着提高了工资标准以上的工资)。

为什么福特这样做?这不是因为他只是一个好人。他可能已经,我不确定,但他这样做的理由更实际,也更受商业驱动。

首先,他认识到如果他提供比其他任何人更好的工作条件,他就可以轻松吸引最优秀的人才。这正是发生的事情。最熟练的工人离开了他的竞争对手,并排队到他的工厂工作。如果有人没有表演,他就会放手。有足够多的人愿意接管这个职位。

其次,他认为如果人们没有空闲时间或者太累,无法利用空闲时间,他们就不会在休闲活动上花钱。

“有更多休闲的人必须有更多的衣服。他们吃的食物种类更多。它们需要更多的车辆运输。[...]休闲是不断增长的消费市场中不可或缺的因素,因为劳动人民需要有足够的空闲时间来寻找包括汽车在内的消费品的用途。“

这纯粹是经济的。

通过给予他的工人更多的休闲(以及更多的钱用于休闲),同样的工人最终能够和激励他们购买他们正在生产的产品。更多的空闲时间不会伤害,但会提振经济!

最后,最有趣的是我们在这里的讨论,他意识到他的工人将能够在更短的时间内做得更好,原因有两个。

对时间的限制将导致更多的创新和更好的方法。人们实际上会考虑如何工作,而不仅仅是研究。


“我们可以在五天内获得至少与六年一样的产量,我们可能会获得更大的产量,因为压力会带来更好的方法。” - 亨利·福特

数据分析咨询请扫描二维码

客服在线
立即咨询