Човешко изкуство от изкуствен интелект

Човешко изкуство от изкуствен интелект

Следното е откъс от Изглеждаш като нещо и те обичам: Как работи изкуственият интелект и защо прави света по-странно място от Джанел Шейн. Слушайте радио интервю с Джанел Шейн за грешките, които може да направи изкуственият интелект.


Алгоритмично творчество?

Ще бъдат ли музиката, филмите и романите на бъдещето написани от AI? Може би поне отчасти.
Изкуството, генерирано от AI, може да бъде поразително, странно и обезпокоително: безкрайно променящи се лалета; лъскави хора с полуразтопени лица; небе пълно с халюцинирани кучета. AT. рекс може да се превърне в цветя или плодове; на Мона Лиза може да придобие глупава усмивка; пиано риф може да се превърне в соло на електрическа китара. Текстът, генериран от AI, може да придобие качеството на сюрреалистично изкуство.



Когато бъдете подканени със следния текст: „Моите 10 любими животни са: I.“ невронната мрежа GPT-2 добави този списък:

|_+_|
  1. |_+_|
  2. |_+_|
  3. |_+_|
  4. |_+_|
  5. бръснач с крила, висящи на около 4 инча от лицето и татуировка на сърце върху жаба.

Прочетете книгата: Изглеждаш като нещо и те обичам: Как работи изкуственият интелект и защо прави света по-странно място

Купува

Подобно на решаването на проблеми с изкуствен интелект, творчеството с изкуствен интелект вероятно би могло най-добре да се опише като „подпомогнато от изкуствен интелект“.

За да може GAN да създаде картина, първо се нуждае от набор от данни и човек избира какъв да бъде този набор от данни. Някои от най-интересните резултати на GAN се получават, когато художници дават на алгоритмите свои собствени картини или свои собствени фотографии, от които да се учат. Художничката Анна Ридлър, например, прекарва една пролет, правейки десет хиляди снимки на лалета, след което използва снимките си, за да обучи GAN, който произвежда безкрайна поредица от почти фотореалистични лалета, като ивиците на всяко лале са свързани с цената на биткойн. Художникът и софтуерен инженер Хелена Сарин създаде интересни GAN ремикси на собствените си акварели и скици, превръщайки ги в кубистични или странно текстурирани хибриди. Други художници са вдъхновени да изберат съществуващи набори от данни като обществено достояние ренесансови портрети или пейзажи и да видят какво може да направи GAN с тях. Курирането на набор от данни също е артистичен акт, добавете повече стилове на рисуване и може да се получи хибридно или повредено произведение на изкуството. Подрязвайте набор от данни до един постоянен ъгъл, стил или тип осветление и невронната мрежа ще има по-лесно време да съпостави това, което вижда, за да създаде по-реалистични изображения. Започнете с модел, обучен върху голям набор от данни, след това използвайте трансферно обучение, за да се съсредоточите върху по-малък, но по-специализиран набор от данни, за още повече начини за фина настройка на резултатите.

Хората, които обучават алгоритми за генериране на текст, също могат да контролират своите резултати чрез своите набори от данни. Писателят на научна фантастика Робин Слоун е един от малкото писатели, които експериментират с генериран от невронни мрежи текст като начин да внесат известна непредсказуемост в своето писане. Той изгради персонализиран инструмент, който отговаря на неговите собствени изречения, като предсказва следващото изречение в последователността въз основа на познанията си за други научнофантастични истории, научни новинарски статии и дори бюлетини с новини за опазване. Демонстрира своя инструмент в интервю за Ню Йорк T i м и с , Слоун го нахрани с изречението „Бизоните са събрани около каньона“, а то отговори с „до голото небе“. Това не беше перфектна прогноза в смисъл, че имаше нещо забележимо неправилно в изречението на алгоритъма. Но за целите на Слоун беше възхитително странно. Той дори беше отхвърлил по-ранен модел, който бе обучил върху истории от научната фантастика от 1950-те и 1960-те години, намирайки изреченията му за твърде клиширани.

Подобно на събирането на набори от данни, обучението на AI е артистичен акт. Колко време трябва да продължи обучението? Един непълно обучен AI понякога може да бъде интересен, със странни проблеми или объркан правопис. Ако изкуственият интелект се забие и започне да произвежда изкривен текст или странни визуални артефакти като умножаващи се мрежи или наситени цветове (процес, известен като колапс на режима), трябва ли обучението да започне отначало? Или този ефект е готин? Както в други приложения, художникът също ще трябва да следи, за да се увери, че изкуственият интелект няма да копира входните данни твърде внимателно. Доколкото AI знае, точно копие на неговия набор от данни е точно това, което му се иска, така че ще плагиатства, ако е възможно.

И накрая, работата на човека-художник е да подреди изхода на AI и да го превърне в нещо полезно. GAN и алгоритмите за генериране на текст могат да създадат практически безкрайни количества изход и повечето от тях не са много интересни. Някои от тях са дори ужасни, припомнете си, че много невронни мрежи, генериращи текст, не знаят какво означават думите им (гледам ви, невронна мрежа, която предложи да наименувате котките Mr. Tinkles и Retchion). Когато обучавам невронни мрежи да генерират текст, само малка част - една десета или стотна от резултатите си струва да се покажат. Винаги подготвям резултатите, за да представя история или някаква интересна точка относно алгоритъма или набора от данни.

Работата на човека-художник е да подреди изхода на AI и да го превърне в нещо полезно.

В някои случаи курирането на изхода на AI може да бъде изненадващо ангажиращ процес. Използвах BigGAN в глава 4, за да покажа как невронните мрежи, генериращи изображения, се борят, когато се обучават върху изображения, които са твърде разнообразни – но не говорих за една от най-готините му функции: генериране на изображения, които са смесица от множество категории.

Мислете за „пиле“ като точка в пространството и „куче“ като точка в пространството. Ако поемете по най-краткия път между тях, минавате покрай други точки в пространството, които са някъде между двете, в които кокошките имат пера, клепнали уши и провиснали езици. Започнете от „куче“ и пътувайте към „топка за тенис“ и ще преминете през област от размити зелени сфери с черни очи и бучащи носове. Този огромен многоизмерен визуален пейзаж от възможности се нарича латентно пространство. И след като латентното пространство на BigGAN стана достъпно, артистите започнаха да се гмуркат, за да го изследват. Те бързо намериха координати, където имаше палта, покрити с очи, и тренчкоти, покрити с пипала, ъгловати кучета-птици с двете очи от едната страна на лицата им, картина на перфектни хобитски села, пълни с богато украсени заоблени врати, и пламтящи гъбени облаци с весело кученце лица. (ImageNet има много кучета в него, както се оказва, така че латентното пространство на BigGAN също е пълно с кучета.) Методите за навигиране в латентното пространство сами по себе си стават артистичен избор. Трябва ли да пътуваме по прави линии или по криви? Трябва ли да държим местоположението си близо до началната си точка или да си позволим да се отклоним в крайно отдалечени ъгли? Всеки от тези избори влияе драстично върху това, което виждаме. Доста утилитарните категории на ImageNet се смесват с пълна странност.

Дали цялото това изкуство е генерирано от AI? Абсолютно. Но дали AI е нещото, което върши творческата работа? Далеч не. Хората, които твърдят, че техният изкуствен интелект е творците, преувеличават възможностите на изкуствения интелект – и омаловажават собствения си артистичен принос и този на хората, които са проектирали алгоритмите.


Извадка от ПРИЛИЧАШ КАТО НЕЩО И АЗ ТЕ ОБИЧАМ: КАК РАБОТИ ИЗКУСТВЕНИЯТ ИНТЕЛЕКТ И ЗАЩО ПРАВИ СВЕТА ПО-СТРАННО МЯСТО АВТОРСКИ ПРАВА 2019. Предлага се от Voracious, отпечатък на Hachette Book Group, Inc.