Добавить новость
smi24.net
News in English
Январь
2023

What DALL-E Reveals About Human Creativity

0

The often delightful and arresting images created by the latest generation of text-to-image generators, exemplified by DALL-E 2, Midjourney, and Stable Diffusion, have stirred up lots of buzz in both the arts and the AI worlds. The images, generated from simple text prompts (e.g., a baboon sailing a colorful dinghy), look very much like the products of intelligent human creativity.

To explore just how creative these models really are and what they can teach us about the nature of our own innovative propensities, we asked four authorities on artificial intelligence, the brain, and creativity (and we also asked GPT-3, a language-generating model that’s a close cousin to DALL-E) to explain what they think of DALL-E’s capabilities and artistic potential.

How DALL-E Works

DALL-E starts by taking billions of bits of text from the internet and translating them into an abstraction, which it stores in a location in “latent,” or logical, space. In the universe of describable things, for example, “baboon” will be “located” by strong associations near to other primates, probably not far from “Africa,” “savanna,” or “zoo.” Images, too, are read from the internet and are associated with their captions and transposed into the same logical areas. So, the text and the relevant descriptions of the images, while still distinct, are located by strong associations near to each other. This allows DALL-E to find the kinds of images in the spaces indicated by the user’s text prompt. It then generates a set of key features that it has learned this image might include. In our “baboon in a dinghy” example, it would come up with characteristic features for baboon, say the color of its fur, its human-like arms and hands, or the canine shape of its head, as well as characteristic features of a dinghy, say the curved gunwale. Then, DALL-E deploys what’s called a diffusion model, which starts with static noise and then sculpts the pixels in a manner informed by the latent representation of the text description, thus building unique images each time the program is run.

The first diffusion model was invented at Stanford in 2015 by Jascha Sohl-Dickstein, now a research scientist in the Brain group at Google. Seven years ago, when Sohl-Dickstein was a postdoc in the Neural Dynamics and Computation Lab, he and the lab’s director, neuroscientist Surya Ganguli, PhD,  “were exploring ideas in non-equilibrium thermodynamics,” says Ganguli. “That work lead to the idea that one could reverse the flow of time in a diffusion process that turns data into noise by training a neural network, which could then turn noise into data,” Ganguli says.

Inspired by the Brain

Isaac Kauvar, PhD, a Wu Tsai Neurosciences Institute Interdisciplinary Postdoctoral Scholar working in the Stanford Autonomous Agents Lab at the intersection of AI, neuroscience, and psychology, points to two analogies between the way DALL-E generates its images and how creative human artists make theirs. The most obvious is that DALL-E is built around a software architecture known as a “neural network” that in concept, if not in detail, mimics the brain’s composition of neurons, each one of which has connections to many others. Those connections can be strengthened or weakened during learning, thereby forming meaningful patterns of associations.

What’s more, “at a high level, the way that DALL-E builds images from its own latent space is not entirely dissimilar to the way human brains might store and identify concepts and then translate them into outputs,” says Kauvar. These abstract concepts help us link, say, the word baboon to an array of different associations and images — colorful bottoms, zoo enclosures, the African savanna.

“Cartoon” Version of Human Creativity?

Neuroscientist, Wu Tsai Neuro affiliate and author David Eagleman, PhD, agrees that models like DALL-E do have at least one thing in common with human intelligence: They work by “absorbing a lot of examples and then generating new things based on combining and recombining them,” he says. “Creative people also absorb the world, generate remixes, then make whole new versions.”

But, when it comes to creativity, says Eagleman, “what these image generators lack is at least as important as what they share with us. That is, they do not have any way to filter what is good, let alone what is profound or beautiful.”

Eagleman calls the way image generators learn and produce art “a cartoon version” of the way humans do these things. For one thing, he argues, it’s not enough just to make new things. To be fully creative, a person — or a creative machine — would have to be able to filter those new things and select the most resonant and relevant based on human criteria, he says.  “DALL-E can’t do that. It has novelty down, but not the filtering, the selectivity,” he says. “It would have to learn what it is to be a person before it could filter based on human criteria, before it could know whether or why humans would appreciate a particular drawing.”

“These AIs are so impressive,” Eagleman says, “but they’re not doing what the human brain does. Not at all. They use very different techniques to get weirdly similar and often wonderful results. But what’s most interesting may be just how something so unlike a human can come up with such impressive results.”

Honoring the Creative Process

Kauvar, who is a visual artist, points to another key difference between the way DALL-E works and the way many people do. “When I’m drawing,” he says, “it’s an iterative process. I usually don’t know where I’m going to end up. I first just get something down and that inspires the next iteration, and that inspires the next one, and so on.  DALL-E, on the other hand, determines what to draw and then goes straight to making that thing at once in a few seconds. DALL-E can quickly produce many variations, but it relies on a human to evaluate or modify them.”

The importance of honoring process in the human act of artmaking is something that Michele Elam, PhD, William Robertson Coe Professor of Humanities and Institute for Human-Centered Artificial Intelligence faculty associate director, also identifies as a key difference between a human’s creativity and a machine’s. Artists value the creative process, considering it a key part of the act of creation and even essential to the meaning of the artwork itself, she says.

“The idea that something like DALL-E could ‘free your creativity’ by just making it faster and simpler to get a usable product suggests that artists are burdened by the thought, reflection, experience, care, and time that go into their work,” she says. “But for many artists, the meaning of the work is an expression of those efforts, of that process, not incidental to them.”

Acting, Not Thinking

Computational neuroscientist Manish Saggar, PhD, Wu Tsai Neuro and HAI affiliate and an assistant professor of psychiatry and behavioral science, has studied human creativity and the brain for more than a decade. In a 2017 paper in Cerebral Cortex, he found that one measurable quality of a brain in a highly creative state is the simultaneous deactivation of the right prefrontal portion of the cortex and the increased connectivity between many disparate regions of the brain. That increased connectivity includes communication between the prefrontal cortex and the cerebellum which, among other things, Saggar says, can be thought of as the brain’s graphical processing unit, or GPU. “It’s like the CPU and its inhibitions are shutting down, and the GPU is taking over the creative work.” Insofar as that is like a withdrawal from strict executive control and a shift to a more distributed, image-based process, it may be broadly analogous to what DALL-E does, Saggar says.

Saggar’s team also found that most extraordinarily creative people have a strong bias toward action. They don’t just (or even mainly, at first) think about what they might draw; they simply take pen to paper and start drawing. “Think less, do more” is good creativity-inducing advice, says Saggar.

Likewise, a text-to-image model can be so generative perhaps because it’s not trying to force preconceived expectations and apply traditional approaches to a problem; it is simply looking for patterned associations and giving them a try.  DALL-E thinks not at all … it only does.

But at some point, argues Eagleman, to complete the creative process, one has to employ what he calls “the human filter” to identify among all those new things the best ones and then, once in a while, to keep working with a favorite new thing until it also becomes a truly great one.  As startling and impressive as these powerful text-to-image generators are, they aren’t yet close to being artists in that fully creative sense.

When we asked DALL-E’s older cousin GPT-3 about the differences between human and AI creativity, it offered the critique that humans have at least one unique selection filter that algorithms don’t: “An important way in which humans are still better at generating new ideas is that humans have emotions … . Emotions help to identify which ideas are good and which are bad. They give the motivation to pursue some ideas and not others.”

Still a Human Experience

Like the human brain, DALL-E can generalize from specific ideas or prompts to broader webs of association, allowing it to create convincing images based on its “experience.” And it can also combine concepts in ways that strike us as amusing or creative. We asked it to put the baboon on a dinghy on the ocean, for instance, and to portray it in the style of Georges Seurat; it created a contemplative and lonely-looking baboon adrift in a pointillist sea of colorful dots.

But there are a couple of things central to human creativity that DALL-E still lacks. For one, it has no emotional evaluation of what makes an image important, novel, funny, or meaningful. Perhaps related to this is that DALL-E has no extended artistic process. For human artists, that process is central — trying things, evaluating them, iterating to the next version or the next idea to ultimately discover or zero in on the artist’s impetus for making the art in the first place.

For these reasons, full creativity remains — for now at least — in the realm of the human. Perhaps that’s why the best products of DALL-E reflect a partnership between the algorithmic image generator and the creativity, selectivity, and insight of a human creator or artist who is wielding it.

Stanford HAI’s mission is to advance AI research, education, policy and practice to improve the human condition. Learn more.








Как начать петь. Как начать петь песни. Как начать петь с нуля

Два дня инноваций: семинар для молодых сотрудников здравоохранения в Астрахани

Баскова, Киркорова и Лазарева погнали с экранов: попались на непотребщине

На банкет – в Fish Point Family Resort


Kolo Muani: Juventus prepare new offer but face Man United and Chelsea threat

The Great Indian Kapil Show: Raghav Chadha reveals telling Parineeti Chopra to manifest he will never become the PM; says ‘Yeh jo bolti hai wo ulta hota hai’

UFC Abu Dhabi live blog: Shara Bullet vs. Marc-Andre Barriault

Weah’s agent: One Juventus director ‘is creating problems’


Как начать петь. Как начать петь песни. Как начать петь с нуля

НПС построит новые съезды с Северо-Восточной хорды

Российское юр. лицо Microsoft подало заявление о банкротстве

Маяк Анива, скала Сивучья, Сахалин


Quarantine Zone creator reveals 3 reasons the zombie sim went viral on TikTok

Ninja Party можно предзаказать в мобильных маркетах с релизом в конце июля

Первый трейлер Battlefield 6

«Если бы у Наруто и AC Shadows был ребёнок»: Разбор англоязычной версии Where Winds Meet



Один год в двадцатилетней истории Marins Москва Пражская

Питчинг Релиза. Отправить релиз на Питчинг.

Optima Development: Новый сквер и фитнес-клуб

Адвокат Гаврилова раскрыла, чего добивается семья Тиммы после его смерти


УК просят разрешить продавать долги граждан за ЖКУ

Елена Игоревна Вселенная — писатель, публицист, автор масштабного многотомного проекта «Наследие России»

В Санкт-Петербурге обсудили внедрение ИИ в разработку и оптимальные корпоративные архитектуры

Пловец из Москвы скончался во время заплыва по Волге в Нижнем Новгороде


С 1 августа 2025 ЖКХ будет дешевле для всех пенсионеров — вводится полезная льгота

Министр Юн Чжон Хо: рейсы Москва - Пхеньян нужны для сотрудничества стран

"Потребнадзор": покупка овощей и фруктов в палатке грозит отравлением и уголовкой

Пересадка жира для создания идеального лица и тела: вся правда о липофилинге


Теннисист Медведев не прошел в полуфинал турнира ATP в Вашингтоне

Сидоренко из России одержал победу и стал чемпионом по настольному теннису на Универсиаде.

Калинская пробилась в полуфинал турнира в Вашингтоне.

Весной его дисквалифицировали за мат, а теперь он герой Универсиады. Кто такой Владимир Сидоренко?


Прогноз погоды на сегодня, 28 июля

Экс-футболист «Зенита» отказался от перехода в «Спартак», пишут СМИ

Команда столичного управления МЧС России готовится к участию во Всероссийских соревнованиях по пожарно-спасательному спорту

Пересадка жира для создания идеального лица и тела: вся правда о липофилинге


Музыкальные новости

Концерт Егора Крида в Екатеринбурге перенесли из-за проблем с продажей билетов

Дорога любви: Жасмин представляет романтичный клип на песню «Ты и я»

Дирижер оркестра «Глобалис» признался в желании побеседовать с Паганини

Питчинг Релиза. Отправить релиз на Питчинг.


Семь воздушных судов 28 июля прилетают во Владивосток вне расписания

Адвокат Гаврилова раскрыла, чего добивается семья Тиммы после его смерти

Optima Development: Новый сквер и фитнес-клуб

Росгвардия обеспечила безопасность празднования Дня ВМФ и футбольного матча в Москве


Путин: пять бригад морской пехоты в ближайшее время преобразуют в дивизии

"Локомотив" обыграл "Краснодар" со счетом 2:1 во втором туре РПЛ

Адвокат Гаврилова раскрыла, чего добивается семья Тиммы после его смерти

В Ярославле прошёл Слёт молодёжи Северного филиала компании «ЛокоТех-Сервис»


На МКАД авария затруднила движение авто

Где живут и на чем ездят самые аварийные водители России?

ДТП произошло на внешней стороне 26-го километра МКАД

НПС построит два велопешеходных моста через Москву-реку


«Подводная лодка, демонтрированная Путину, произвела шок на Западе»

Путин поздравил Жапарова с юбилеем подписания декларации о союзничестве.

Путин в День ВМФ прибыл на территорию Главного Адмиралтейства в Санкт-Петербурге

СМИ: Путин на этой неделе отправил США ominous сигнал.


Приговор экс-руководителю компании по производству вакцин против ковида был смягчен.



Кот-массажист получает 80 тысяч рублей: какую работу доверяют животным

Сеть клиник «Будь Здоров» открыла первый травмпункт сети на базе клиники на Сретенке

Optima Development: Новый сквер и фитнес-клуб

Ночные перекусы в отпуске: доктор Садыков о том, как они влияют на микрофлору и вес


Кто заставил Зеленского предложить России новый раунд переговоров: В Британии показали пальцем

Киевский режим применил все 18 пакетов санкций ЕС

Зеленский настаивает: встреча с Путиным до конца августа с участием Европы

Запад ударил Зеленского по самому больному месту – кошельку: Киев показательно лишили 1,5 миллиардов помощи


Росгвардия обеспечила безопасность празднования Дня ВМФ и футбольного матча в Москве

"Спартак" сделал предложение экс-игроку "Зенита" Артуру, но тот отказался

Сотрудники Росгвардии обеспечили безопасность футбольных матчей в Москве

Optima Development: Новый сквер и фитнес-клуб


Лукашенко получил приглашения от стран Латинской Америки и Азии для визитов.

Лукашенко дал интервью одному из американских СМИ

«Беларусь-1»: Лукашенко дал интервью одному из американских СМИ


Сергей Собянин. Главное за день

Собянин поздравил работников центров госуслуг с профессиональным праздником

Собянин: На территории промзоны «Кирпичные улицы» будет создана социнфраструктура

Собянин в День работника МФЦ поздравил сотрудников центров госуслуг Москвы


Александр Михайлов (GSOC): «Безопасность IT-экосистемы — это зона нулевого доверия к подрядчикам»

Самолёт совершил первый прямой авиарейс из Москвы в Пхеньян

В Феодосии ликвидировали пожар на площади

Зачем Минприроды Свердловской области планирует организовать полигон отходов на участке, где идёт поиск питьевой воды?


В Кузбассе проходят торжества в честь празднования Крещения Руси

Министр Юн Чжон Хо: рейсы Москва - Пхеньян нужны для сотрудничества стран

Пересадка жира для создания идеального лица и тела: вся правда о липофилинге

Книга «365 уличных посланий. Нижний Новгород» выходит в свет


Александр Цыбульский: "С Архангельской области началась история российского флота"

Путин дал указание рассмотреть проблемы онкологии в Архангельской области.

70 участников СВО в Архангельске показали мотивацию выше госслужащих — Цыбульский

В Архангельске представили киноальманах «Север, я люблю тебя!» по произведениям современных писателей


К парню с костылем подошли трое с требованием уступить. Он был готов, но заступилась бабушка по соседству

В Севастополе пройдет масштабная выставка картин Александра Дейнеки

Сколько пассажиров прибывают в Крым летом на поездах ежедневно

Прогноз погоды в Крыму на 27 июля


Экс-футболист «Зенита» отказался от перехода в «Спартак», пишут СМИ

Министр Юн Чжон Хо: рейсы Москва - Пхеньян нужны для сотрудничества стран

С 1 августа 2025 ЖКХ будет дешевле для всех пенсионеров — вводится полезная льгота

Прогноз погоды на сегодня, 28 июля














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *