Добавить новость
smi24.net
News in English
Март
2023

GPT-4 Has the Memory of a Goldfish

0

By this point, the many defects of AI-based language models have been analyzed to death—their incorrigible dishonesty, their capacity for bias and bigotry, their lack of common sense. GPT-4, the newest and most advanced such model yet, is already being subjected to the same scrutiny, and it still seems to misfire in pretty much all the ways earlier models did. But large language models have another shortcoming that has so far gotten relatively little attention: their shoddy recall. These multibillion-dollar programs, which require several city blocks’ worth of energy to run, may now be able to code websites, plan vacations, and draft company-wide emails in the style of William Faulkner. But they have the memory of a goldfish.

Ask ChatGPT “What color is the sky on a sunny, cloudless day?” and it will formulate a response by inferring a sequence of words that are likely to come next. So it answers, “On a sunny, cloudless day, the color of the sky is typically a deep shade of blue.” If you then reply, “How about on an overcast day?,” it understands that you really mean to ask, in continuation of your prior question, “What color is the sky on an overcast day?” This ability to remember and contextualize inputs is what gives ChatGPT the ability to carry on some semblance of an actual human conversation rather than simply providing one-off answers like a souped-up Magic 8 ball.

The trouble is that ChatGPT’s memory—and the memory of large language models more generally—is terrible. Each time a model generates a response, it can take into account only a limited amount of text, known as the model’s context window. ChatGPT has a context window of roughly 4,000 words—long enough that the average person messing around with it might never notice but short enough to render all sorts of complex tasks impossible. For instance, it wouldn’t be able to summarize a book, review a major coding project, or search your Google Drive. (Technically, context windows are measured not in words but in tokens, a distinction that becomes more important when you’re dealing with both visual and linguistic inputs.)

[Read: ChatGPT changed everything. Now its follow-up is here.]

For a vivid illustration of how this works, tell ChatGPT your name, paste 5,000 or so words of nonsense into the text box, and then ask what your name is. You can even say explicitly, “I’m going to give you 5,000 words of nonsense, then ask you my name. Ignore the nonsense; all that matters is remembering my name.” It won’t make a difference. ChatGPT won’t remember.

With GPT-4, the context window has been increased to roughly 8,000 words—as many as would be spoken in about an hour of face-to-face conversation. A heavy-duty version of the software that OpenAI has not yet released to the public can handle 32,000 words. That’s the most impressive memory yet achieved by a transformer, the type of neural net on which all the most impressive large language models are now based, says Raphaël Millière, a Columbia University philosopher whose work focuses on AI and cognitive science. Evidently, OpenAI made expanding the context window a priority, given that the company devoted a whole team to the issue. But how exactly that team pulled off the feat is a mystery; OpenAI has divulged pretty much zero about GPT-4’s inner workings. In the technical report released alongside the new model, the company justified its secrecy with appeals to the “competitive landscape” and “safety implications” of AI. When I asked for an interview with members of the context-window team, OpenAI did not answer my email.

[Read: What have humans just unleashed?]

For all the improvement to its short-term memory, GPT-4 still can’t retain information from one session to the next. Engineers could make the context window two times or three times or 100 times bigger, and this would still be the case: Each time you started a new conversation with GPT-4, you’d be starting from scratch. When booted up, it is born anew. (Doesn’t sound like a very good therapist.)

But even without solving this deeper problem of long-term memory, just lengthening the context window is no easy thing. As the engineers extend it, Millière told me, the computation power required to run the language model—and thus its cost of operation—increases exponentially. A machine’s total memory capacity is also a constraint, according to Alex Dimakis, a computer scientist at the University of Texas at Austin and a co-director of the Institute for Foundations of Machine Learning. No single computer that exists today, he told me, could support, say, a million-word context window.

Some AI developers have extended language models’ context windows through the use of work-arounds. In one approach, the model is programmed to maintain a working summary of each conversation. Say the model has a 4,000-word context window, and your conversation runs to 5,000 words. The model responds by saving a 100-word summary of the first 1,100 words for its own reference, and then remembers that summary plus the most recent 3,900 words. As the conversation gets longer and longer, the model continually updates its summary—a clever fix, but more a Band-Aid than a solution. By the time your conversation hits 10,000 words, the 100-word summary would be responsible for capturing the first 6,100 of them. Necessarily, it will omit a lot.

[Read: GPT-4 might just be a bloated, pointless mess]

Other engineers have proposed more complex fixes for the short-term-memory issue, but none of them solves the rebooting problem. That, Dimakis told me, will likely require a more radical shift in design, perhaps even a wholesale abandonment of the transformer architecture on which every GPT model has been built. Simply expanding the context window will not do the trick.

The problem, at its core, is not really a problem of memory but one of discernment. The human mind is able to sort experience into categories: We (mostly) remember the important stuff and (mostly) forget the oceans of irrelevant information that wash over us each day. Large language models do not distinguish. They have no capacity for triage, no ability to distinguish garbage from gold. “A transformer keeps everything,” Dimakis told me. “It treats everything as important.” In that sense, the trouble isn’t that large language models can’t remember; it’s that they can’t figure out what to forget.








Питчинг Релиза. Отправить релиз на Питчинг.

В мэрии назвали условия присвоения Элджею звания почётного жителя

Два дня инноваций: семинар для молодых сотрудников здравоохранения в Астрахани

Ана Каспарян поднимает вопросы Геноцида армян, этнических чисток в Арцахе и роли Израиля в конфликте — в откровенном интервью с Такером Карлсоном. ВИДЕО


Weah’s agent: One Juventus director ‘is creating problems’

Kolo Muani: Juventus prepare new offer but face Man United and Chelsea threat

UFC Abu Dhabi live blog: Shara Bullet vs. Marc-Andre Barriault

The Great Indian Kapil Show: Raghav Chadha reveals telling Parineeti Chopra to manifest he will never become the PM; says ‘Yeh jo bolti hai wo ulta hota hai’


стела Освободителям Ростова

Нагорный Карабах - сторона конфликта в переговорном процессе в рамках Минской группы ОБСЕ. ВИДЕО

ТСМ готовит территорию под реконструкцию ростовского участка трассы М-4

Utrace запускает услугу по валидации IT-систем для фармацевтического рынка


Fretless — The Wrath of Riffson — музыка спасёт мир. Рецензия

Quarantine Zone creator reveals 3 reasons the zombie sim went viral on TikTok

«Если бы у Наруто и AC Shadows был ребёнок»: Разбор англоязычной версии Where Winds Meet

Первый трейлер Battlefield 6



Александр Михайлов (GSOC): «Безопасность IT-экосистемы — это зона нулевого доверия к подрядчикам»

Где живут и на чем ездят самые аварийные водители России?

Optima Development: Новый сквер и фитнес-клуб

Росгвардия обеспечила безопасность празднования Дня ВМФ и футбольного матча в Москве


Дебошир с авирейса Томск-Москва приговорен к году исправительных работ

Первый прямой рейс из Москвы приземлился в Пхеньяне

В Санкт-Петербурге обсудили внедрение ИИ в разработку и оптимальные корпоративные архитектуры

Педагоги из Китая, Монголии, Таиланда и Узбекистана получили сертификаты Иркутского политеха


Экс-футболист «Зенита» отказался от перехода в «Спартак», пишут СМИ

MWM: Германия планирует наносить удары по Москве ракетами Tomahawk США

Прошла испытания система дистанционной передачи данных для корректировки навигационных карт

Прокуратура: инцидент со сбоем систем "Аэрофлота" в Шереметьево на контроле


Россиянин Сидоренко выиграл золото Универсиады в настольном теннисе

Кудерметова пробилась во второй раунд турнира в Монреале.

«Краснодар» — «Локо», UFC и матч Калинской: что посмотреть сегодня

Рахимова обыграла Шарму и вышла в основную сетку турнира WTA в Монреале


В Петрозаводске жених пришел на свадьбу в костюме Дарта Вейдера

Кто заставил Зеленского предложить России новый раунд переговоров: В Британии показали пальцем

Сбежавший в Дубай блогер Subo обвинён в уходе от налогов и отмывании денег на 50 млн рублей: В России за него отвечают отец и брат

В Подмосковье питбайкеру едва не отрезало голову натянутой на дороге проволокой


Музыкальные новости

Будь собой, а не "звездой": "Europarty" от White Queen

Мик Джаггер отпраздновал 82-летие с молодой невестой и их сыном 

Фёдор Шаляпин женился на 37-летней победительнице шоу «Кондитер»

Пресняков-старший считает Москву безопаснее Нью-Йорка и Парижа


Адвокат Гаврилова раскрыла, чего добивается семья Тиммы после его смерти

Optima Development: Новый сквер и фитнес-клуб

Росгвардия обеспечила безопасность празднования Дня ВМФ и футбольного матча в Москве

Где живут и на чем ездят самые аварийные водители России?


Законченные «Циники»: Верник вышел в свет с Гухман, Редькин выпустил комикс

«Россети Центр» повышают надежность работы трансформаторных подстанций в Смоленской области

В депо «Чита» будет установлен первый цифровой весоизмерительный комплекс системы подачи песка под колесные пары локомотива

Как начать петь. Как начать петь песни. Как начать петь с нуля


На МКАД авария затруднила движение авто

НПС построит два велопешеходных моста через Москву-реку

В Кот-д'Ивуаре в результате аварии с участием автобуса и самосвала погибли 16 человек.

Курс на мечту: «Национальная Лотерея» и РОЛЬФ вручили новый автомобиль победителю розыгрыша в честь запуска «Автомобильной лотереи «РОЛЬФ»


Путин в День ВМФ прибыл на территорию Главного Адмиралтейства в Санкт-Петербурге

«Подводная лодка, демонтрированная Путину, произвела шок на Западе»

Путин поздравил Жапарова с юбилеем подписания декларации о союзничестве.

«Внезапно»: Запад встревожен новым указом Путина


Приговор экс-руководителю компании по производству вакцин против ковида был смягчен.



Сеть клиник «Будь Здоров» открыла первый травмпункт сети на базе клиники на Сретенке

Optima Development: Новый сквер и фитнес-клуб

Ночные перекусы в отпуске: доктор Садыков о том, как они влияют на микрофлору и вес

Клиника гнатологии – лечение ВНЧС и восстановление прикуса


Кто заставил Зеленского предложить России новый раунд переговоров: В Британии показали пальцем

Киевский режим применил все 18 пакетов санкций ЕС

Зеленский настаивает: встреча с Путиным до конца августа с участием Европы

Запад ударил Зеленского по самому больному месту – кошельку: Киев показательно лишили 1,5 миллиардов помощи


Команда столичного управления МЧС России готовится к участию во Всероссийских соревнованиях по пожарно-спасательному спорту

Чемпионат по военно-спортивному многоборью среди росгвардейцев завершился в Грозном

Росгвардия обеспечила безопасность празднования Дня ВМФ и футбольного матча в Москве

Чемпионат по военно-спортивному многоборью среди росгвардейцев завершился в Грозном


Лукашенко дал интервью одному из американских СМИ

«Беларусь-1»: Лукашенко дал интервью одному из американских СМИ

Лукашенко получил приглашения от стран Латинской Америки и Азии для визитов.


Собянин в День работника МФЦ поздравил сотрудников центров госуслуг Москвы

Сергей Собянин назвал инновационные разработки, которые внедрили в Москве

Собянин: На территории промзоны «Кирпичные улицы» будет создана социнфраструктура

Сергей Собянин. Главное за день


Александр Михайлов (GSOC): «Безопасность IT-экосистемы — это зона нулевого доверия к подрядчикам»

Самолёт совершил первый прямой авиарейс из Москвы в Пхеньян

Зачем Минприроды Свердловской области планирует организовать полигон отходов на участке, где идёт поиск питьевой воды?

Почему технологии ПВВК безопасны и эффективны, химия и экология воды по мнению Алексея Горшкова


В Петрозаводске жених пришел на свадьбу в костюме Дарта Вейдера

В Подмосковье питбайкеру едва не отрезало голову натянутой на дороге проволокой

Телеведущая Виктория Лопырева опубликовала фото с матерью

«Аэрофлот» отменил 42 рейса из-за сбоя в работе информационных систем


Путин дал указание рассмотреть проблемы онкологии в Архангельской области.

В музее-заповеднике «Архангельское» пройдут «Jazzовые сезоны»

70 участников СВО в Архангельске показали мотивацию выше госслужащих — Цыбульский

В Архангельске представили киноальманах «Север, я люблю тебя!» по произведениям современных писателей


Сколько пассажиров прибывают в Крым летом на поездах ежедневно

Прогноз погоды в Крыму на 27 июля

К парню с костылем подошли трое с требованием уступить. Он был готов, но заступилась бабушка по соседству

В Крыму из-за дыма от пожара столкнулись девять автомобилей


Кто заставил Зеленского предложить России новый раунд переговоров: В Британии показали пальцем

«Аэрофлот» отменил 42 рейса из-за сбоя в работе информационных систем

В Подмосковье питбайкеру едва не отрезало голову натянутой на дороге проволокой

Сбежавший в Дубай блогер Subo обвинён в уходе от налогов и отмывании денег на 50 млн рублей: В России за него отвечают отец и брат














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *