Добавить новость
smi24.net
News in English
Март
2024

Uh oh — it looks like ChatGPT's AI model got lazy again

0
GPT-4 users have been complaining that the model has gotten lazy again.
  • OpenAI's top model has a problem: it seems to keep getting lazy.
  • Users of GPT-4 have taken to the ChatGPT maker's forum to complain.
  • They're so frustrated that they're looking to rival AI models until there's a fix.

OpenAI's GPT-4 seems to have gotten lazy — again.

This time, though, frustrated users of the model powering ChatGPT's paid-for service aren't hanging around for a quick fix.

They're looking to other models instead, with one, in particular, grabbing their attention: Anthropic's Claude.

OpenAI's top model still seems lazy

In recent days, users of GPT-4, first released in March 2023, have been taking to OpenAI's developer forum and social media to vent about the model seemingly being far less capable than it once was.

Some complain about it not following "explicit instructions" by providing truncated code when asked for complete code. Others cite issues with getting the model to respond to their queries altogether.

"The reality is that it has become unusable," one user wrote on OpenAI's online forum last week.

What's frustrating users is that it's not the first time performance has lagged on a model not only meant to be OpenAI's finest — but one they're paying $20 a month to use.

As my colleague Alistair Barr first reported, signs that GPT-4 was getting lazier and dumber emerged in summer last year. The model seemed to be having trouble as it exhibited "weakened logic," while returning wrong responses to users.

More evidence of laziness emerged again earlier this year, with OpenAI CEO Sam Altman even acknowledging that GPT-4 had been lazy. He posted on X in February that a fix had been issued to address complaints.

Back when signs of weakness first emerged though, no other company had released a model that — on paper at least — had remotely comparable performance to GPT-4, keeping users attached to the company that arguably triggered last year's generative AI craze.

That's not the case now.

GPT-4 alternatives emerge

In the face of a fresh batch of issues with GPT-4, users have been experimenting with a bunch of other models that have since emerged that not only match OpenAI's top model but seem to outperform it, too.

Take Anthropic's Claude. The OpenAI rival, backed by the likes of Google and Amazon, released a premium version of its Claude model earlier this month called Claude 3 Opus. Think of it as an equivalent to GPT-4.

On its release, Anthropic shared data that compared Claude 3 Opus' performance to its peers across several benchmarks like "undergraduate level knowledge," "math problem-solving," "code," and "mixed evaluations." Across almost all of them, Claude came out on top.

It's not just Anthropic's data that says its model is better. This week, Claude 3 Opus overtook GPT-4 on LMSYS Chatbot Arena, an open platform for evaluating AI models.

Of course, there's a difference between something looking good on paper versus being able to deliver in practice. So in the wake of GPT-4's problems, even OpenAI loyalists have had plenty of incentive to try alternatives like Claude.

It's clear many are more than impressed.

After a coding session with Claude 3 Opus, software engineer Anton concluded on X last week that it crushed GPT-4. "I don't think standard benchmarks do this model justice," he wrote.

Angel investor Allie K. Miller acknowledged that GPT-4 feels worse than it was a few months ago. "Most folks I know are using Claude 3," she wrote, as well as Mistral AI's Mixtral 8x7B model.

Wharton professor Ethan Mollick even found Claude 3 to be better versed in J.R.R. Tolkien's constructed Elvish languages of Sindarin and Quenya. "When asked to translate 'My hovercraft is full of eels' Claude 3 does an original translation, GPT-4 searches the web," he wrote on X.

On OpenAI's forum, meanwhile, users have been describing Claude as far more reliable for tasks like coding, and have described Claude 3 Opus as akin to the sharper performance GPT-4 had upon its release.

OpenAI did not respond to a request for comment from BI on GPT-4's performance issues.

Some, like Miller, don't necessarily think the issues are reason enough to ditch OpenAI altogether. The dip in performance, they say, might be because "OpenAI is focused on the next model," and could be devoting resources towards that.

This might be so. As my colleagues Kali Hays and Darius Rafieyan reported this month, OpenAI is poised to release GPT-5 by mid-year.

The least it can do is not be lazy.

Read the original article on Business Insider







Игровые терминалы в ТЦ: союз ради будущего

Оркестр полиции Республики Сербской впервые выступит на фестивале «Спасская башня» в Москве

118 лет назад, 25 июля 1907 года, Ставропольская психиатрическая больница приняла первых 47 пациентов

Рэпер Баста открыл свой ресторан в Marins Park Hotel Екатеринбург


Why Juventus spent 111m this summer for only one new player

La UFC anuncia un mes de octubre mayúsculo

Las 'Guerreras del Agua' se dan un baño de bronce en el Mundial de Singapur

Brit Who Fought Usyk Calls For Daniel Dubois To ‘Leave The Sport’ After Staying Down In Rematch


Monochamus scutellatus

Navicon представляет комплексную систему для интегрированного управления данными

Компания MONT расширила ИБ-портфель отечественной системой exploitDog

Свято Боголюбский Женский Монастырь


Brütal Legend is free in honor of Ozzy Osbourne, but only for 666 minutes

'I destroyed months of your work in seconds' says AI coding tool after deleting a devs entire database during a code freeze: 'I panicked instead of thinking'

The dairy industry would like Gen Z to drink more milk, so they made a Fortnite diner tycoon game

Краткая биографическая справка о центральных персонажах Mafia: The Old Country



«Каникулы с Росгвардией» проходят в регионах Центральной России

В Третьяковке на Кадашевской набережной открылся концертный зал

В депо «Чита» будет установлен первый цифровой весоизмерительный комплекс системы подачи песка под колесные пары локомотива

«Деловые Линии» сократили сроки авиаперевозок по более чем 4400 направлений по России


Оркестр полиции Республики Сербской впервые выступит на фестивале «Спасская башня» в Москве

На МКАД в Москве произошло массовое ДТП, движение затруднено

Несколько автомобилей столкнулись на внешней стороне 92-го км МКАД

Жертва перестройки — почему эта Волга была обречена


Мостовой назвал точный счёт матча «Спартак» - «Балтика»

ВДНХ приглашает волонтёров для помощи посетителям выставки

Сотрудники органов принудительного исполнения обеспечивают безопасность судебных процессов

Ученый Толстых объяснил, что московские ливни вызваны мощным атлантическим циклоном


Россиянин Сидоренко выиграл золото Универсиады в настольном теннисе

«Следующая остановка — Монреаль!» Потапова полетела в Канаду для участия в «тысячнике»

Медведев обыграл У Ибина и вышел в 1/4 финала турнира в Вашингтоне

Соболенко сохраняет первое место в чемпионской гонке WTA.


Больше 20 поездов задерживаются из-за падения обломков БПЛА на юге России (Обновлено!)

В Самарской области за полгода открыто 410 вакансий для сисадминов, что на 22% меньше, чем годом ранее

Движeниe нa Зaпοpοжьe: pοccийcκиe вοйcκa ɜaшли в Ϲтeпнοгοpcκ

Синоптик Тишковец: череда тропических ливней в Москве завершена


Музыкальные новости

Он не любил, когда наполовину: каким был Владимир Высоцкий

Невозможное возможно: две подопечные фонда «Жизнь в Движении» с ограниченными возможностями покорят вершину Эльбруса

Оркестр полиции Республики Сербской впервые выступит на фестивале «Спасская башня» в Москве

Наталья Фриске показала дочь в костюме врача и поведала о своем самочувствии


В Третьяковке на Кадашевской набережной открылся концертный зал

«Деловые Линии» сократили сроки авиаперевозок по более чем 4400 направлений по России

«Каникулы с Росгвардией» проходят в регионах Центральной России

В депо «Чита» будет установлен первый цифровой весоизмерительный комплекс системы подачи песка под колесные пары локомотива


Okko и ТНТ выпустят драмеди про трёх сестёр «Хай, систерс»

«Плюнули в лицо сотням тысяч молдаван»: как Санду готовит тотальный захват власти в Молдове

AI Певица. Создание AI Певицы. AI Певец. AI Артист.

В Москве завершился сбор с руководителями финансово-экономических подразделений Центрального округа Росгвардии


В столичном главке Росгвардии проведён смотр спецтехники

Несколько автомобилей столкнулись на внешней стороне 92-го км МКАД

В Москве росгвардейцы оказали помощь пострадавшей в ДТП мотоциклистке (видео)

На МКАД в Москве произошло массовое ДТП, движение затруднено


У Путина есть роскошный подарок для Китая: США схватились за голову, узнав о нем

"Ультиматум Трампа: потенциальные последствия для Путина"

В сентябре Путину будет представлена обновленная программа строительства кораблей для ВМФ.

Соболезнования в связи с авиакатастрофой в Амурской области выразили зарубежные лидеры


Штамм коронавируса "стратус" захватил 22% всех вирусных заболеваний в Москве

Депздрав Москвы: новый штамм коронавируса "стратус" фиксируют в Москве с мая

Новый штамм коронавируса "стратус" фиксируют в Москве с мая

Депздрав Москвы оценил ситуацию с распространением нового штамма коронавируса



Utrace запускает услугу по валидации IT-систем для фармацевтического рынка

Фитнес-марафоны на паузе: суд продлил домашний арест блогеру Лерчек

Новый штамм коронавируса "стратус" фиксируют в Москве с мая

Пластический хирург Софья Абдулаева: подтяжка груди нитями - эффективно ли это


Британский журналист: Зеленский - мелкий жулик и крыса, которому «недолго осталось» в этом мире


Две трети россиян считают, что спортсмены зарабатывают слишком много

"Монсон о спортсменах, которые меняют гражданство в сложный период для России"

Пять земельных участков для размещения НКО доступны на городских торгах

«Каникулы с Росгвардией» проходят в регионах Центральной России


Лукашенко заявил, что в Белоруссии «на всякий случай» готовятся к войне

Лукашенко с иронией отнесся к санкциям, запрещающим ему въезд в Эстонию

Лукашенко поделился мнением о самой идеальной профессии.

Лукашенко посоветовал не злить его и не допускать падежа в животноводстве


Сергей Собянин поздравил москвича — победителя международной олимпиады по физике

Мэр Москвы: Улучшим транспортную доступность Южного и Северного Бутова

Сергей Собянин осмотрел Дом-музей Федора Конюхова

Сергей Собянин. Главное за день


Москвичи теперь должны платить за зарядку своих электромобилей

В центре внимания: CorpSoft24 вошел в рейтинг крупнейших ИТ-компаний России

Исследование выявило снижение инвестиций в экологически чистую энергетику США.

Бурмистров: лисы могут появляться на улицах Москвы в период расселения


Как мы в Fix Price автоматизировали создание рекламных видео

После ареста иномарки в Подмосковье должник погасил задолженность по алиментным платежам

Ученый Толстых объяснил, что московские ливни вызваны мощным атлантическим циклоном

Еще одно здание ГБУ «Жилищник» появится во Внукове


В Нарьян-Маре из-за холодов возобновили подачу отопления в дома

Настольный термотрансферный принтер штрих-кодов iDPRT iE4P

Путин дал указание рассмотреть проблемы онкологии в Архангельской области.

70 участников СВО в Архангельске показали мотивацию выше госслужащих — Цыбульский


Россияне выбирают Крым для отдыха с детьми – названы города-лидеры

Лавандовое поле горит в Симферопольском районе Крыма

В Симферополе на базе «Клинического госпиталя для ветеранов войн» функционирует гериатрический центр для пожилых людей с возрастными нарушениями

"Россия дала мне возможность быть счастливым": Джефф Монсон в Крыму


Движeниe нa Зaпοpοжьe: pοccийcκиe вοйcκa ɜaшли в Ϲтeпнοгοpcκ

Как мы в Fix Price автоматизировали создание рекламных видео

Синоптик Тишковец: череда тропических ливней в Москве завершена

Несколько автомобилей столкнулись на внешней стороне 92-го км МКАД














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *