Добавить новость
smi24.net
News in English
Март
2023

GPT-4 is bigger and better than ChatGPT—but OpenAI won’t say why

0

OpenAI has finally unveiled GPT-4, its next-generation large language model. Its last surprise hit, ChatGPT, was always going to be a hard act to follow, but the San Francisco–based company has made GPT-4 even bigger and better.

Yet how much bigger and why it’s better, OpenAI won’t say. GPT-4 is the most secretive release the company has ever put out, marking its full transition from nonprofit research lab to for-profit tech firm.

“That’s something that, you know, we can’t really comment on at this time,” said OpenAI’s chief scientist, Ilya Sutskever, when I spoke to the GPT-4 team in a video call an hour after the announcement. “It’s pretty competitive out there.”

Access to GPT-4 will be available to users who sign up to the waitlist and for subscribers of the premium paid-for ChatGPT Plus in a limited, text-only capacity.

GPT-4 is a multimodal large language model, which means it can respond to both text and images. Give it a photo of the contents of your fridge and ask it what you could make, and GPT-4 will try to come up with recipes that use the pictured ingredients.

“The continued improvements along many dimensions are remarkable,” says Oren Etzioni at the Allen Institute for AI. “GPT-4 is now the standard by which all foundation models will be evaluated.”

“A good multimodal model has been the holy grail of many big tech labs for the past couple of years,” says Thomas Wolf, cofounder of Hugging Face, the AI startup behind the open-source large language model BLOOM. “But it has remained elusive.”

In theory, combining text and images could allow multimodal models to understand the world better. “It might be able to tackle traditional weak points of language models, like spatial reasoning,” says Wolf.

It is not yet clear if that’s true for GPT-4. OpenAI’s new model appears to be better at some basic reasoning than ChatGPT, solving simple puzzles such as summarizing blocks of text in words that start with the same letter. In my demo, I was shown GPT-4 summarizing the announcement blurb from OpenAI’s website using words that begin with g: “GPT-4, groundbreaking generational growth, gains greater grades. Guardrails, guidance, and gains garnered. Gigantic, groundbreaking, and globally gifted.” In another demo, GPT-4 took in a document about taxes and answered questions about it, citing reasons for its responses.

It also outperforms ChatGPT on human tests, including the Uniform Bar Exam (where GPT-4 ranks in the 90th percentile and ChatGPT ranks in the 10th) and the Biology Olympiad (where GPT-4 ranks in the 99th percentile and ChatGPT ranks in the 31st). “It’s exciting how evaluation is now starting to be conducted on the very same benchmarks that humans use for themselves,” says Wolf. But he adds that without seeing the technical details, it’s hard to judge how impressive these results really are.

According to OpenAI, GPT-4 performs better than ChatGPT, which was based on a version of the firm’s previous technology, GPT-3, because it is a larger model with more parameters (the values in a neural network that get tweaked during training). This follows an important trend that the company discovered with its previous models. GPT-3 outperformed GPT-2 because it was more than 100 times larger, with 175 billion parameters to GPT-2’s 1.5 billion. “That fundamental formula has not really changed much for years,” says Jakub Pachocki, one of GPT-4’s developers. “But it’s still like building a spaceship, where you need to get all these little components right and make sure none of it breaks.” 

But OpenAI has chosen not to reveal how large GPT-4 is. In a departure from its previous releases, the company is giving away nothing about how GPT-4 was built—not the data, the amount of computing power, or the training techniques. “OpenAI is now a fully closed company with scientific communication akin to press releases for products,” says Wolf.

OpenAI says it spent six months making GPT-4 safer and more accurate. According to the company, GPT-4 is 82% less likely than GPT-3.5 to respond to requests for content that OpenAI does not allow, and 60% less likely to make stuff up.

OpenAI says it achieved these results using the same approach it took with ChatGPT, using reinforcement learning via human feedback. This involves asking human raters to score different responses from the model and using those scores to improve future output.

The team even used GPT-4 to improve itself, asking it to generate inputs that led to biased, inaccurate, or offensive responses and then fixing the model so that it refused such inputs in future.    

GPT-4 may be the best multimodal large language model yet built. But it is not in a league of its own, as GPT-3 was when it first appeared in 2020. A lot has happened in the last three years. Today GPT-4 sits alongside other multimodal models, including Flamingo from DeepMind. Hugging Face is working on an open-source multimodal model that will be free for others to use and adapt, says Wolf.

Faced with such competition, OpenAI is treating this release more as a product tease than a research update. Early versions of GPT-4 have been shared with some of OpenAI’s partners, including Microsoft, which confirmed today that it used a version of GPT-4 to build Bing Chat. OpenAI is also now working with Stripe, Duolingo, Morgan Stanley, and the government of Iceland (which is using GPT-4 to help preserve the Icelandic language), among others. 

Many other companies are waiting in line: “The costs to bootstrap a model of this scale is out of reach for most companies but the approach taken by OpenAI has made large language models very accessible to startups,” says Sheila Gulati, cofounder of the investment firm Tola Capital. “This will catalyze tremendous innovation on top of GPT-4.”

And yet large language models remain fundamentally flawed. GPT-4 can still generate biased, false, and hateful text; it can also still be hacked to bypass its guardrails. Though OpenAI has improved this technology, it has not fixed it by a long shot. The company claims that its safety testing has been sufficient for GPT-4 to be used in third-party apps. But it is also braced for surprises.

“Safety is not a binary thing; it is a process,” says Sutskever. “Things get complicated any time you reach a level of new capabilities. A lot of these capabilities are now quite well understood, but I’m sure that some will still be surprising.” 

Even Sutskever suggests that going slower with releases might sometimes be preferable: “It would be highly desirable to end up in a world where companies come up with some kind of process that allows for slower releases of models with these completely unprecedented capabilities.”








Благотворительная акция ко Всемирному Дню офтальмологии от детских глазных клиник «Ясный Взор»

Сеть клиник «Будь Здоров» открыла первый травмпункт сети на базе клиники на Сретенке

Только смелым покоряются моря

Забайкальский филиал "ЛокоТех-Сервис" показал уверенный рост в первом полугодии


All the news from Nintendo’s July 2025 Direct showcase

AI and robots can help the world grow more food—even if they’re still not quite as good as a human farmer

Is eBay actually sexy again as the ecommerce old-timer’s stock surges to an all-time high?

'Not ready for prime time': Trump, Republicans slam GOP leader's stock trade ban bill


Во Владивостоке досрочно обновили Русский мост

Новая эра гибридных атак разблокирована

Стали известны подробности убийства детского тренера под Екатеринбургом

Перевозки металлопродукции, инструментов и комплектующих стали чаще заказывать при выборе межтерминальной доставки – «Деловые Линии»


Bungie continues to fire into its feet with both barrels: A new armor set in Destiny 2 has just been disabled because it makes the player who wears it completely invisible

Color Maze Adventure 2.0.0

If you'd like to see Meta's AI gunk purged from WhatsApp, a new antitrust investigation in Italy might just do the trick

Разработчики The Seven Deadly Sins: Origin ответили на частые вопросы игроков



Сооружения сервисного участка «Свердловск-Пассажирский» стали арт-объектом

Забайкальский филиал "ЛокоТех-Сервис" показал уверенный рост в первом полугодии

«ЛокоТех» проводит комплексную оценку знаний специалистов службы качества

В Корпоративном университете «ЛокоТех» за первое полугодие 2025 года обучено более 2500 человек и создано 8 новых программ


В Корпоративном университете «ЛокоТех» за первое полугодие 2025 года обучено более 2500 человек и создано 8 новых программ

Сооружения сервисного участка «Свердловск-Пассажирский» стали арт-объектом

Трамп заявил, что Индия откажется от российской нефти ради сделки с США

Говырин рассказал, на какую пенсию можно рассчитывать, если не работать


Московский зоопарк ищет неродственную "невесту" для манула Тимоши

Военкор Стешин: интерес к Волге — тревожный звонок для России из Средней Азии

Обвинение в убийстве и эмиграция. Судьба актёров фильма «Петровка, 38»

Трамп: Індія та росія — «мертві економіки»


Сафиуллин проиграл Рууду во втором круге турнира ATP в Торонто

Новак Джокович вошел в число инвесторов футбольного клуба

Андреева проиграла первый матч после Уимблдона. Мирра падала и плакала, ей вызывали врача

Калинская вышла в третий раунд турнира в Монреале


Говырин рассказал, на какую пенсию можно рассчитывать, если не работать

Начальник филиала «Трансэнерго» арестован за мошенничество

Теракт в "Крокус Сити Холле": террористу перевели 2 млн рублей перед атакой

Московский зоопарк ищет неродственную "невесту" для манула Тимоши


Музыкальные новости

Светлана Сурганова устроит в Воронеже «летник» с оркестром

Мама Тимати об 11-летней Алисе, которая снялась в кино: «Внучку ругаю регулярно»

Купить Песню. Песни на продажу. Продажа песен.

Ремикс Песни. Создание ремикса Песни. Создание Хитового ремикса песни.


BMW: важна каждая деталь

Сооружения сервисного участка «Свердловск-Пассажирский» стали арт-объектом

«ЛокоТех» проводит комплексную оценку знаний специалистов службы качества

В Корпоративном университете «ЛокоТех» за первое полугодие 2025 года обучено более 2500 человек и создано 8 новых программ


SEVAK на МТС Live Лето! Like FM дарит билеты

Порфтолио AI. Портфолио AI Певца.

50 мгновений Максима Аверина. За сколько продаётся «Аверин»

«ЛокоТех» проводит комплексную оценку знаний специалистов службы качества


BMW: важна каждая деталь

В Подмосковье на видео сняли, как мужчины пытались перевернуть авто после ДТП

В Москве росгвардейцы задержали курьера, подозреваемого в краже техники

Женщина-пешеход погибла при столкновении двух машин в Ясенево


Путин выразил приветствие участникам фестиваля «Таврида-АРТ»

Трамп встречает Иванку, Не Москва, 1987

Народный депутат призвал к действиям после встречи Путина с Лукашенко

В Севастополе кинотеатр "Россия" превратят в филиал Национального центра по поручению Путина


NYT сообщает, что ЕК не сохранила переписку фон дер Ляйен с руководством Pfizer

Исследование показывает зависимость между темпами развития COVID-19 и уровнем смертности

Руководитель РФПИ охарактеризовал переписку фон дер Ляйен с Pfizer как позорный инцидент



Объявлена процедура получения налогового вычета за медицинские услуги

Врач-косметолог Зухра Балакеримова: какие косметологические процедуры стоит сделать именно летом

В столичном главке Росгвардии оттачивают навыки тактической медицины на инструкторско-медицинских сборах

Пластический хирург Софья Абдулаева: как используют собственный жир для омоложения лица


Число погибших из-за удара России по Киеву возросло до 31 – власти

Огромный забор и бомбоубежища: что известно о резиденции Зеленского под Киевом

Президент Польши Навроцкий потребовал от Зеленского изменить историческую политику Киева

Путин: если Киев считает, что сейчас не время для переговоров, Москва готова ждать


Точно в цель – топ-3 гольф-клубов в окружении «Москва-Сити»

В Москве встретили фехтовальщиц сборной РФ, вернувшихся с чемпионата мира

Мероприятия в рамках акции «Каникулы с Росгвардией» проходят в регионах Центральной России

Викторины и квесты пройдут на столичной ВДНХ в честь 86-летия выставки


Путин и Лукашенко соберутся на неформальные переговоры

Путин и Лукашенко беседуют в окружении белорусского шпица

Лукашенко прокомментировал ситуацию с БПЛА в Минске

Путин и Лукашенко встретятся для переговоров на Валааме


Сергей Собянин. Главное за день

Собянин: 220 тыс. семей переезжают в новые дома по программе реновации Москвы

Собянин поздравил победителей конкурса «Большая перемена»

Собянин: 220 тыс. москвичей получили жилье или готовятся к переезду по реновации


Казахстан положил глаз на Волгу: Россия когда-то отказала, но Астана нашла обходной путь

Жители Первомайского района «одобрили» строительство мусорного завода, хотя власти все еще в «раздумьях»

В России за сутки ликвидировано 66 лесных пожаров

Московский зоопарк ищет неродственную "невесту" для манула Тимоши


Как спасти печень: три правила от наркологов Подмосковья

Депутат назвал минимальную выплату неработающим пенсионерам в 2025 году

Обвинение в убийстве и эмиграция. Судьба актёров фильма «Петровка, 38»

Пенсии в 2025: социальные выплаты достигнут 15 000 рублей для неработающих


В администрации муниципального образования «Городской округ «Город Нарьян-Мар» выявлены нарушения законодательства о противодействии коррупции

В Красногорске дали старт строительству тоннеля от будущей станции метро «Липовая роща»

Еще немного. Мэр Собянин запустил проходку тоннеля от «Липовой рощи»

Заболевание клещевым энцефалитом в Подмосковье: 10,5 тыс. случаев укусов


Как выбрать надежного застройщика: советы покупателям

Крыму и еще 27 регионам списали долги по бюджетным кредитам на 58 млрд

Правительство РФ планирует приватизировать известные ликеро-водочные заводы

Цены на новостройки в июле 2025 года: Севастополь лидирует, Симферополь чуть отстаёт


Московский зоопарк ищет неродственную "невесту" для манула Тимоши

Начальник филиала «Трансэнерго» арестован за мошенничество

В Благовещенске и Хэйхэ проходит международный заплыв «Дружба»

Обвинение в убийстве и эмиграция. Судьба актёров фильма «Петровка, 38»














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *