Исследование: ChatGPT и DeepSeek превзошли студентов в тестах для медэкзамена

20.08.2025 14:47

Vademec.ru

ChatGPT-4o – продукт американской компании QpenAI, одна из самых популярных коммерческих моделей, доступная только по подписке. DeepSeek DeepThink R1 – китайская разработка, ориентированная на сложные задачи рассуждения и предоставляемая бесплатно.

Ученые использовали базу вопросов AMBOSS – популярный тренажер для подготовки к экзаменам USMLE в США. В анализ вошли задания разной тематики и сложности. Распределение вопросов в платформе AMBOSS характеризовалось смещением в сторону легкого уровня сложности: 2 554 легких вопроса (43,9%), 1 896 вопросов средней сложности (32,6%) и 1 373 сложных вопроса (23,6%). Для обеспечения сбалансированного представления каждого уровня сложности в анализе с помощью встроенного генератора случайных вопросов платформы AMBOSS было отобрано по 10 вопросов каждого уровня сложности для каждой категории, что в совокупности составило 540 вопросов для каждого экзамена.

Сбор результатов осуществлялся путем прямого копирования вопросов и вариантов ответов с веб-сайта AMBOSS и их последующей вставки в онлайн-версии моделей GPT-4o (последнее обновление: май 2024 года) и DeepSeek DeepThink R1 (последнее обновление: октябрь 2023 года) без каких-либо изменений. Каждый вопрос вводился индивидуально в чат-интерфейс большой языковой модели без дополнительных команд для обеспечения единообразия форматирования между обеими моделями. Для каждого вопроса регистрировался бинарный показатель правильности ответа модели с учетом уровня сложности вопроса.

На простых вопросах ChatGPT отвечал правильно в 95% случаев, DeepSeek – в 93%, тогда как студенты справлялись лишь в 76% случаев. На заданиях средней сложности показатели составили 89% y ChatGPT, 78% – у DeepSeck и 55% – у студентов. На самых трудных вопросах разрыв оказался максимальным: точность ChatGPT – 80%, DeepSeek – 63%, а у студентов всего 36%. Разработка OpenAI оказалась «умнее» своего китайского конкурента в части вопросов по эндокринологии, гастроэнтерологии, иммунологии, мультисистемных заболеваний и ряда других разделов, причем разрыв в результатах моделей был несущественным, когда акцент делался на клиническом мышлении.

По мнению исследователей, критический подход и проверка источников остаются ключевыми условиями при работе с ИИ-ассистентами. Только в таком сочетании новые технологии смогут повысить качество подготовки врачей и не снизить уровень их самостоятельного клинического мышления.

Пациенты тоже выражают настороженность. По данным апрельского опроса Центра общественной политики Анненберга, 79% взрослых американцев ищут информацию о здоровье в интернете и часто сталкиваются с ответами, сгенерированными ИИ, но почти половине (49%) некомфортно, когда врач опирается на такие инструменты вместо собственного опыта.

Компания OpenAI тем временем уже представила новое поколение модели – GPT-5, сделав акцент на ее медицинском потенциале. По данным компании, в тестах на платформе HealthBench, разработанной при участии 250 практикующих врачей, GPT-5 показала еще более высокую точность и качество ответов, превзойдя предыдущие версии. Модель уже применяется фармацевтическими и страховыми компаниями, а также внедряется в работу федеральных служб США.

Партнёры Smi24.net

Все новости за 24 часа

Life24.pro

«И тут я узнала, что встретила бабника». Александр Златопольский раскрыл своё романтическое прошлое Анфисе Чеховой

Почему нельзя будить лунатиков

Эндокринолог Филатова: меню против боли при ПМС

Национальное достояние и современность: к 110-летию Георгия Свиридова подготовили цикл мировых премьер

Today24.pro

'Digging in': Man Utd lower price by £20m for player with club advancing in talks

Sam Altman might be right: He’s not the only one who thinks the stock market is in ‘bubble’ territory

'He was better than Sachin ... ': Kambli's brother makes big revelation

“Brilliant deal” – Former player claims Arsenal are about to pull off THE signing of the summer

News24.pro

Основы движения вверх

Лариса Долина отметит свой юбилей грандиозным концертом «В кругу друзей» на сцене Государственного Кремлевского Дворца

Тишина на веслах

«Индекс ATI.SU, FTL РФ» теперь отражает ежедневную динамику цен на грузоперевозки

Game24.pro

Состоялся релиз RPG-выживача Dead Impact в App Store и Google Play

Bungie CEO Pete Parsons retires: With Destiny 2 sentiment at an all-time low and pressure from Sony growing, Parsons has decided it's time to 'pass the torch' and head for an exit

'I hope all your cars break down': Destiny players bid good riddance to departing Bungie CEO Pete Parsons in a rare moment of unity

87% of game developers are already using AI agents and over a third use AI for creative elements like level design and dialogue according to a new Google survey

Russia24.pro

Монетизировала небольшие видео: блогер Катя Адушкина рассказала, как заработала на квартиру в центре Москвы

Искусство на службе добра: Новосибирск принимает благотворительный концерт «Культура в помощь Донбассу»

Собянин: Шедевры из собрания Русского музея покажут на ВДНХ

News-life

Строительство премиального курортного комплекса в Ялте обойдется в 26 млрд рублей

Суд освободил от наказания основателя зацепинга Романа Громова

Искусство на службе добра: Новосибирск принимает благотворительный концерт «Культура в помощь Донбассу»

Уроженка Новосибирска Пелагея стала послом "Интервидения-2025"

Ru24.net

Роскомнадзор сообщил об отсутствии ограничений для Google Meet в России

Москвичей приглашают на сотни бесплатных танцевальных мастер-классов на Чистопрудном бульваре

Водитель «газели» погиб в ДТП с грузовиком на 16-м километре МКАД в Москве

Международная конная выставка «ЭКВИРОС» пройдет с 11 по 14 сентября

News.tennis

"Чувствую себя более сексуальной". Серена Уильямс призналась, что похудела с помощью аналога "Оземпика"

Хачанов возглавил список российских теннисистов по рейтингу АТР

Даниил Медведев: я всегда с радостью приезжаю в Нью-Йорк

Селехметьева обыграла Шиманович и вышла в финал квалификации US Open

29ru.net

Подросток на квадроцикле сбил идущих по дороге в Подмосковье женщин

Из-за теплых зим в Подмосковье поселились богомолы

Международная конная выставка «ЭКВИРОС» пройдет с 11 по 14 сентября

Очистные сооружения Усть‑Абакана ждёт модернизация

Музыкальные новости

Poisk-music.ru

«Он знал»: друг Оззи Осборна рассказал об их последней встрече

Переспал с Бритни Спирс и поссорился с Эминемом: лидеру Limp Bizkit - 55

Певец Евдокимов умер от рака легких

Искусство на службе добра: Новосибирск принимает благотворительный концерт «Культура в помощь Донбассу»

Ria.city

Искусство на службе добра: Новосибирск принимает благотворительный концерт «Культура в помощь Донбассу»

Собянин: Шедевры из собрания Русского музея покажут на ВДНХ

Монетизировала небольшие видео: блогер Катя Адушкина рассказала, как заработала на квартиру в центре Москвы

Rss.plus

Тимур Иванов «пропал». Заседание суда перенесено: РБК

Искусство на службе добра: Новосибирск принимает благотворительный концерт «Культура в помощь Донбассу»

В Москве при содействии спецназа Росгвардии задержаны нарушители миграционного законодательства

Офицер Росгвардии рассказал слушателям «Радио Москвы» об охране столичных образовательных учреждений

Auto.russia24.pro

Водитель «газели» погиб в ДТП с грузовиком на 16-м километре МКАД в Москве

Стало известно состояние пострадавших в аварии на 81-м километре МКАД в Москве

Столичные росгвардейцы обеспечили безопасность автопробега, посвящённого Дню государственного флага

Autonews: В Москве и Петербурге начали массово угонять китайские автомобили

Putin.russia24.pro

Путин принял министра иностранных дел Индии Джайшанкара в Москве

В Москве 25 сентября пройдет первый в истории «атомный саммит»

Раскрыты архивы: Клинтон предлагал Путину обсудить вступление России в НАТО

Чем могут запомниться переговоры Путина и Трампа в Москве

Health.russia24.pro

Бывший министр здравоохранения Хабаровского края задержан в Москве

Экс-министра здравоохранения Хабаровского края Бойченко задержали в Москве

Что делает врач-гинеколог: процедуры и манипуляции

В Москве задержан экс-министр здравоохранения Хабаровского края Бойченко

Zelensky.russia24.pro

В Киеве утверждают о провале Зеленского

В студии Postimees Игорь Грецкий: реальна ли в обозримом будущем встреча Зеленского и Путина?

Советник главы Офиса Зеленского: Киев готов временно признать часть территорий утраченными

Советник главы Офиса Зеленского: Киев готов временно признать часть территорий

Sport.russia24.pro

Norilsk Trail 2025: более 450 участников выйдут на забег по пересечённой местности

Сильнейшая российская гимнастка проиграла белорускам турнир в Москве. Отрыв от 1-го места — кошмарный

Российская теннисистка Чараева вышла в финал квалификации US Open

В Благовещенске состоялся Всероссийский спортивно-патриотический забег «От Победы к Победе!»

Lukashenko.russia24.pro

Лукашенко считает, что ему не о чем говорить с беглыми оппозиционерами

Лукашенко: Белоруссия нацелена на постепенное налаживание отношений с США

Алексей Текслер провел переговоры с Александром Лукашенко

Минск обсудит с Москвой развитие совместного ракетного производства

Person.russian.city

Собянин анонсировал открытие большой выставки об образе Москвы в искусстве

Собянин: Масштабная выставка об образе Москвы в искусстве откроется 6 сентября

Собянин: 220 семей из Люблина переселяются в новый дом по программе реновации

Собянин: Шедевры из собрания Русского музея покажут на ВДНХ

Ecology.russia24.pro

Московский зоопарк пополнился редким оранжевохохлым какаду из Новосибирска, который находится на грани вымирания

В Крыму ликвидировали угрозу распространения лесного пожара

Москва запретила продажу электроудочек и луков: угроза для экосистемы

По данным СМИ, площадь лесных пожаров в ЕС превысила миллион гектаров

29ru.net

Москвичей приглашают на сотни бесплатных танцевальных мастер-классов на Чистопрудном бульваре

Международная конная выставка «ЭКВИРОС» пройдет с 11 по 14 сентября

Очистные сооружения Усть‑Абакана ждёт модернизация

«И тут я узнала, что встретила бабника». Александр Златопольский раскрыл своё романтическое прошлое Анфисе Чеховой

Severodvinsk.ws

Решением суда по исковому заявлению прокуратуры в пользу многодетного отца с Федеральной службы судебных приставов взысканы убытки, причиненные незаконным бездействием

«Два Алтая» вошли в федеральную программу по развитию въездного туризма

Молебен в честь преподобного Пимена Угрешского прошел в Балашихе

Наш ответ Харлею: новый российский мотоцикл представили в Москве

Sevpoisk.ru

Саранскую телемачту в День флага России украсит 180-метровый световой триколор

Картина с тайной и другие находки: работа реставраторов РГИ в Севастополе

Погода 22 августа: ночью до +14

Поезд Москва – Симферополь и еще 18 составов задержали из-за происшествия в Воронежской области

103news.com

Красная Луна и исчезающая Венера: 3 затмения сентября, которые стоит увидеть - уже названы даты

Очистные сооружения Усть‑Абакана ждёт модернизация

Из-за теплых зим в Подмосковье поселились богомолы

Подросток на квадроцикле сбил идущих по дороге в Подмосковье женщин

Агрегатор новостей 24СМИ