Добавить новость
smi24.net
News in English
Декабрь
2023

Погадайте мне на big data: как из больших данных проступают линии человеческих судеб

Датские ученые собрали подробные биографические сведения обо всех жителях Дании из государственных баз данных за период с 1 января 2008 года по 31 декабря 2015 года. Год рождения, здоровье, образование, зарплата, местожительство и т. д. — все было включено в анализ человеческих судеб. Авторы разработали новый способ анализа данных, похожий на системы семантического анализа языковых текстов. Их модель сумела вычленить смысловые кластеры и на их основе предсказать вероятность ранней смерти в когорте людей возрастом 35–65 лет. Уровень точности составил 40% — очень достойный показатель для попытки что-либо предсказать. Точность оказалась выше, чем у испытанных ранее моделей на базе различных нейросетей, и моделей, основанных на других принципах. Также новый анализатор неплохо справился с задачей определения личностных характеристик людей на основе всё тех же биографических данных.

В журнале Nature Computational Science опубликована статья о человеческих судьбах. В ней говорится о том, как использовать биографии для предсказания будущего отдельного человека и описать его личностные качества. Считается, что это удел гадалок, которые умеют мистическим взглядом пробить тонкую вуаль настоящего и увидеть будущее человека и самоё его суть. Но теперь на этом поприще решили себя попробовать ученые. Авторы новой методики предсказаний работали под руководством Суне Лемана (Sune Lehmann) из Копенгагенского университета и представляли различные научные учреждения Дании, а также США. В объединенную базу данных вошло всё население Дании, около 6 млн человек. Иначе говоря, ученые гадали всей стране.

В этой работе особенно интересны три аспекта. Первый — сами данные. Это собранная вместе информация о каждом датчанине: когда и где родился, где учился, где работал и когда менял работу, где жил, переезжал ли, когда и куда, сколько получал денег и за что, как их тратил, когда и зачем обращался к врачу. Хорошо, конечно, что все эти данные идут на интересную науку и, следовательно, на благо общества, но всё же от таких масштабов немножечко не по себе.

Второе, что обращает на себя внимание, — методика работы с этими данными. Сами авторы считают именно этот аспект работы наиболее значимым. В отличие от других методов анализа больших многомерных массивов здесь применены технологии анализа, разработанные специально для данных со встроенной «памятью» — тех, в которых имеются скрытые причинно-следственные связи. Собственно, жизнь человека — это набор миллиона случайных и закономерных событий, среди которых бессмысленно искать первопричину или пусковой механизм. Но с такими данными ученые уже умеют работать — это, в частности, методы распознавания смыслов в языковых текстах. Одну из таких лингвистических систем и адаптировали под свои задачи исследователи человеческих судеб. Они анализировали цепочку жизненных событий как длинную фразу. В этой фразе каждое слово-событие может быть связано по смыслу с другим словом-событием, но может быть и не связано. Программа, которую создали авторы работы (они назвали ее Life2vec, по аналогии с Word2vec), настроена на поиск этих встроенных смысловых связей. Возможно, этот общий подход для анализа систем со встроенной «памятью» может привнести новое видение и для прогнозирования других сложных систем со своей историей, например судьбы видов крупного таксона или биома.

И, наконец, третий важный аспект — это сами результаты. Разработанная программа, которая учитывает различные события прошлой жизни, может неплохо предсказать, например, раннюю смерть, а также описать личность человека. Так что получается, что личность человека увязывается с его судьбой: может быть, личность формирует судьбу, а может, и, наоборот, человек — продукт своей судьбы.

Делая прогнозы на основе своей модели, ученые отмечают, что она срабатывает лучше, чем другие прогностические системы. В целом, такой показатель, как ранняя смерть (35–65 лет) легко проконтролировать. В данном случае интервал с 2008-го по 2015 год служил как основной массив данных, а для интервала 2016–2020 гг. ученые рассчитали вероятность наступления смерти в возрастной когорте 35–65 лет. Нужно подчеркнуть, что для этой возрастной когорты прогнозы о смерти делать трудно. Однако модель life2vec предсказывает ее с вероятностью 40–42%, что на 10% превышает предсказательную точность предыдущих рекордсменов в данной области — различные варианты нейросетей.

Модель позволяет поисследовать факторы, влияющие на вероятность ранней смерти. Убирая тот или иной показатель, можно увидеть, насколько изменится прогностическая сила модели. С помощью подобного перебора ученые выяснили, что высокий доход или работа менеджером снижает риск ранней смерти, а работа машинным оператором (что бы это ни значило) или квалифицированным рабочим, а также инфекционные и душевные болезни увеличивают этот риск. Конечно, пока этот вывод не слишком оригинален — лучше быть богатым управляющим, чем больным рабочим, — но всё же предсказатель life2vec еще только учится.

На рисунке выше показано, как модель life2vec на основе всё тех же биографических записей может определить некоторые черты личности, связанные с экстраверностью-интравертностью: самооценку, общительность, готовность к коммуникации (социальная смелость), активность. Проверкой модельных оценок служили стандартные опросники, дающие оценку различным индивидуальным качествам (здесь — показателям экстраверсии). Модель неплохо справилась с определением этой черты, по крайней мере лучше, чем натренированные нейросети. Только общительность модель life2vec определила хуже нейросети.

Итак, в распоряжении ученых имеется система, которая умеет осмысленно анализировать повседневные события в жизни человека — обычную канву, без блесток успехов или прорех несчастий. Эта система, по-видимому, научилась учитывать какие-то запрятанные в клубке событий значимые узелки жизни. Мы, естественно, имеем дело с вероятностями, не слишком большими, но всё же далекими от случайностей. Эта статья научная, но в ней есть над чем поразмышлять, если вдруг потянет на философию.

Источник: Germans Savcisens, Tina Eliassi-Rad, Lars Kai Hansen, Laust Hvas Mortensen, Lau Lilleholt, Anna Rogers, Ingo Zettler, Sune Lehmann. Using sequences of life-events to predict human lives // Nature Computational Science. 2023. DOI: 10.1038/s43588-023-00573-5.

Елена Наймарк

Adblock test (Why?)








Арбуз, кукуруза и холодные напитки: диетолог Садыков назвал продукты, которые портят ваш сон летом

Звезды тогда и сейчас: как выглядят самые красивые женщины Голливуда

Любовь в сердце и в «Тропикана Парк»

Аделина Панина: как силой мысли заставить человека написать или позвонить


The founder of Deliciously Ella started a blog when suffering from severe chronic pain. Now, her multimillion-dollar snack empire is going global

Tourism is increasing over prepandemic levels, overwhelming popular destinations

The Best Story Of Chicago Bulls’ Offseason Just Got A Happy Ending

OpenAI warns that its new ChatGPT Agent has the ability to aid dangerous bioweapon development


Методы стеганографии становятся популярнее: когда картинка может стать угрозой ИБ

На пожаре в частном доме обнаружили тела мужчины и женщины

Новая модель Hyundai Elantra уже доступна в России: какие изменения произошли

В Курске погиб 36-летний мотоциклист


The dairy industry would like Gen Z to drink more milk, so they made a Fortnite diner tycoon game

Microsoft warns of 'active attacks' on its government and business server tech, with one cybersecurity expert claiming that they should 'assume that you have been compromised'

Настройки GameHub и Winlator для игры в Prey (2017) на Android

'I destroyed months of your work in seconds' says AI coding tool after deleting a devs entire database during a code freeze: 'I panicked instead of thinking'



Студия Лебедева запустила образовательный проект, в котором заказчики сами создают свой дизайн

Кайрат Бермуканов поддержал Петра Яна перед боем в Абу‑Даби

Аудиосказки про Турбозавров теперь на Яндекс Музыке!

Летняя школа Русского дома приняла детей из Карабаха


В регионах Центральной России продолжается ведомственная акция «Каникулы с Росгвардией»

История одной семьи: результаты конкурса и победители

Валерия и Иосиф Пригожин рассказали, как проводят досуг на природе

Лео Канделаки и Анжелика Стубайло сыграют в новую трэвел-игру «Кто куда» на ТНТ


Мария Шувалова. В столице Татарстана чествовали балетную диву за блистательную «Анюту»

«Автостат»: Импорт новых легковушек в Россию рухнул на 63 процента

Как быстро систематизировать бизнес: инструменты и сервис ABR PRO

Ливень в Москве стал одним из сильнейших на планете по обилию осадков за сутки


Румынская теннисистка Бегу выиграла турнир в Яссах.

Рублев прокомментировал вылет с турнира в Лос-Кабосе

«Саша забрал корону». ATP отреагировал на триумф Александра Бублика

Рублев вместе с чешской теннисисткой заявился в микст на US Open


Утром будет сюрприз: в ГАИ объяснили, почему с 23 июля нельзя ставить машину во дворе дома

Ведущие девелоперы и проектировщики обсудят «дорожные вопросы» в Москве

Лицемерная политика многовекторности. "Улыбается всем": Эрдоган в обход Москвы готов дружить с Баку

После вспышки инфекции на теплоходе «Леонид Красин» начали расследование


Музыкальные новости

Надежда Бабкина высказалась о «вражде» с Надеждой Кадышевой

Певица Клава Кока стала послом конкурса "Интервидение"

Продюсер рассказал, почему заменил Shaman в опере «Князь Владимир»

Metallica спасла Tomorrowland: фестиваль в Бельгии состоится, несмотря на пожар на главной сцене


Движение к победе: в России стартует премия «Мы верим твердо в героев спорта»

Кайрат Бермуканов поддержал Петра Яна перед боем в Абу‑Даби

Студия Лебедева запустила образовательный проект, в котором заказчики сами создают свой дизайн

Летняя школа Русского дома приняла детей из Карабаха


Аэропорт Пулково сообщил о приеме перенаправленных из Москвы рейсов

ЦСКА и "Оренбург" сыграли со счетом 0:0 в первом туре РПЛ

Компрессор по подписке – новая услуга на рынке оборудования

VK Fest 2025 побил рекорд по числу артистов и вошёл в Книгу рекордов России


Рискнул на 100 тысяч рублей: инженер из Смоленска купил более 1,7 тысячи лотерейных билетов и выиграл автомобиль от «Национальной Лотереи» и РОЛЬФ на VK Fest

Москвичей предупредили о задержках наземного транспорта из-за ливня

Зарядки для электромобилей «Энергия Москвы» станут платными

Сильный ливень заблокировал людей в авто в центре Москвы


Путин выразил соболезнования семье председателя Верховного суда Подносовой

Министр юстиции поделился информацией о роли адвокатов в специальной военной операции.

Путин отметил успехи российских школьников на математической олимпиаде.

Нам есть чем гордиться: каким будет Национальный центр «Россия» на Краснопресненской набережной




Офтальмолог Кирилл Светлаков: секреты здоровых глаз для тех, кто носит контактные линзы

Собянин: создание 5 центров женского здоровья завершат в этом году

После вспышки инфекции на теплоходе «Леонид Красин» начали расследование

Уже не крепкий орешек: как Брюс Уиллис живет с неизлечимой болезнью


«СТРАНА.ua»: Зеленский раскритиковал ЕС за непредоставление обещанной помощи

Пока вы не уснули: открытая поддержка Алиевым Киева и «подзатыльник» Зеленскому от Трампа

В центре Киева митингуют против реформ Зеленского


Движение к победе: в России стартует премия «Мы верим твердо в героев спорта»

Кайрат Бермуканов поддержал Петра Яна перед боем в Абу‑Даби

В Москве впервые пройдет фестиваль экстремальных видов спорта

Уже 59 орловчан решили побороться за просветительскую награду «Знание. Премия»


Посланник Трампа рассказал, как «неформально» договаривался с Лукашенко: после нескольких тостов Минск освободил политзаключенных

Юрист Трампа Коул рассказал, как пил водку с Лукашенко в Минске

Лукашенко призвал белорусских нефтяников «не раскачиваться, а бурить и бурить»

Куда Лукашенко хочет пристроить лишних дипломатов


Более 800 спортивных площадок обновят и обустроят в Москве — Сергей Собянин

Более 800 спортивных площадок обновят и обустроят в Москве - Сергей Собянин

Собянин: Продолжаем внедрять новый стандарт заботы о женском здоровье в одном месте

Собянин рассказал, как город заботится о природе при строительстве метро


Фестиваль «Сады и цветы»: как Москву превращают в городской оазис

Уже 59 орловчан решили побороться за просветительскую награду «Знание. Премия»

Россияне рассказали, по каким критериям выбирают квартиру для покупки в 2025 году

Экономист оценил экологический и финансовый ущерб от пластиковых пакетов


Как быстро систематизировать бизнес: инструменты и сервис ABR PRO

Утром будет сюрприз: в ГАИ объяснили, почему с 23 июля нельзя ставить машину во дворе дома

В Подмосковье отметили вклад сотрудников спецподразделения Росгвардии в патриотическое воспитание молодёжи

Ведущие девелоперы и проектировщики обсудят «дорожные вопросы» в Москве


Республика Алтай вошла в десятку регионов России по развитию ипотеки

Девочка упала при посадке на теплоход в порту Архангельска

В Нарьян-Маре из-за холодов возобновили подачу отопления в дома

В Башкирии ревнивец ранил жену шампуром и сдался полиции


Поезда "Таврия" по-прежнему задерживаются из-за ЧП в Ростовской области

В Симферополе на базе «Клинического госпиталя для ветеранов войн» функционирует гериатрический центр для пожилых людей с возрастными нарушениями

Поезда в Крым и из Крыма следуют с задержками до пяти часов

Актуальная информация о задержке поездов в Крым и обратно


Дефектолог Тихонова рассказала о пользе чтения в слух

«Спартак» — единственный клуб, обратившийся в ЭСК РФС по итогам 1-го тура РПЛ

Мосбиржа начала расчет индекса создания стоимости в рамках инициативы с ЦБ РФ

В столичном метро начали тестировать нейросеть-диктора














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *