Добавить новость
smi24.net
News in English
Декабрь
2017

Google Taught an AI That Sorts Cat Photos to Analyze DNA

0

When Mark DePristo and Ryan Poplin began their work, Google’s artificial intelligence did not know anything about genetics. In fact, it was a neural network created for image recognition—as in the neural network that identifies cats and dogs in photos uploaded to Google. It had a lot to learn.

But just eight months later, the neural network received top marks at an FDA contest for accurately identifying mutations in DNA sequences. And in just a year, the AI was outperforming a standard human-coded algorithm called GATK. DePristo and Poplin would know; they were on the team that originally created GATK.

It had taken that team of 10 scientists five years to create GATK. It took Google’s AI just one to best it.

“It wasn’t even clear it was possible to do better,” says DePristo. They had thrown every possible idea at GATK. “We built tons of different models. Nothing really moved the needle at all,” he says. Then artificial intelligence came along.

This week, Google is releasing the latest version of the technology as DeepVariant. Outside researchers can use DeepVariant and even tinker with its code, which the company has published as open-source software.

DeepVariant, like GATK before it, solves a technical but important problem called “variant calling.” When modern sequencers analyze DNA, they don’t return one long strand. Rather, they return short snippets maybe 100 letters long that overlap with each other. These snippets are aligned and compared against a reference genome whose sequence is already known. Where the snippets differ with the reference genome, you probably have a real mutation. Where the snippets differ with the reference genome and with each other, you have a problem.

GATK tries to solve the problem with a lot of statistics. DNA-sequencing machines sometimes make mistakes, so the GATK team studied where the machines tend to made mistakes. (The letters GTG are particularly error-prone, to give just one example.) They thought long and hard about things like “the statistical models underlying the Hidden Markov model,” per DePristo. GATK then gives its best guess for the actual letter at a certain location in DNA.

DeepVariant, on the other hand, still does not know anything about DNA-sequencing machines. But it has digested a lot of data. Neural networks are often analogized as layers of “neurons” that deal in progressively more complex concepts—the first layer might respond to light, the second shapes, the third actual objects. As DeepVariant is trained with data, it learns which “neurons” to weigh more heavily and which to ignore. Eventually, it can sort the actual mutations from the errors.

To fit the DNA-sequencing data to an image-recognition AI, the Google team came up with a work-around: Just make it an image! When scientists want to investigate a mutation, they’ll often pull up the aligned snippets, like so:

Google

“If humans are doing this as a visual task, why not present this as a visual task?” says Poplin. So they did. The letters—A, T, C, or G—got assigned a red value; the quality of the sequencing at that location a green value; and which strand of DNA’s two strands it is on a blue value. Together, they formed an RGB (red, green, blue) image.

Google

And then it was simply a matter of feeding the neural network data. “It changes the problem enormously from thinking super hard about the data to looking for more data,” says DePristo.

Between publishing a preprint about DeepVariant last December and the release this week, the team continued improving the tool. Instead of three layers of data—represented by red, green, and blue—at any location in the genome, DeepVariant now considers seven. It would no longer make any sense as an image to the human eye. But to a machine, what’s just a few more layers of numbers?

To be clear, DeepVariant itself is unlikely to change genetics research. It is better than GATK, but only slightly so—and it is half as fast depending on the conditions. It does, however, lay the groundwork for AI’s influence in future genetics research.

“The test will really be how it can translate to other technologies,” says Manuel Rivas, a geneticist at Stanford. New sequencing technologies like Oxford Nanopore are becoming popular. If DeepVariant can quickly learn variant calling under these new conditions—remember the humans took five years with GATK—that could speed up the adoption of new sequencing technologies.

DePristo says that the idea of layering data on top of each location in the genome could easily be applied to other problems in genetics—the more important of which is predicting the effects of a mutation. You might imagine layering on, for example, data on when genes are active or not. DeepVariant started off with just three layers of data. Now it has seven. Eventually it might be dozens. It won’t make much sense to a human brain anymore, but to an AI, sure.








Ремикс Песни. Создание ремикса Песни. Создание Хитового ремикса песни.

Анимационная программа нового пляжа «Изумрудный»

Коллекция Marc Jacobs осень-зима 2025/26

В районе Перово идёт набор в ансамбль народных танцев


Trump's cuts force Texas food banks to ration supplies for flood survivors

ICE is 'supercharging detention' with 'flagrantly unlawful' policy: lawyers

Son Of British Boxing Legend Retires From The Sport Aged Just 24: “Won’t Be Fighting Again”

First confirmed death during Trump ICE raid is a farmworkers at a California cannabis facility


Каршеринг BelkaCar запустил новый сезон проекта «Умные путешествия»

В больницу попал упавший из окна ребёнок

Клинический психолог Юлия Тарибо: каким типам личностей сложно было вместе

Travel-эксперт Тариел Гажиенко: топ 5 мест для путешествий в летний сезон


The Expanse RPG's developers are 'humbled' by comparisons to BioWare's heyday, but don't expect it to be a straight Mass Effect clone: 'We make our story a little bit differently'

Гайд на Fuqiu из Etheria Restart: навыки, PvE-билд, расклад в PvP и дубликаты

I've swapped modern live service games for a browser game that's been running since 2009

MMORPG Lord Nine: Infinite Class выпустят в Юго-Восточной Азии 31 июля



«Искуситель», «Актриса» и «Пиковая дама»: топ 3 спектаклей сентября

Москва прощается с жарой: жителей столицы предупредили о ливнях и грозах

«Турбозавры» поучаствовали в Дне московского транспорта

Клинический психолог Юлия Тарибо: каким типам личностей сложно было вместе


Из трёх музеев Томской области томичи отправили по почте 500 «тёплых открыток»

Апелляция: Экс-замминистра обороны Иванов и растрата 3,9 млрд рублей

Жители Прикамья активно покупают билеты на транспорт в отделениях Почты России

Удобный и безопасный шопинг с агрегатором цен на технику


Минтранс: прямые авиарейсы между Москвой и Пхеньяном запустят с 27 июля

В Подмосковье расцвел редкий рогульник плавающий

Travel-эксперт Тариел Гажиенко: топ 5 мест для путешествий в летний сезон

Трамп назвал бессмысленными пошлины для РФ в 500%


Теннистка Кудерметова впервые в карьере выиграла Уимблдон в парном разряде

Российская теннисистка Вероника Кудерметова выиграла Уимблдон в парном разряде, а итальянец Янник Синнер – в одиночном

Подмосковный теннисист стал бронзовым призером юниорского Уимблдона

Минниханов о победе Кудерметовой на Уимблдоне: мы гордимся!


Трамп назвал бессмысленными пошлины для РФ в 500%

В Подмосковье откроют производство генетических реагентов

Москвичка, пострадавшая при ударе молнии на пляже в Алексине, находится в тяжелом состоянии

Travel-эксперт Тариел Гажиенко: топ 5 мест для путешествий в летний сезон


Музыкальные новости

Светлана Сурганова о выступлении на фестивале «Улетай» в Удмуртии: «Приятно смотреть в любящие глаза публики»

Создание Ремикса. Создание ремикса музыки. Создание хитовых ремиксов музыки.

Сестра Жанны Фриске Наталья рассказала о причине развода с мужем

Юрий Лоза предрек Кристине Орбакайте крах карьеры в Европе


Клинический психолог Юлия Тарибо: каким типам личностей сложно было вместе

Ремикс Песни. Создание ремикса Песни. Создание Хитового ремикса песни.

«Турбозавры» поучаствовали в Дне московского транспорта

В Подмосковье за один вечер молнии три раза ударили в дома


«Спартак» продлил контракт с люксембургским футболистом Мартинсом

«ЦСКА-Чемпион»: клуб в восьмой раз стал обладателем Суперкубка России

«Она пошла встречаться с подружками в Москве»: новый сериал от Бони и ее дочери

Сделка против Путина: Что предложила Канада Пригожину за снятие санкций. Правду скрывали годами


В Москве мужчина ограбил магазин на АЗС, угрожая пистолетом

КАМАЗ-4280 начал тестовую эксплуатацию на маршруте в Подмосковье

Красные арки, синяя подсветка. В Москве строят новые пешеходные мосты

СМИ: Байкер разбился насмерть в ДТП с машиной на Раменской пойме в Подмосковье


Посол Акира Муто: Япония будет приветствовать возможную встречу Путина и Трампа

"Пока Путин не заметит это безобразие": Пономарев резко высказался о легионерах в РПЛ

В РФ раскрыли замысел Трампа после его попыток шантажировать Путина

Подведение итогов года семьи: Путин обсудил демографические и медицинские вопросы.




Врач-стоматолог клиники «Мегастом» Наталья Тышкевич: чем опасно самолечение

Травмированного на репетиции в цирке Москвы акробата выписали из больницы

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки

Врач-трихолог Мадина Осман: как часто можно делать пересадку волос


ВСУ атаковали дронами женщин под Сумами: Били за надпись "Мы русские"


Травмированного на репетиции в цирке Москвы акробата выписали из больницы

«Турбозавры» поучаствовали в Дне московского транспорта

Росгвардейцы из Чеченской Республики стали победителями и призерами чемпионата Северо-Кавказского округа Росгвардии по комплексному единоборству

Раскрыто расписание Олимпийских игр 2028 года в Лос-Анджелесе.


«Нам в Минске надо учиться». Лукашенко похвалил Беглова за зимнюю уборку Петербурга

Губернатор Петербурга Александр Беглов встретился с президентом Республики Беларусь Лукашенко

Лукашенко предложил Петербургу ремонтировать всю белорусскую технику

Лукашенко заявил о необходимости проверки чиновников за манипуляции с ценами.


Сергей Собянин: роботы и электромашины на страже московских улиц

Собянин встретился с новоселами дома по реновации в Хорошево-Мневниках

Сергей Собянин: Взяли курс на развитие высокотехнологичного сектора

Собянин рассказал о предпрофессиональных каникулах для школьников


Spark.ru - экосистема, объединяющая представителей бизнеса, экспертов и инвесторов

В НОВОМ ОТЧЕТЕ LG ОБ УСТОЙЧИВОМ РАЗВИТИИ ОТМЕЧЕН ПРОГРЕСС В ДОСТИЖЕНИИ ЭКОЛОГИЧЕСКИХ ЦЕЛЕЙ 2030 ГОДА

РЭО проведет акселератор для экоцентров на базе Плехановского университета

РЭО запускает акселератор для экологических центров на базе Плехановского университета


Апелляция: Экс-замминистра обороны Иванов и растрата 3,9 млрд рублей

АвтоВАЗ отгружает Lada Iskra дилерам. Цены объявят на этой неделе

Travel-эксперт Тариел Гажиенко: топ 5 мест для путешествий в летний сезон

(НЕ)СЕКРЕТНУЮ СЛУЖБУ США ПОДОЗРЕВАЮТ В ПОСТАНОВКЕ СЦЕНЫ ПОКУШЕНИЯ НА ТРАМПА. СЕНСАЦИЯ! Новости. В.В. Путин, Дональд Трамп. Россия, США, Европа могут улучшить отношения и здоровье общества!


Защищённый планшет Saotron RT-W11J на базе ОС Windows10

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Фестиваль духовых оркестров пройдет в трех городах Поморья по случаю Дня ВМФ

В городе Барнауле стартовал третий этап смотра-конкурса на звание "Лучшее звено газодымозащитной службы" среди Главных управлений МЧС России


Симферополь частично остался без света утром 14 июля

Прогноз погоды в Крыму на 13 июля

Десятки улиц Симферополя остались без света 14 июля

Под Симферополем горят десятки гектаров леса


Плотник из Ставрополя отправляет мебель в разные уголки мира

В Подмосковье расцвел редкий рогульник плавающий

Минтранс: прямые авиарейсы между Москвой и Пхеньяном запустят с 27 июля

В Москве мужчина ограбил магазин на АЗС, угрожая пистолетом














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *