Мы в Telegram
Добавить новость
smi24.net
Досуг
Май
2017

Почему GOOGLE не оцифровал все книги в мире?



Вот вы думаете, почему мы еще не летаем на другие планеты или у нас нет базы на Луне? Технологии не позволяют? Нет, просто это дорого и не выгодно каждой стране в отдельности. А вот если бы все страны планеты объединились с такой целью, то я думаю вполне реально было бы уже съездить на выходные на Марс.

Вот вам еще одна захватывающая история о том, как человеческая наивность и жадность задушили самый амбициозный IT-проект тысячелетия — проект по оцифровке всех-всех книг, которые только есть в мире.

Статья была опубликована в The Atlantic, а вы прочтите краткий пересказ:

Из идеи об оцифровке книг и возможности мгновенно искать в них любые отрывки текста родилась Google. Ларри Пейдж и Сергей Брин задумывали создать поисковик не по интернету, но по книгам. Но вышло иначе, а к идее о том, чтобы перевести в цифровой формат все книги они вернулись только в начале "нулевых".

Проект по оцифровке всех сначала американских, а затем вообще всех-всех книг получил кодовое название "Project Ocean". Даже в самой Google те сотрудники, что не были в него вовлечены, рассматривали идею как нечто, слабо совместимое с реальностью. Нечто вроде нынешней "хотелки" Илона Маска отправить человека на Марс. Но проект поддерживали сам Пейдж и Брин, так что у него, разумеется, был более чем зеленый свет.

Начиная с 2002 года Google начала жадно сканировать все книги, до которых могла дотянуться. Для этого она договорилась с крупнейшими библиотеками США и организовала специальные центры сканирования, в которые книги из библиотек свозили фурами. Это не фигура речи — логистически "Project Ocean" был не менее сложным, чем технически.

Да, для реализации проекта Google пришлось придумать специальные "железо" и "софт" — ведь до нее на тот момент задачу быстрого сканирования миллионов книг еще никто не решал.


Сканируемая книга жестко закреплялась на специальном стенде, сверху на нее смотрели несколько фотоаппаратов, а лидар ("трехмерный радар") определял точное положение листов книги в пространстве, чтобы позже специальное программное обеспечение учитывало это и "распрямляло" криво сфотографированные листы бумаги.

Таким образом, в Google решили самую большую проблему при оцифровке книг — их точном закреплении при сканировании, чтобы все получалось ровно и красиво. Тут "голова болела" об этом не у людей, а у программы и ее алгоритмов.

Интересно, что при всей технологической навороченности стендов для "сканирования" книг, листы вручную переворачивали люди — машины не могли делать это достаточно быстро и одновременно достаточно нежно. Ведь перевести в цифровой формат нужно было и старые, и очень старые книги, обращаться с которыми надо было исключительно аккуратно.

Оператор переворачивал страницу, нажимал на педаль на полу, камеры фотографировали, он снова переворачивал — и так до тысячи раз в час.
К августу 2010 года Google потратила на проект в общей сложности 400 млн. долларов. И объявила о том, что по ее подсчетам в мире 129 864 880 книг. И она хочет оцифровать их все.

Тут надо пояснить, что изначально Google вовсе не собиралась открывать полный доступ к книгам — юристы компании этого бы никогда не позволили, они не самоубийцы. Первоначальная идея была — обеспечить возможность поиска по всем-всем книгам с демонстрацией пользователю небольшого отрывка. Юридический отдел Google был уверен, что это попадает под определение "честного использования" и, забегая сильно вперед, отметим, что судебная система в итоге, через много лет тяжб, признала: у компании действительно есть право на подобное использование книг.
Также стоит сказать, что если в большинстве европейских стран книга становится бесплатно доступной обществу через 50 лет после смерти автора, то в США это так не работает. Закон об авторских правах таков, что уже не публикующиеся книги никто не имеет права опубликовать еще раз, не решив все вопросы с автором, издательством или наследниками их прав. То есть книга просто лежит и собирает пыль, а чтобы дать ей вторую жизнь, даже цифровую, надо потратить столько времени и денег, что проще ничего не делать.

Когда издатели и авторы поняли, что Google не шутит насчет "взять и все оцифровать", они моментально возбудились. Шутка ли — компания просто взяла и скопировала содержимое крупнейших американских библиотек! Не спросив разрешения ни у кого, кроме библиотек! В общем, на нее подали в иск — и группа издателей, и Гильдия авторов.

Позже отдельные иски объединили в один коллективный иск, поданные от имени и для защиты прав всех авторов и издателей в США. Это важный, можно даже сказать ключевой момент всей юридической части истории.

В какой-то момент все вовлеченные стороны внезапно поняли — то, что сделала Google, может открыть новый гигантский рынок книг, особенно уже вышедших из обращения.

Однако иск был подан, судебные заседания шли и вместе с ними пришло понимание, что если пустить дело на самотек и доводить его до логического конца, то проиграют все. Так, если авторы и издатели выиграют в суде, то Google им что-то заплатит и прекратит сканировать книги, но не откроет к ним доступ читателям, поскольку не имеет на это права. Если выиграет Google — она сможет показывать читателям отрывки, но не продавать электронные копии книг целиком, поскольку опять же законы это запрещают.
И тогда стороны задумали, вероятно, самое грандиозное в истории соглашение по урегулированию коллективного иска.

Особенность американской судебной системы в том, что во время рассмотрения коллективных исков, представляющих интересы одного или нескольких пластов общества, вы можете в суде "расширить" нормы законов. При условии, что не вмешается Министерство юстиции и согласится судья, рассматривающий дело. Независимость судебной ветви власти во всей своей красе.
На протяжении 2,5 лет юристы Google, библиотек, издателей и Гильдии авторов вели сложнейшие переговоры, суть которых один из их участников кратко, но емко охарактеризовал как "четырехмерные шахматы" — надо было учесть интересы всех сторон.

Самая главная проблема, с которой столкнулись участники переговоров заключалась вот в чем. Ок, допустим, Google делает грандиозный интернет-магазин цифровых книг, в том числе и тех, авторы которых давно умерли, издательства закрылись и вообще непонятно, кому принадлежат права. Кому платить причитающуюся плату? Установление прав на получение денег в каждом конкретном случае стоило бы намного больше, чем любые возможные выплаты. То есть чисто экономически это было бессмысленно.

Но эту проблему решили, придумав создать единое агентство, которому бы шла плата за все старые книги. Наследники авторов и издателей могли бы в него обращаться за своей долей, а часть полученных средств там бы тратили на установление авторства. Поскольку обращались бы, конечно, далеко не все, то схема имела экономический смысл — кому все равно, "спонсировали" бы тех, кто хотел бы, чтобы ему заплатили. Причем правообладатели и авторы в любом случае получали бы 69% от цены электронной книги, а Google бы довольствовалась остальным.

Самое главное — при этом обходились бы нормы американских законов, запрещающих повторную публикацию книг, права на которые ужа давно утратили свою силу и не были заново оформлены.

Грандиозность соглашения привлекла внимание Министерства юстиции США, которое начало расследование и попросило всех, кто возражает против этого соглашения "говорить сейчас или молчать вечно".
Разумеется, возражения поступили. От Microsoft и Amazon с технологической стороны, а также от нескольких тысяч авторов, многие из которых, похоже, не до конца поняли суть соглашения. Против высказывались и многие уважаемые в "книжном" сообществе люди.

По мнению участников тех переговоров, активное противление сделки со стороны "авторитетов" решило вопрос — в Минюсте США вряд ли бы вняли только доводам Microsoft о том, что Google "нечестно" получает доступ ко всем печатным книгам ("Бо-о-о — главный конкурент против!"); не послушали бы там и Amazon, которая на тот момент контролировала 80% рынка электронных книг ("Бу-у-у — монополист на рынке возражает против нового игрока!").

Как полагают отдельные участники переговоров, среди тех авторитетных людей, что высказывались против соглашения, бытовало мнение о том, что сделку стоит завернуть, но потом Конгресс США все равно внесет нужные поправки в законы. Однако они не понимали, что законотворцев какие-то старые книги не интересуют от слова "совсем": с их помощью не выиграешь выборы и не создашь новые рабочие места. "Они, похоже, не понимали, как работает реальный мир", — с горечью замечает участник тех переговоров.

В итоге Минюст США высказал свое очень авторитетное мнение: судье не стоит одобрять сделку, поскольку она а)выходит за рамки сути иска (а иск был о том, можно ли Google показывать выжимки из книг); б)слишком эксклюзивная и создает очень плохой прецедент.

В самом деле — если бы Google договорилась с противниками-ставшими-партнерами в рамках процесса урегулирования коллективного иска, то любой другой технологической компании для получения таких же прав на создание подобного магазина электронных книг пришлось бы заново пройти весь путь. То есть: оцифровать книги —> быть засуженной правообладателями и авторами —> договориться с ними. По мнению чиновников Минюста США, это вообще никуда не годилось. Специально нарушать закон чтобы обойти закон?! Это перебор.

Ну и включить постфактум в иск в качестве ответчиков Microsoft, Amazon и кто бы там еще захотел создать свою цифровую библиотеку такого же масштаба — тоже не было никакой возможности. Это уж было совсем жесткое испытание для системы коллективных исков США, она бы такое не перенесла.

В итоге судья сделку не одобрил, в своем заключении процитировал Минюст США.



Формально в итоге победила, как мы сказали в самом начале, Google — ей позволено показывать отрывки из оцифрованных книг. Но проиграли — все. Читатели не получили гигантской цифровой библиотеки из всех-всех когда-либо напечатанных книг. Издатели и авторы не получили возможности получать постоянно небольшую денежку от их продажи. А Google "заморозила" траты в размере 400 млн. долларов. Даже выиграв, компания охладела к своему проекту и больше не сканирует книги. Кончился запал.
Сегодня где-то далеко на серверах Google лежат 50-60 петабайтов оцифрованных книг. Вот они, только руку протяни. Но доступ к ним имеют лишь несколько инженеров компании, ответственных за то, чтобы никто другой не получил к этим книгам доступ.

Два последних абзаца статьи настолько хороши и от них становится так больно, что мы их просто переведем:
Я спросил у тех, кто занимался этим [в Google] раньше: "Что надо сделать для того, чтобы эти книги были доступны всем?". Я хотел знать — насколько сложно было бы открыть к ним доступ. Что стоит между нами и цифровой публичной библиотекой из 25 млн. томов?

"У тебя были бы большие проблемы [юридического характера], — сказали мне — но все, что надо сделать — написать один запрос к базе данных. Так доступ бы переключился с "Выкл." на "Вкл.". На исполнение такой команды нужно несколько минут".

При помощи этого сервиса можно узнать, как часто слово упоминается в оцифрованных книгах

https://www.youtube.com/watch?v=cA9B9fsIxm4

http://masterok.livejournal.co...

https://cont.ws/@lionking/602812







Доктор Кутушов назвал болезни, которые поджидают отдыхающих у водоёмов

Дивный новый мир цифровизации: в Москве пройдет Форум «Время цифры»

Стоматолог Владимир Лосев: сколько времени нужно носить брекеты

Выгодно ли покупать квартиру в новостройке?


Конференция «Общество и психическое здоровье» прошла в Ставрополе

Пять морей и одно озеро: в России создадут новые круглогодичные курорты - стали известны подробности

ONYX отправляется в Большой тур по России

В РУМЦ МГППУ действует правовой просветительский лекторий для студентов с инвалидностью и сотрудников вузов-партнеров


Where to find Real Madrid vs Dortmund on US TV: June 1, 2024

When Narine asked Gambhir 'can I bring my girlfriend to IPL?'

Fentanyl distribution indictment follows Westminster traffic stop

Inside the mad Fenerbahce world Jose Mourinho is entering with rioting fans, players walking off and notorious hooligans


Одна ночь на Вуоксе

Денис Сафин перевел 100 миллионов рублей в фонд помощи пострадавшим от паводка

Военные следователи продолжают оказывать гуманитарную помощь военнослужащим, находящимся в полевых госпиталях

В Кировском районе Крыма проверили бывших мигрантов, не вставших на воинский учет


Конец близок в релизном трейлере Destiny 2: The Final Shape

Today's Wordle answer for Thursday, May 30

Четвёртое дополнение Age of Wonders 4: Eldritch Realms завершит первый цикл поддержки игры

Началась предрегистрация на Command & Conquer: Legions — релиз в конце 2024 года



Преступления мигрантов с рынков азербайджанского олигарха Года Нисанова продолжают шокировать Москву

Дивный новый мир цифровизации: в Москве пройдет Форум «Время цифры»

Дептранс Москвы раскрыл детали инцидента на станции метро "Спортивная"

Улыбка сделала слушателя «Юмор FM» миллионером


Грузовик опрокинулся в результате столкновения с легковушкой в Москве

"Лето в Москве. Все на улицу!": в столице начался уникальный городской фестиваль

Дивный новый мир цифровизации: в Москве пройдет Форум «Время цифры»

«СВЯТОЙ ЛЕНИН» легально изготавливает армии и спецслужбы. 6 серия. СЕРЬЁЗНЫЙ НОВОСТНОЙ СЕРИАЛ.


Подмосковный НИКИ детства провел онлайн-марафон «Бегом за здоровьем» 1 июня

Стало известно, как выглядит тайный зять Анастасии Заворотнюк

Татьяна Тарасова прибыла на церемонию прощания с Анастасией Заворотнюк

Знаменательное для Читы событие в сфере авиации произошло 88 лет назад


Итальянская забастовка: Рублёв, Котов и Самсонова вылетели с «Ролан Гаррос», Потапова обыграла Ван Синьюй

Парижские сюжеты: Медведев играл в кошки-мышки, Котов творил историю, Калинская заставляла нервничать Синнера

Теннисистка Петрова: Хачанов совершил недопустимую ошибку на "Ролан Гаррос"

В России отреагировали на "скрытую баранку" и достижение Рыбакиной на Ролан Гаррос


Знаменательное для Читы событие в сфере авиации произошло 88 лет назад

Актер театра Табакова Петров вспомнил, какой важный совет ему дала Заворотнюк

Татьяна Тарасова прибыла на церемонию прощания с Анастасией Заворотнюк

Депутат Селиверстов вместе с волонтерами провел забег «Бежим ЗА» в районе Братеево


Музыкальные новости

Гергиев с артистами Мариинского и Большого театров продолжат фестиваль «Гений места»

Концерты оркестра Бутмана посмотрели более 50 миллионов китайцев

Певец Юрий Лоза: «Я свой “Плот” писал год, отбирал по словечку»

Блогер Ивлеева устроила фотосессию в монастыре в Тихвине в леопардовой накидке и платке


Поезда задерживаются из-за схода вагонов в Приамурье

Дивный новый мир цифровизации: в Москве пройдет Форум «Время цифры»

Преступления мигрантов с рынков азербайджанского олигарха Года Нисанова продолжают шокировать Москву

Улыбка сделала слушателя «Юмор FM» миллионером


В Подмосковье сотрудники Росгвардии задержали подозреваемого в краже товаров из магазина

«СВЯТОЙ ЛЕНИН» спасает население от борьбы с перенаселением, 3 серия, СЕРЬЁЗНЫЙ НОВОСТНОЙ СЕРИАЛ.

В Екатеринбурге Росгвардия обеспечила правопорядок на переходном матче Чемпионата России по футболу

Певица Пелагея разделила имущество с бывшим мужем


Движение поездов в Амурской области восстановлено по одному пути

На МКАД в Москве частично пекрыли движение из-за массовой аварии

Юрист рассказал, как добиться компенсации за потопленный в дождь автомобиль

Дептранс: на закрытом участке метро Москвы работали 20 бесплатных автобусов


Путин провел совещание с членами Совета безопасности России

Лучшие фото за май // Запоминающиеся кадры месяца

Лучшие фото недели // Запоминающиеся кадры 27–31 мая

Руководство Краснодара посетило китайский Харбин. Рассказываем подробности




Подмосковный НИКИ детства провел онлайн-марафон «Бегом за здоровьем» 1 июня

Вышел второй подкаст онлайн-лектория «Иннагрика» о возможностях аграрной генетики для молодых исследователей

МК: американские стоматологи назвали неоднозначные продукты, от которых портятся зубы

AlfaBiom выпустили на рынок России БАД с красным ферментированным рисом


Зеленский: после «заморозки» конфликт опять вспыхнет

НАТО оказалась не готова к войне с Россией. Тайное соглашение США и Киева: Враг нацелился на Белгород - источники


Для пользы тела. «Мой спортивный район» начинает летние тренировки

День защиты детей празднуют в мире 1 июня

Певица Пелагея разделила имущество с бывшим мужем

Дептранс Москвы раскрыл детали инцидента на станции метро "Спортивная"


БЕЛТА: Лукашенко и Путин обсудили представительство России на параде в Минске

Путин и Лукашенко обсудили по телефону предстоящий саммит ШОС

Путин и Лукашенко обсудили парад в Минске


Собянин: Детский фестиваль искусств «Небо» станет праздником для всей семьи

Собянин: 1 июня начнется фестиваль «Лето в Москве. Все на улицу!»

Собянин посетил фестиваль "Москва – на волне. Рыбная неделя"

Сергей Собянин поздравил москвичей с Международным днем защиты детей


Жителям Подмосковья рассказали о лесопожарной обстановке в регионе на 1–3 июня

Портал «Малый бизнес Москвы» насчитывает более 200 тыс пользователей

Июнь в Москве начнется с аномально жаркой погоды

«Восход», Тинькофф Банк и Альфа объявили о совместном pre-IPO фонде в секторе tech на 4 млрд рублей


Актер театра Табакова Петров вспомнил, какой важный совет ему дала Заворотнюк

О, море! В Якутск приехал Айвазовский

Депутат Селиверстов вместе с волонтерами провел забег «Бежим ЗА» в районе Братеево

Татьяна Тарасова прибыла на церемонию прощания с Анастасией Заворотнюк


В Архангельске с рабочим визитом побывал «арктический» министр

ТСД промышленного класса Saotron RT-T60

XXXIII Церемония «Хрустальная Турандот» объявит победителей сезона 2023/2024

В филиале фонда «Защитники Отечества» в Архангельской области подвели итоги первого года работы


Литературно-музыкальный вечер «Песня как признание в любви»

Банки начали выдавать ипотеку на жилье в Крыму

ВТБ начал выдавать ипотеку на жилье в Крыму

Портативный сканер штрих-кодов Heroje H133U на базе CMOS-матрицы


Знаменательное для Читы событие в сфере авиации произошло 88 лет назад

Актер театра Табакова Петров вспомнил, какой важный совет ему дала Заворотнюк

Стало известно, как выглядит тайный зять Анастасии Заворотнюк

В Москве проходит церемония прощания с Анастасией Заворотнюк. Фото














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *