Сотрудники Carnegie Mellon University подсчитали, что ежедневно по всему миру люди заполняют 60 миллионов каптч-картинок, помогающих создателям сайтов убедиться в том, что вы - человек, а не программа, созданная для накрутки. Приняв время заполнения каптчи за 10 секунд, получаем более 160 000 человеко-часов (или около 19 лет) за день.
И они решили попытаться хотя бы малую часть пропадающих попусту усилий направить на полезное дело, а именно - на распознавание книг.
Суть идеи такова: на реКАПТЧЕ даются ДВА идущих подряд слова из книги, одно из которых система распознания текста не осилила. reCAPTCHA проверяет известное слово, а вариант распознания неизвестного добавляет в свою базу. Оба этих слова изменены обыкновенными и специальными каптча-фильтрами, чтобы пользователь не начал вбивать слова от балды.
Все новости номера »
|