Нейросеть поможет в поиске данных о предках россиян и исторических событиях
«Яндекс» расширил функционал сервиса «Поиск по архивам», добавив к архивным документам и периодике новый тип документов — справочники. Теперь пользователям доступны справочники из фондов Национальной электронной библиотеки и Российской государственной библиотеки — всего нейросеть расшифровала около 600 книг, или 275 тыс. страниц с адресами, списками государственных служащих и информацией о недвижимости.
Благодаря этому люди смогут получить больше сведений о своих предках. Так, в оцифрованных памятных книгах указаны списки ключевых персон губерний и их должности, из адресных книг можно узнать, где они жили, а установить род деятельности возможно с помощью торгово-промышленных справочников.
Кроме того, в справочниках содержится информация о регионах, ранее не представленных в «Поиске по архивам», например, о Санкт-Петербурге, Орловской, Воронежской и Калужской губерниях», — говорится в пресс-релизе «Яндекса».
Также в «Поиске по архивам» есть полные архивы «Советского спорта» и «Вечерней Москвы».
Сервис был запущен в 2023 году и постоянно совершенствуется. На данный момент в базе представлено свыше 12 млн страниц исторических документов XVIII–XX веков из архивов Москвы, Московской, Оренбургской, Вологодской, Иркутской, Астраханской и других областей, а также нескольких муниципальных архивов. Технология расшифровки основана на оптическом распознавании символов. Нейросеть узнает утратившие актуальность знаки (например, исчезнувшие из алфавита буквы), учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст.