Сбербанк усиливает компетенции в технологиях распознавания текстов | статьи на inet-moll

Сбербанк участвует в разработке новых технологий распознавания текста, сообщил первый заместитель председателя правления Сбербанка Александр Ведяхин. «За последние два года технологии машинного перевода существенно продвинулись и вышли на прикладной уровень. Прежде всего это произошло за счет использования моделей глубокого обучения, а в последние полгода значительный прогресс стал возможен за счет активного развития так называемых языковых трансформеров, — рассказал он. — И хотя команда Сбера пока не занимается машинным переводом, наши недавние разработки в области обработки неструктурированной информации также вышли на новый уровень».

Произошло это, по словам Александра Ведяхина, прежде всего за счет усиления ставки на междисциплинарный подход: «Эксперты в предметной области работают в плотной связке со специалистами по глубокому обучению разных направлений — от обработки естественного языка (NLP) до компьютерного зрения (CV)».

Примером успеха такой коллаборации являются наработки, которыми Сбербанк уже начал делиться с профессиональным сообществом на соревнованиях по искусственному интеллекту в преддверии AI Journey 2020, сообщил Александр Ведяхин. «Один из таких хакатонов — как раз про понимание собственноручно написанных рукописей Петром I. Трек называется «Digital Пётр», который мы подготовили в партнерстве с Российским историческим обществом. В рамках него участникам предоставляется возможность улучшить алгоритмы распознавания рукописей со стартовой точностью в 92% до более высоких значений».

По сути дела, речь идет о понимании старорусского языка и так называемой скорописи — вида кириллического письма, популярного в период с XV вплоть до начала XIX веков, пояснил Александр Ведяхин. «На сегодняшний день это один из наиболее точных алгоритмов распознавания рукописного текста. И единственный алгоритм, способный «читать» старорусскую письменность, — подчеркнул он. — История имеет для России огромное значение, а технологии XXI века позволяют нам заглянуть в прошлое, понять, о чем думали и говорили наши великие предшественники. У нашего поколения есть уникальный шанс узнать из подлинных рукописей о том, как развивалось Российское государство, ведь это крайне важно для будущего нашей страны».

Ранее сообщалось, что технологию прямого перевода текстов между 100 языками на основе искусственного интеллекта разработал Facebook. В компании анонсировали систему, которая сможет переводить тексты без применения английского языка в качестве промежуточного. Большинство таких технологий сначала переводят тексты с источника на английский, а затем на другой иностранный язык. Из-за этого процесс получается сложным и громоздким, теряется точность некоторых элементов текста.

Чтобы создать новый искусственный интеллект, Facebook использовал сервис CommonCrawl для сбора текстовых примеров по всей сети. Разработчики проанализировали весь материал при помощи системы FastTex и сформировали базу данных из 7,5 млрд предложений, которые система использует для перевода.

Источник: ng.ru

Понравилась статья? Поделиться с друзьями:
Программы и компоненты
Добавить комментарий