Разпознавание кода поможет перевести скриншоты, которые прикладывают пользователи в баг трэкере YouTrack, в текстовый формат, что улучшит жизнь разработчикам, которым не нужно будет перепечатывать с них код руками, и поможет получить новые данные для алгоритмов машинного обучения, работающих с YouTrack.
Обучить модель для распознавания текста на синтетических данных. Для их получения предлагается скачать несколько репозиториев, написать скрипт, который открывает из них случайные файлы в IDEA и делает скриншот случайного места на экране, и таким образом получить размеченный датасет, так как мы знаем, какой конкретно текст содержится в редакторе.