Grazie – команда в JetBrains, отвечающая за поддержку естественного языка. Мы представлены встроенным плагином почти ко всем IDE JetBrains, а также плагином к Chrome. У нас есть система исправления грамматических ошибок, автодополнение естественного языка, суммаризация, перефразирование, свой опечаточник и детектор языков. В планах у нас расширять возможности поддержки языка и улучшать существующие.
Например, хочется помогать пользователям писать в соответствии со стилем, уместным в каждом из случаев. Это может быть полезно, если вы пишете официальное письмо или научную статью. В таких случаях неформальный стиль может быть неуместен и будет здорово, если кто-то вам подскажет это, а также поможет исправиться. Под стилем также понимается тональность текста, хочется учитывать и её.
Для этого нужно уметь определять стиль и тональность текста. Но даже если мы сделаем это правильно, нам этого недостаточно. Мы должны понять, какой на самом деле должен быть стиль в данном случае. Для этого можно учитывать контекст вокруг набираемого текста, а также специфику конкретного пользователя.
Поняв целевой стиль и научившись определять, какие слова ему не соответствуют, мы попробуем подобрать этим словам замену, чтобы текст лучше удовлетворял стилю письма.
Во время практики хочется сделать модель определения тональности и стиля текста. Далее с помощью этой модели можно будет понять, какие места в тексте ей соответствуют, а какие нет.
После этого хочется научиться корректировать генерирующие модели в сторону нужного тона (контролируемая генерация). В случае успешного прохождения практики, этой задачей можно будет заняться во время летней стажировки.
Контакты для вопросов: @aakhvorov, aleksandr.khvorov@jetbrains.com