Internships
Register
Copyright © 2000—2025 JetBrains s.r.o.

Full line code completion (Summer 2021)

Description

Full-line code completion - проект, реализуемый в виде плагина для Intellij IDEA. Плагин расширяет возможности стандартного автодополнения кода, предлагая разработчику не только следующий возможный токен (имя переменной / метода и т.д.), но и последовательности из нескольких токенов, вплоть до целой строчки кода.

Сейчас для каждого языка программирования мы строим отдельную генеративную модель, но хотим посмотреть, насколько хорошо в проект встроится мультиязыковая модель. В частности, мультиязыковую модель мы хотим использовать для улучшения качества дополнений кода для языков с относительно маленькой кодовой базовой (например, Kotlin). За время практики нужно будет обучить модель на нескольких языках программирования (используя готовый пайплайн), исследовать изменения метрик качества предсказаний, а также имплементировать различные способы ускорения работы такой модели.

Requirements

  • Уверенное знание Python
  • Базовые знания по машинному обучению (основы построения моделей, метрики качества)
  • Опыт работы с Pytorch / Pytorch Lightning
  • Git, bash

Плюсом будет:

  • Опыт обработки текстов (или других sequential данных) с помощью нейронных сетей

Admission

Разработчики: Лето 2021

Mentor

Anton Semenkin

Mentor's location

Remote

Product/Team

IntelliJ IDEA

Tags

Data Science
Python