Предсказание успешности научной публикации Archived

Description

Проект
Значимость научной публикации определяется большим числом факторов, например:

1) престижность опубликовавшего журнала,

2) авторитет учёных, которые были вовлечены в работу,

3) актуальность темы исследования, и прочее.

Основным показателем того, насколько в итоге работа оказалась важной, является её уровень цитирования - количество других публикаций, которые ссылаются на данную работу. Объективное предсказание цитируемости работы позволит на ранних стадиях исследования понимать востребованность исследования научным сообществом.

Цель проекта - разработка модуля анализа публикаций для сервиса https://pubtrends.net, который будет предсказывать число цитирований научной статьи через два года и пять лет (для физики, биологии, химии, computer science). Для этого пользователь вводит название, аннотацию и дополнительные поля предполагаемой работы. В частности, для серверов препринтов arXiv, bioRxiv это позволит производить автоматический анализ новых статей, чтобы не пропустить потенциально важные работы в момент публикации.
Дополнительным сервисом может быть система рекомендаций журналов с высоким импакт-фактором, с указанием вероятности опубликования и ориентировочной продолжительности процессинга от submitted до accepted для увеличения уровня цитирования.
Кроме того, мы попробуем ответить на такие вопросы как: что отличает успешные статьи от менее успешных, какие факторы и как влияют на количество цитирований?

Пример работы про предсказание количества цитирований: Y. Dong, R. A. Johnson and N. V. Chawla, "Can Scientific Impact Be Predicted?," in IEEE Transactions on Big Data, vol. 2, no. 1, pp. 18-30, 1 March 2016, doi: 10.1109/TBDATA.2016.2521657

Данные – база данных публикаций Semantic Scholar, дополнительная информация о публикациях университета ИТМО.

Requirements

  • Понимание основных алгоритмов и структур данных
  • Опыт применения машинного обучения и анализа данных
  • Опыт работы с Python, Pandas, Git
  • Умение писать понятный код
  • Плюсом будет являться опыт работы с Postgresql / Flask / Bokeh / Docker
  • Интерес к работе с графовыми данными
  • Умение читать статьи на английском языке

Mentor

Oleg Shpynov

Contact details

internship@jetbrains.com

Location

Remote

Product/Team

JetBrains Research

Technologies

Data Science Machine Learning Python Research