Предсказание успешности научной публикации Archived
Description
Проект
Значимость научной публикации определяется большим числом факторов, например:
1) престижность опубликовавшего журнала,
2) авторитет учёных, которые были вовлечены в работу,
3) актуальность темы исследования, и прочее.
Основным показателем того, насколько в итоге работа оказалась важной, является её уровень цитирования - количество других публикаций, которые ссылаются на данную работу. Объективное предсказание цитируемости работы позволит на ранних стадиях исследования понимать востребованность исследования научным сообществом.
Цель проекта - разработка модуля анализа публикаций для сервиса https://pubtrends.net, который будет предсказывать число цитирований научной статьи через два года и пять лет (для физики, биологии, химии, computer science). Для этого пользователь вводит название, аннотацию и дополнительные поля предполагаемой работы. В частности, для серверов препринтов arXiv, bioRxiv это позволит производить автоматический анализ новых статей, чтобы не пропустить потенциально важные работы в момент публикации.
Дополнительным сервисом может быть система рекомендаций журналов с высоким импакт-фактором, с указанием вероятности опубликования и ориентировочной продолжительности процессинга от submitted до accepted для увеличения уровня цитирования.
Кроме того, мы попробуем ответить на такие вопросы как: что отличает успешные статьи от менее успешных, какие факторы и как влияют на количество цитирований?
Пример работы про предсказание количества цитирований: Y. Dong, R. A. Johnson and N. V. Chawla, "Can Scientific Impact Be Predicted?," in IEEE Transactions on Big Data, vol. 2, no. 1, pp. 18-30, 1 March 2016, doi: 10.1109/TBDATA.2016.2521657
Данные – база данных публикаций Semantic Scholar, дополнительная информация о публикациях университета ИТМО.
Requirements
- Понимание основных алгоритмов и структур данных
- Опыт применения машинного обучения и анализа данных
- Опыт работы с Python, Pandas, Git
- Умение писать понятный код
- Плюсом будет являться опыт работы с Postgresql / Flask / Bokeh / Docker
- Интерес к работе с графовыми данными
- Умение читать статьи на английском языке
Mentor
Oleg Shpynov
Contact details
internship@jetbrains.com
Location
Remote
Product/Team
JetBrains Research