Проект
Значимость научной публикации определяется большим числом факторов, например:
1) престижность опубликовавшего журнала,
2) авторитет учёных, которые были вовлечены в работу,
3) актуальность темы исследования, и прочее.
Основным показателем того, насколько в итоге работа оказалась важной, является её уровень цитирования - количество других публикаций, которые ссылаются на данную работу. Объективное предсказание цитируемости работы позволит на ранних стадиях исследования понимать востребованность исследования научным сообществом.
Цель проекта - разработка модуля анализа публикаций для сервиса https://pubtrends.net, который будет предсказывать число цитирований научной статьи через два года и пять лет (для физики, биологии, химии, computer science). Для этого пользователь вводит название, аннотацию и дополнительные поля предполагаемой работы. В частности, для серверов препринтов arXiv, bioRxiv это позволит производить автоматический анализ новых статей, чтобы не пропустить потенциально важные работы в момент публикации.
Дополнительным сервисом может быть система рекомендаций журналов с высоким импакт-фактором, с указанием вероятности опубликования и ориентировочной продолжительности процессинга от submitted до accepted для увеличения уровня цитирования.
Кроме того, мы попробуем ответить на такие вопросы как: что отличает успешные статьи от менее успешных, какие факторы и как влияют на количество цитирований?
Пример работы про предсказание количества цитирований: Y. Dong, R. A. Johnson and N. V. Chawla, "Can Scientific Impact Be Predicted?," in IEEE Transactions on Big Data, vol. 2, no. 1, pp. 18-30, 1 March 2016, doi: 10.1109/TBDATA.2016.2521657
Данные – база данных публикаций Semantic Scholar, дополнительная информация о публикациях университета ИТМО.