Методы визуализации агрегированных эпигенетических данных Archived

Description

Группа BioLabs разрабатывает новые алгоритмы и методы анализа данных биологических экспериментов, и работает в тесном сотрудничестве с биологами над различными экспериментами по изучению старения.

Один из проектов группы – это масштабное лонгитюдное исследование связи изменений метилирования ДНК, генной экспрессии и метаболомики в процессе старения человека на выборке из более чем 100 людей. Для экспериментов с большим кол-вом образцов, задачи анализа и визуализации данных требуют дополнительных шагов по агрегации геномных данных.

В рамках стажировки вы будете работать над агрегацией и визуализацией экспериментальных данных, которые позволят выдвинут новые гипотезы о данных или наглядно представить результаты их анализа. Например, для различных типов данных нужно будет реализовать построение BigWig треков, отражающих:

  • корреляцию сигнала в соседних геномных регионах;
  • усредненный сигнал и его дисперсию по возрастным группам;

Построение геномных треков и таблиц должно быть оформлено в виде Snakemake pipeline.

По результатам работы над проектом возможно участие в публикации.

Перед собеседованием нужно выполнить тестовое задание, можно сделать его частично, но чем полнее, тем выше шансы на получение стажировки в этом проекте.

Вопросы можно задавать по почте: roman.chernyatchik@jetbrains.com

Requirements

  • Понимание основ биоинформатики
  • Базовые знания Python, умение работать с библиотеками Pandas/Numpy
  • Понимание форматов файлов: Bed, BedGraph, Wig, BigWig
  • Уверенное владение командной строкой Unix
  • Приветствуется базовые знания статистики; опыт написания pipelines на Snakemake; владение Plot.ly, Matplotlib, Seaborn

Mentors

Oleg Shpynov, Roman Chernyatchik

Contact details

internship@jetbrains.com

Location

Remote

Product/Team

JetBrains Research

Technologies

Data Science Python