Методы визуализации агрегированных эпигенетических данных Archived
Description
Группа BioLabs разрабатывает новые алгоритмы и методы анализа данных биологических экспериментов, и работает в тесном сотрудничестве с биологами над различными экспериментами по изучению старения.
Один из проектов группы – это масштабное лонгитюдное исследование связи изменений метилирования ДНК, генной экспрессии и метаболомики в процессе старения человека на выборке из более чем 100 людей. Для экспериментов с большим кол-вом образцов, задачи анализа и визуализации данных требуют дополнительных шагов по агрегации геномных данных.
В рамках стажировки вы будете работать над агрегацией и визуализацией экспериментальных данных, которые позволят выдвинут новые гипотезы о данных или наглядно представить результаты их анализа. Например, для различных типов данных нужно будет реализовать построение BigWig треков, отражающих:
- корреляцию сигнала в соседних геномных регионах;
- усредненный сигнал и его дисперсию по возрастным группам;
Построение геномных треков и таблиц должно быть оформлено в виде Snakemake pipeline.
По результатам работы над проектом возможно участие в публикации.
Перед собеседованием нужно выполнить тестовое задание, можно сделать его частично, но чем полнее, тем выше шансы на получение стажировки в этом проекте.
Вопросы можно задавать по почте: roman.chernyatchik@jetbrains.com
Requirements
- Понимание основ биоинформатики
- Базовые знания Python, умение работать с библиотеками Pandas/Numpy
- Понимание форматов файлов: Bed, BedGraph, Wig, BigWig
- Уверенное владение командной строкой Unix
- Приветствуется базовые знания статистики; опыт написания pipelines на Snakemake; владение Plot.ly, Matplotlib, Seaborn
Mentors
Oleg Shpynov, Roman Chernyatchik
Contact details
internship@jetbrains.com
Location
Remote
Product/Team
JetBrains Research