Анализ больших данных и биоинформатика - смотреть презентацию
Образовательная программа направлена на подготовку специалистов в области анализа больших данных, компьютерного моделирования и биоинформатики. Изучаются теоретические и прикладные задачи передачи, распределенного хранения, анализа и понимания распределенных наборов физических и биологических данных. Особое внимание уделено дисциплинам вычислительного интеллекта и системного анализа – компьютерному моделированию, интеллектуальному анализу больших данных, нейронным сетям, анализу медико-биологических цифровых изображений, современной статистике и биоинформатике, в том числе технологиям обработки данных геномного секвенирования нового поколения. Обучающиеся приобретают навыки разработки математических моделей, методов и программных средств обработки больших данных, полученных в физике, информатике, биоинформатике и прочих направлениях практической деятельности.
Партнеры программы
Бакалаврская программа «Анализ больших данных и биоинформатика» реализуется при активном участии будущих работодателей. Особенность программы — формирование квалифицированных специалистов, обладающих общесистемными и специализированными компетенциями на стыке современных научных и технологических направлений радиофизики, анализа больших данных и биоинформтики.
Основные партнёры программы:
- Биологический факультет БГУ;
- РНПЦ детской онкологии, гематологии и иммунологии;
- РНПЦ эпидемиологии и микробиологии;
- РНПЦ онкологии и медицинской радиологии им Н.Н. Александрова;
- факультет программной инженерии и компьютерной техники, Университет ИТМО, Санкт-Петербург, Российская Федерация;
- Department of Cancer Research, Luxembourg Institute of Health, Luxembourg;
- Laboratory of Biochemistry, Wageningen University, The Netherlands;
- Cell Biochemistry, University of Groningen, The Netherlands;
- Department of Chemistry, Philipps-Universität Marburg, Marburg, Germany.
Преимущества бакалавриата
- Востребованность на рынке труда
Стремительное развитие компьютерных технологий, вычислительных систем, электронного оборудования и облачных хранилищ информации дало толчок активному внедрению технологий анализа больших данных. На рынке труда чрезвычайно востребованы специалисты по работе с большими данными – ученый по данным (Data Scientist), инженер по анализу больших данных (Big Data Engineer), разработчик приложений для анализа больших данных на Java/Scala (Java/Scala/Big Data Developer), аналитик данных (Data Analyst), инженер по машинному обучению (Machine Learning Engineer), инженер по компьютерному зрению (Computer Vision Engineer) и прочие. Наблюдается устойчивая тенденция к расширению рынка труда для специалистов по биоинформатике, в функции которых входят задачи разработки и поддержки геномных и белковых баз данных, разнообразных биомедицинских информационных систем, программных технологий, средств и продуктов анализа больших биоданных.
- Междисциплинарность
Преимуществом бакалаврской программы является ее междисциплинарность. Применение технологий анализа больших данных открывает новые возможности перед аналитиками, исследователями и инженерами в области высокотехнологичных междисциплинарных исследований биоинформатики, биомедицины, фармацевтики, пищевой промышленности, биофотоники, энергетики, аэрокосмических систем. В числе основных задач следует отметить разработку перспективных методов анализа, интерпретации и хранения информации, создание инфраструктуры для приема, обработки и распространения результатов экспериментальных исследований.
- Фундамент для дальнейшего образования
Для углубленного и профессионального образования по профилю имеются как минимум пять предпосылок:
- Возрастающий интерес ко все более сложным научно-инновационным исследованиям прикладных систем. Примерами подобных систем являются фотосинтетические солнечные батареи, биомолекулярные клеточные структуры, квантовые точки, генная регуляция онкогенов. Результативность исследования данных систем напрямую связана с разработкой эффективных методов и алгоритмов обработки большого объема информации.
- Появление новейших высокопроизводительных датчиков и оборудования, позволяющих регистрировать большие объемы информации (до сотен терабайт). Например, устройства флуоресцентной спектроскопии однофотонного счета и фазово-модуляционные, микроскопии визуализации времени жизни флуоресценции, восстановления флуоресценции после фотообесцвечивания позволяют регистрировать большие наборы кинетических кривых затухания флуоресценции молекулярных систем в различных окружениях. Установки геномного секвенирования нового поколения обеспечивают определение нуклеотидного состава молекул ДНК с высокой точностью и решение задач расшифровки геномов живых организмов. В числе основных задач – разработка эффективных компьютерных программных средств для анализа, интерпретации и хранения генетической информации, создание инфраструктуры для приема, обработки, распространения геномных исследований.
- Развитее компьютерных технологий, вычислительных ресурсов, баз данных и хранилищ данных. Появление новейших вычислительных технологий и устройств дало толчок появлению высокопроизводительных вычислительных систем сбора и хранения данных, среди которых можно отметить распределенные вычислительные системы, Git, облачные хранилища. Указанные технологии необходимо эффективно уметь применять при решении прикладных задач.
- Развитие новых дисциплин и технологий анализа данных, таких как онлайн обработка данных (OLAP), аналитика данных (Data Analytics), машинное обучение (Machine Learning), искусственный интеллект (Artificial Intelligence), извлечение знаний (Knowledge Discovery), интеллектуальный анализ данных (Data Mining), анализ больших данных (Big Data). Создание и усовершенствование методов анализа данных в рамках указанных дисциплин, направленных на извлечение из хранилищ данных неочевидных, скрытых знаний и закономерностей, востребовано при решении большинства современных практических задач.
- Развитие подходов, связанных с компьютерным моделирование разнообразных процессов и систем в ходе анализа больших данных. Подходы к анализу данных с использованием имитационного моделирования применяются для исследования процессов переноса энергии электронного возбуждения в молекулярных системах, полимеризации белков в живых клетках, моделирования генных сетей, в алгоритмах интеллектуального анализа данных, использующих обучение с подкреплением (на их основе функционируют онлайн игры, бытовые приборы, автоматически пилотируемые устройства).
Указанные предпосылки формируют актуальность и необходимость для углубленного образования и получения новых знаний. Выпускники смогут продолжить обучение в магистратуре и аспирантуре в ведущих отечественных и зарубежных ВУЗах, научно практических и инновационных центрах.
Учебная программа
Основные дисциплины
Программа рассчитана на 4 года, 8 семестров. Последний семестр полностью отведен под производственную практику и написание дипломной работы.
Обучение начинается с фундаментальной подготовки в области математики, информатики, физики.
Основные дисциплины:
- математический анализ, аналитическая геометрия и высшая алгебра, дифференциальные уравнения, теория вероятностей и математическая статистика, дискретная математика;
- алгоритмы и структуры данных, программирование на С++, программирование на Java и Python, технологии программирования, базы данных, численные методы;
- механика, электричество и магнетизм, оптика, квантовая физика, термодинамика и статистическая физика;
Далее следует базовая подготовка в области радиофизики, электроники, информационных технологий, которая включает следующие дисциплины:
- архитектура компьютеров, операционные системы, компьютерные сети, микропроцессоры и микроконтроллеры;
- интеллектуальный анализ данных, искусственный интеллект и методы машинного обучения, цифровая обработка сигналов и вейвлет-анализ;
- основы радиоэлектроники, интегральная электроника, теория информации и основы статистической радиофизики, цифровая обработка сигналов и вейвлет-анализ.
На 3-4 курсах изучаются дисциплины специальности:
- основы кибербезопасности, безопасность информационных систем;
- теория распознавания, методы оптимизации и исследование операций, распределенные вычисления и облачные технологии, нереляционные базы данных;
- введение в биоинформатику, биоинформатика, анализ биомедицинских изображений, моделирование биофизических систем;
- программные технологии анализа больших данных, анализ больших данных, дискретно-событийное моделирование.
Перспективы после обучения. Места распределения выпускников
Выпускники востребованы инновационными и высокотехнологическими предприятиями, копаниями-резидентами ПВТ и Индустриального парка «Великий камень», учреждениями Национальной академии наук и высшего образования.
Выпускники, заинтересованные в научной карьере, могут продолжить обучение в магистратуре и аспирантуре. Если к концу программы потребуется сменить область деятельности, то полученное фундаментальное естественно-научное образование позволит быстро адаптироваться практически в любой области прикладной информатики.