Курсовая работа посвящена отработке навыков работы с библиотеками Pandas и Matplotlib.
• Провел разведочный анализ данных.
• Произвел расчет потенциальной нагрузки на преподавателей относительно каждого учебного курса.
• Выявил проблемные для прохождения модули на каждом курсе.
• Произвел расчет конверсии перехода студентов из одного модуля в другой для каждого курса.
• Разработал и предложил метрику оценки успеваемости студентов.
Перед вами стоит бизнес-задача – на основании имеющихся данных подготовить аналитический отчет, который в дальнейшем поможет продюсерам образовательных программ эффективно выстраивать стратегию по модернизированию и улучшению курсов. В начале отчета предлагается оформить емкий описательный блок по каждому курсу на основании рассчитанных показателей. Далее предлагается посчитать потенциальную нагрузку на преподавателей, чтобы оценить необходимость расширения штата сотрудников. Затем идет блок из двух пунктов по анализу качества контента курсов, где необходимо выявить проблемные модули, которые, возможно, требуют доработки. Также стоит задача выявить потенциальную сезонность. Наконец, предложено задание для самостоятельной разработки метрики успеваемости студентов для нахождения тех, кто значительно хуже справляются с прохождением курса. Каждый из пунктов анализа предполагается сопроводить аналитическим выводом на основании рассчитанных метрик.
courses.csv
содержит следующие значения:
id
– идентификатор курса
title
– название курса
field
– сфера, к которой относится курс
students.csv
содержит следующие значения:
id
– идентификатор студента
city
– город студента
birthday
– день рождения студента
course_contents.csv
содержит следующие значения:
course_id
– идентификатор курса
module_number
– номер модуля
module_title
– название модуля
lesson_number
– номер урока
lesson_title
– название урока
lesson_token
– токен урока
is_video
– наличие видео (true/false)
is_homework
– наличие домашней работы (true/false)
progresses.csv
содержит следующие значения:
id
– идентификатор прогресса
student_id
– идентификатор студента
course_id
– идентификатор курса
progress_phases.csv
содержит следующие значения:
progress_id
– идентификатор прогресса
module_number
– номер модуля
lesson_number
– номер урока
status
– статус прохождения урока
start_date
– дата начала
finish_date
– дата окончания