Разработать функционал рекомендательного сервиса с использованием языка разработки Python.
Набор данных о веселых историях и их оценках пользователями состоит из таблицы оценок, где каждая строка соответствует отдельному пользователю, а каждыйй столбец - отдельной истории. В первом столбце указано количество историй, который оценил данный пользователь. Если в строке стоит значение “99”, то это эквивалентно значению null = пользователь не оценивал данную историю.
Название файла | Содержание файла |
---|---|
LR1-Advisory_service.py | Программа на языке Python |
LR1-Data.xls | Тестовые данные для программы |
Научиться применять метод байесовской классификации для распознавания эмоциональной окраски текстовых сообщений.
Массив данных состоит из двух папок pos и neg (положительная и отрицательная окраска), где хранятся в исходном виде в отдельных файлах англоязычные отзывы на фильмы.
Название файла | Содержание файла |
---|---|
LR2-Bayesian_classification_method.py | Программа на языке Python |
LR2-Data.7z | Тестовые данные для программы |
Массивы представляют данные различных предметных областей (медицина, сельское хозяйство, описание социальных групп и т.д.), используемые в задачах классификации. Все массивы взяты с открытого репозитория данных UC Irvine Machine Learning Repository. Для каждого варианта имеется: html-файл, описывающий структуру исходного массива данных, и текстовый файл, содержащий собственно сам массив данных.