Анализ данных с использованием R и SQL
Лектор:
Ирина Никифорова получила PhD по социологии в Технологическом институте Джорджии. В настоящее время она является научным сотрудником Института фундаментальных междисциплинарных исследований НИУ ВШЭ. Она также является доцентом Кафедры методов и технологий социологических исследований факультета социологии кампуса НИУ ВШЭ в Санкт-Петербурге.
Аннотация:
Программы с открытым кодом, такие как система управления базами данных MySQL и язык программирования R, предназначенный для статистических вычислений, стали стандартными средствами анализа данных в академических и прикладных исследованиях. Эти инструменты могут использоваться в различных операционных системах, включая Windows, Linux и Mac OS. Данный курс предназначен для исследователей, обладающих навыками работы с R и специализирующихся в сфере статистического анализа данных в различных дисциплинах, которые хотели бы также освоить базы данных MySQL, методы их интеграции с R и способы разрешения возникающих при этом технических проблем.
В рамках курса будут представлены основные приёмы и средства управления реляционными базами данных, в том числе язык MySQL, правила формирования запросов в SQL, а также интеллектуальный анализ данных с помощью R. Кроме того, будут рассмотрены вопросы, связанные с совместимостью Excel, SPSS и MySQL, и использование статистических средств языка R.
Предполагается, что слушатели курса знакомы с языком программирования R и владеют навыками статистического анализа в R, а также имеют опыт работы с базами данными. Для участия в курсе требуется иметь личный ноутбук с установленными программами R, Excel и SPSS.
В рамках курса предусмотрены задания для самостоятельной работы.
Структура курса:
- Семинар 1: Принципы работы с базами данных и системы управления базами данных; установка и основы использования MySQLи SQLite
- Семинар 2: Навигация по базам данных: основы языка SQL и формирование запросов.
- Семинар 3: Комплексные запросы в SQL
- Семинар 4: Управление данными и совместимость
- Семинар 5: Интеллектуальный анализ данных в R.
Рекомендуемая литература:
- Bessant, Conrad, Shadforth, Ian, & Oakley, Darren. (2009). Building Bioinformatics Solutions: with Perl, R and MySQL. Oxford, UK: Oxford University Press.
- Spector, Phil. (2008). Data Manipulation with R (Use R!). New York: Springer.
- Torgo, Luis. (2010). Data Mining with R: Learning with Case Studies. Chapman & Hall/CRC.
- Welling, Luke, & Thomson, Laura. (2003). MySQL Tutorial. Indianapolis, Indiana, USA: MySQL Press.
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.