Летняя школа Университета Эссекса
Анна Широканова рассказывает о поездке на одну из самых престижных летних школ по анализу данных в социальных науках!
Среди множества летних школ по анализу данных и применению статистических методов в социальных науках, школа университета Эссекса является одной из наиболее знаменитых и уважаемых. В этом году она проводилась уже в 45-й раз и собрала множество участников со всего света. Среди слушателей школы были также и сотрудники нашей Лаборатории. Анна Широканова, ассоциированный исследователь ЛССИ, написала о поездке в Эссекс для нашего сайта.
Летняя школа по методам анализа данных в Университете Эссекса - это замечательная возможность обновить и развить свои знания и навыки в области анализа данных, познакомиться с единомышленниками, работающими в вашей тематике, а также - что немаловажно - услышать о последних веяниях и событиях в научном мире. Публика здесь собирается фокусированная, так что немудрено подсесть во время обеда за столик к "совершенно своему человеку", работающему в другой стране и с таким же пылом бьющемуся над похожими научными проблемами. Летняя школа Университета Эссекса – это не просто традиция или удачное сочетание профессорского опыта и интереса слушателей, а устойчивый центр притяжения для молодых исследователей и известных преподавателей.
Здесь мы продолжили дискуссии с профессором Шмидтом, который накануне прочитал курс по моделированию структурными уравнениями на Второй летней школе ЛССИ. Среди русскоговорящих участников 2-й сессии 45-й Летней школы Университета Эссекса были сотрудники Лаборатории Ольга Грязнова, Мария Кравцова, Наталья Фирсова и я, а также знакомые по конференциям сотрудники Вышки (очень приятная тенденция!). Колчестер (самый старый город Британии), близ которого расположен университет Эссекса, встретил нас невероятно солнечной погодой. Несмотря на солнце, мы дружно выполняли программу: в 8.15 - общий курс математики, затем - утренняя или дневная 4-часовая сессия, состоящая из лекционной и лабораторной части.
В этот раз я слушала курс "Многоуровневый анализ с приложениями" (MLM) профессора Бристольского университета Кельвина Джонса. Отправляясь в прошлом году в Эссекс с Анной Немировской и Дарьей Орешиной, о многоуровневом анализе я могла только мечтать; а сейчас, после курса Херманна Дюльмера на Первой летней школе ЛССИ в 2011 году и R-сессий Э.Д. Понарина на Второй летней школе ЛССИ, я, как и другие исследователи Лаборатории, не только ориентируюсь в основах метода, но и, страшно сказать, могу сравнить его приложение в HLM, R, а теперь – и в MLwiN'е.
Основные отличия курса в Эссексе - использование визуальной оценки данных и внимание к интерпретации ковариаций, а также работа в программе MLwiN, предоставляющей богатые возможности для многоуровневого анализа. MLwiN разрабатывается в Бристоле уже много лет (один только курс профессора Джонса, читаемый в Эссексе, отметил в этом году своё двадцатилетие!), и за это время программа превратилась в практичную и достаточно удобную среду для решения задач многоуровневого анализа. К слову, за названием стоит не только оболочка, но и оригинальные алгоритмы, которые можно импортировать в STATA с помощью пакета runmlwin. В Бристольском центре MLM даже собрали коллекцию статей, использующих метод многоуровневого моделирования.
Тем временем сам метод MLM становится всё более востребованным для социолога! Говоря словами Иты Крефт и Яна де Люва, «как только узнаешь об иерархиях, начинаешь видеть их повсюду» [Kreft, de Leeuw, 1998]. И хотя это известное упрощение (данные не всегда иерархичны и часто сочетают множественные классификации), бурное развитие многоуровневого анализа, ставшее возможным благодаря разработке программ вроде MLwiN и развитию компьютерных технологий, обещает произвести настоящую революцию в мире социальных наук, где до сих пор царят регрессии!! Ведь зная возможности многоуровневого анализа и недостатки регрессионных оценок, доверять регрессионным моделям становится трудно. Последствия развития MLM для социальной и политической экспертизы будут значительны. Повторному анализу и, возможно, пересмотру подвергнутся старые, устоявшиеся данные. Известный британский пример из области образования - дискуссия о стилях преподавания. В 1976 году было опубликовано исследование Невилла Беннета, который на основе регрессионного моделирования пришел к выводу, что наиболее продуктивным, с точки зрения выпускных оценок учеников, является "традиционный" стиль преподавания в школе; это исследование вызвало публичный интерес и повлияло на образовательную политику правительства Великобритании. Повторный анализ данных Нилом Спенсером с помощью MLM показал, что, учитывая эндогенность (и иерархичность) анализируемых данных, существенной разницы в результатах между стилями преподавания не наблюдается. Таким образом, многоуровневый анализ сегодня - это действительно мощный и тонкий инструмент в руках аналитика.
Отдельно стоит сказать о программном обеспечении. По поводу удобства работы с программами MLwiN, HLM и R можно спорить, исходя из предпочитаемых вами эстетических, идеологических и дидактических позиций, но важно отметить, что попытки интегрировать MLM в SPSS пока безуспешны: реализуются пакеты, пишутся книги, но и на 2012 год MLM в SPSS не допускает вариации степени влияния переменных выше 1-го уровня. Профессор Джонс долго и сокрушенно скорбел по этому поводу…
Радость познания для нас прекрасно сочеталась и с интеллектуальным отдыхом: в выходной день участники школы ездили в Кембридж! Катание по каналам вдоль университетских колледжей, прогулки по этому живому и мелодичному городу, посещение знаменитой часовни Королевского колледжа, экспозиция о путешествии Дарвина на "Бигле" - все это лишь наиболее яркие моменты чудесного дня, который мы провели вдали от лабораторий и моделирования, но в живой и насыщенной академической атмосфере.
В заключение – немного о будущем (которое на самом деле уже становится настоящим!) многоуровневого анализа. Большую (но решаемую) проблему для исследователей сегодня составляет работа в разных пакетах программ и экспорт данных - для этой цели в Бристольском центре MLM была разработана и недавно запущена бета-версия системы Stat-JR, которая призвана обеспечить полную совместимость различного софта для анализа данных. Опробовать ее может каждый желающий!
Ещё один ближайший горизонт программирования (и это хорошая новость для студентов) - автоматическое создание индивидуализированных пособий, когда при загрузке данных и необходимой модели программа автоматически создает иллюстрированную книгу о том, что необходимо сделать, чтобы получить результат. Так что в ближайшей перспективе статистического образования - самообучение!
А пока на курсе по MLM нет свободных мест. В следующем году в Эссексе впервые планируется и курс по сложным моделям (многоуровневый факторный анализ, MCMC модели). Без ложной скромности уже сегодня хочется отметить, что в Лаборатории мы готовы к таким углубленным курсам и добиваемся нового качества наших количественных моделей, так что ЛССИ действительно идёт в ногу со временем. В добрый путь!
подготовила Анна Широканова