конспект лекций, вопросы к экзамену

Введение в данные панели

Панельные данные, иногда называемые продольными данными, представляют собой данные, которые содержат наблюдения о различных поперечных сечениях во времени. Примеры групп, которые могут составлять ряды панельных данных, включают страны, фирмы, отдельных лиц или демографические группы.

Как и данные временных рядов, панельные данные содержат наблюдения, собираемые с регулярной периодичностью в хронологическом порядке. Подобно перекрестным данным, панельные данные содержат наблюдения за коллекцией людей.

Панельные данные обладают рядом преимуществ:

  • Панельные данные могут моделировать как общее, так и индивидуальное поведение групп.
  • Панельные данные содержат больше информации, большую вариативность и большую эффективность, чем чистые данные временных рядов или перекрестные данные.
  • Панельные данные могут обнаруживать и измерять статистические эффекты, недоступные чистым временным рядам или перекрестным данным.
  • Панельные данные могут минимизировать погрешности оценок, которые могут возникнуть в результате объединения групп в один временной ряд.

Примеры панельных данных можно найти в экономике , социальных науках , медицине и эпидемиологии , финансах и физических науках .

Что такое пример панельных данных?

Сфера: Микроэкономика

Пример темы: ВВП в нескольких странах, безработица в разных штатах, исследования динамики доходов, сальдо международных текущих счетов.

Пример набора данных: панельное исследование динамики доходов (PSID)

2. Область: Макроэкономика.

Пример темы: таблицы международной торговли, таблицы мировых социально-экономических показателей, таблицы обменных курсов валют.

Пример набора данных: Penn World Tables

3. Область: эпидемиология и статистика здравоохранения.

Пример темы: данные государственного медицинского страхования, данные о выживаемости от болезней, данные о развитии и благополучии детей.

Пример набора данных: Обследование панели медицинских расходов

4 Сфера: Финансы

Пример темы: цены на акции по фирмам, волатильность рынка по странам или фирмам.

Пример набора данных: индексы глобального рынка

Что такое панельные данные?

Панельные данные - это совокупность величин, полученных от нескольких человек, которые собраны за равные промежутки времени и упорядочены в хронологическом порядке. Примеры отдельных групп включают отдельных людей, страны и компании.

Для обозначения как отдельных лиц, так и временных наблюдений, панельные данные часто относятся к группам с нижним индексом i, а время - с нижним индексом t. Например, наблюдение Yit на панельных данных наблюдается для всех индивидов i = 1,…, N за все периоды времени t = 1,…, T

Более конкретно:

Широкие и длинные наборы данных панелей

Наборы данных Panel могут быть разных форматов. Формат в приведенной выше таблице иногда называют данными длинного формата. Наборы данных в длинном формате объединяют наблюдения каждой переменной из всех групп за все периоды времени в один столбец.

Когда данные панели хранятся вместе с наблюдениями для одной переменной из отдельных групп, хранящихся в отдельных столбцах, это иногда называют широким форматом данных.

Сбалансированные панельные данные и несбалансированные панельные данные

Панельные данные также можно охарактеризовать как несбалансированные панельные данные или сбалансированные панельные данные:

  • В сбалансированных панельных наборах данных одинаковое количество наблюдений для всех групп.
  • Несбалансированные панельные наборы данных имеют пропущенные значения в некоторые периоды наблюдений для некоторых групп.

Некоторые модели панельных данных действительны только для сбалансированных наборов данных. Если наборы панельных данных несбалансированы, их может потребоваться сжать, чтобы включить только последовательные периоды, для которых есть наблюдения для всех лиц в поперечном сечении.

Панельные данные и неоднородность

Моделирование рядов панельных данных сосредоточено на рассмотрении вероятной зависимости между данными наблюдений в одной и той же группе. Фактически, основное различие между моделями панельных данных и моделями временных рядов заключается в том, что модели панельных данных допускают неоднородность между группами и вводят индивидуальные эффекты.

В качестве примера рассмотрим ряд панельных данных, который включает данные о валовом внутреннем продукте (ВВП) для панели из 5 разных стран, США, Франции, Канады, Греции и Австралии:

  • Мировая экономическая рецессия, вероятно, затронет все 5 стран и вызовет изменения в ВВП во всех 5 странах.
  • Выборы в Австралии, вероятно, повлияют на ВВП Австралии, но не могут повлиять на другие страны в группе.
  • Изменение торговой политики Северной Америки может повлиять только на США и Канаду на региональном уровне.
  • Изменение курса евро самым непосредственным образом коснется только Франции и Греции.

Модели панельных данных включают в себя методы, которые могут устранить эти неоднородности среди людей. Кроме того, чистые методы поперечных сечений и чистые модели временных рядов могут оказаться недействительными при наличии этой неоднородности.

Данные панели моделирования

Исследователи обычно анализируют наборы данных с множественными наблюдениями за набором перекрестных единиц (например, людей, фирм, стран) с течением времени. Например, можно иметь данные, охватывающие производство нескольких фирм или валовой продукт нескольких стран за несколько лет.

Моделирование этих рядов панельных данных - это уникальная ветвь моделирования временных рядов, состоящая из методологий, специфичных для их структуры.

В этом разделе более подробно рассматривается анализ панельных данных и связанные модели панельных данных.

Однородные и неоднородные модели панельных данных

Методы панельных данных можно разделить на две большие категории:

  • Однородные (или объединенные) модели панельных данных предполагают, что параметры модели являются общими для всех людей.
  • Гетерогенные модели позволяют любому или всем параметрам модели варьироваться от человека к человеку. Модели с фиксированными эффектами и со случайными эффектами являются примерами моделей разнородных панельных данных.

Внутри этих групп предположения об изменении модели у разных людей являются основными факторами, определяющими, какую модель использовать.

Рассмотрим простую линейную модель

yit = α + βxit + ϵit

Представленное выше представление представляет собой однородную модель:

  • Константа α одинакова для разных групп и времени.
  • Коэффициент β постоянен для разных групп и времени.
  • Любые различия между группами входят в модель только через термин ошибки it.

В качестве альтернативы, мы могли бы полагать, что группы имеют общие коэффициенты на регрессорах, но есть групповые перехватчики, как это зафиксировано в модели фиксированных эффектов или модели фиктивной переменной наименьших квадратов (LSDV).

yit = αi + βxit + ϵit

Представленное выше представление является гетерогенной моделью, поскольку константы αi зависят от группы.

Индивидуальные эффекты в панельных данных

В этом разделе рассматриваются четыре популярные модели панельных данных:

  • Объединенный обыкновенный метод наименьших квадратов.
  • Односторонние фиксированные эффекты.
  • Односторонние случайные эффекты.
  • Случайные коэффициенты.

Мы рассмотрим эти модели, используя предполагаемый процесс генерации данных, заданный формулой

yit = βxit + δzi + ϵit

В этой модели X представляет наблюдаемые характеристики, такие как возраст, размер фирмы, расходы, а Z представляет ненаблюдаемые характеристики, такие как качество управления, возможности роста или навыки.

Что такое объединенные обыкновенные наименьшие квадраты?
В некоторых случаях нет никаких ненаблюдаемых индивидуальных эффектов, и δzi является постоянным для разных людей. Это сильное предположение, подразумевающее, что все наблюдения в группах независимы друг от друга.

В этих случаях модель становится

yit = βxit + α + ϵit

Это означает, что при отсутствии зависимости внутри отдельных групп панельные данные можно рассматривать как один большой объединенный набор данных. Параметры модели β и α можно напрямую оценить с помощью объединенных обычных наименьших квадратов.

Линейная независимость внутри групп панели маловероятна, а объединенный OLS редко бывает приемлемым для моделей панельных данных.

Что такое модель односторонних фиксированных эффектов?
Модель данных панели с односторонними фиксированными эффектами :

  • Включает ненаблюдаемые временные или индивидуальные эффекты. Эти эффекты охватывают пропущенные переменные.
  • Предполагает, что индивидуальные эффекты коррелируют с наблюдаемыми характеристиками, xit
  • Объединенные оценки OLS для данных, сгенерированных этим процессом, будут несовместимы.
Данные фиксированных эффектов с групповыми пересечениями и одним общим уклоном

Все регрессии панельных данных, которые мы рассмотрели до сих пор, предполагали, что коэффициенты регрессоров одинаковы для всех людей. Модель случайных коэффициентов ослабляет это предположение и вводит индивидуальные эффекты через коэффициент, так что

yit = βixit + αi + ϵit

yit = (bi + β) xit + (αi + α) + ϵit

bi∼N (0, τi12)

ai∼N (0, τi22)

Эта модель вводит как отдельные эффекты наклона, так и учитывает гетероскедастичность через индивидуально-специфические τi12 и τi22.

Эта модель может быть оценена с помощью FGLS или оценки максимального правдоподобия (MLE) .

Двухсторонние модели индивидуальных эффектов

Модель двусторонних индивидуальных эффектов допускает наличие как временных, так и индивидуальных эффектов.

Исходя из простой линейной модели, представленной следующим образом:

yit = α + βxit + ϵit

двухсторонняя модель индивидуальных эффектов может быть представлена ​​как

yit = α + βxit + μi + λt + ϵit

В этой модели μi фиксирует любые ненаблюдаемые индивидуальные эффекты, а λt фиксирует любые ненаблюдаемые зависящие от времени эффекты. Обратите внимание, что индивидуальные эффекты, μi, не меняются со временем, в то время как временные эффекты, λt, не меняются у разных людей.

В особом случае, когда есть только две группы и два человека, эта модель эквивалентна модели разницы в различиях . Однако, если имеется более двух периодов времени и / или отдельных лиц, необходимо рассмотреть альтернативные модели панельных данных.

Что такое модель двусторонних фиксированных эффектов?
Модель двусторонних фиксированных эффектов:

  • Предполагает, что и μi, и λt являются ненаблюдаемыми фиксированными эффектами, которые необходимо оценить.

Для данных, созданных этой моделью:

  • Объединенные оценки OLS, которые игнорируют μi и λt, будут смещенными и непоследовательными.
  • Оценки односторонних фиксированных эффектов, которые игнорируют λt, будут смещенными.

Подобно односторонней модели фиксированных эффектов, эту модель можно оценить, включив фиктивные переменные. Однако в двухстороннюю модель с фиксированными эффектами фиктивные переменные должны быть включены как для периодов времени, так и для групп.

В большинстве случаев количество фиктивных переменных, включенных в модель двусторонних фиксированных эффектов, делает стандартную оценку методом наименьших квадратов слишком сложной в вычислительном отношении. Вместо этого двухсторонняя модель фиксированных эффектов оценивается с использованием внутригрупповой оценки, которая устраняет вариации как внутри групп, так и внутри периодов времени.

Что такое модель двусторонних случайных эффектов?
Модель двусторонних случайных эффектов:

  • Происходит, когда и μi, и λt являются ненаблюдаемыми стохастическими эффектами.
  • Предполагается, что μi и λt распределены независимо и не коррелируют с xit.

Для данных, сгенерированных этим процессом:

  • Объединенные оценки OLS будут беспристрастными. Однако оценки будут неэффективными, а соответствующие стандартные ошибки и t-статистика будут смещены.

Как и модель односторонних случайных эффектов, модель двусторонних случайных эффектов может быть оценена с использованием возможных обобщенных наименьших квадратов (FGLS) или оценки максимального правдоподобия (MLE).

Модель данных динамической панели
Ключевым компонентом чистых моделей временных рядов является моделирование динамики с использованием запаздывающих зависимых переменных. Эти запаздывающие переменные фиксируют автокорреляцию между наблюдениями одного и того же набора данных в разные моменты времени.

Поскольку наборы панельных данных включают компонент временных рядов, также важно учитывать возможность автокорреляции в панельных данных. Модель динамических панельных данных добавляет динамику каркасу индивидуальных эффектов панельных данных.

Рассмотрим модель индивидуальных эффектов, которая включает член AR (1)

yit = δyi, t − 1 + βxit + ϵit

компонент ошибки включает односторонние индивидуальные эффекты, такие как

ϵit = μi + νit

где μi фиксирует отдельные эффекты.

Введение зависимых переменных с запаздыванием в структуру индивидуальных эффектов:

  • И yit, и yi, t − 1 являются функциями от μi, поскольку μi не зависит от времени. Это означает, что как регрессор yi, t − 1 коррелирует с ошибкой.
  • Обычный метод наименьших квадратов (МНК) приведет к смещению оценок из-за серийной корреляции.

Модели динамических панельных данных обычно оцениваются с использованием структуры обобщенного метода моментов (GMM), предложенной Ареллано и Бондом (1991) .

Панельные данные и стационарность

В случае панельных данных, охватывающих небольшие временные рамки, нет необходимости беспокоиться о стационарности. Однако, когда панельные данные охватывают более длительные временные рамки, как это имеет место во многих рядах макроэкономических панельных данных, панельные данные необходимо проверять на стационарность .

Слабая стационарность, необходимая для многих методов моделирования панельных данных, требует только того, что:

  • Ряд имеет одинаковое конечное безусловное среднее и конечную безусловную дисперсию во все периоды времени.
  • Что автоковариации рядов не зависят от времени.

Нестационарные ряды панельных данных - это любые панельные ряды, которые не удовлетворяют условиям слабо стационарного временного ряда.

Отчасти из-за этих соображений было разработано большое поле исследований и литературы, посвященной модульным корневым тестам панельных данных.

Проверка единичных корней в панельных данных требует большего, чем просто проверка отдельных сечений на наличие единичных корней. Корневые тесты модуля данных панели должны:

  • Учитывайте как общие движения в группах, так и индивидуальные движения внутри групп.
  • Используйте соответствующее асимптотическое распределение, основанное на том, как быстро количество панелей (N) и количество периодов времени (T) растут относительно друг друга.
  • Определите, следует ли исходить из поперечной независимости или усиливать поперечную зависимость.

Вывод

После сегодняшнего блога вы должны понять основы панельных данных. Мы рассмотрели основы панельных данных, включая:

  • Структура панельных рядов данных.
  • Сравнение широких и длинных панельных серий данных.
  • Односторонние модели данных панели индивидуальных эффектов.
  • Двухсторонние модели данных панели индивидуальных эффектов.
  • Динамические панельные модели данных.
  • Ряды панельных данных и стационарность.

Источник: Эрика

24.01.2022; 05:00
просмотров: 36