Для сайта эффекты: Эффекты для ссылок, картинок и блоков на Вашем сайте с JQuery и CSS3
Эффекты для ссылок, картинок и блоков на Вашем сайте с JQuery и CSS3
Привет, друзья. Сегодня представляю Вам очередную подборку разнообразных полезностей, которые можно скачать и использовать на сайте. Тут Вы сможете бесплатно скачать такие штуки как анимированные логотипы, множество эффектов для ссылок на Вашем сайте, а так же несколько классных и креативных эффектов для изображений и блоков на сайте.
Большое спасибо http://www.cssauthor.com и рекомендую:
Логотип с двумя кругами и классным анимированным эффектом на CSS
Демо Ι Скачать
Анимированный логотип на CSS
Демо Ι Скачать
Отличный 3d логотип с крутой анимацией
Демо Ι Скачать
Логотип с крутой анимацией при наведении на CSS
Демо Ι Скачать
Ещё логотип с классной анимацией при наведении
Демо Ι Скачать
Несколько анимационных эффектов для больших букв
Демо Ι Скачать
Интересный эффект на CSS для ссылок на сайте
Демо Ι Скачать
Анимационное подчёркивание ссылки на чистом CSS3
Демо Ι Скачать
3 стильных эффекта для ссылок
Демо Ι Скачать
Креативные эффекты для ссылок
Демо Ι Скачать
Интересный эффект для ссылки при наведении
Демо Ι Скачать
Заголовки с анимационным эффектом
Демо Ι Скачать
Классные эффекты при наведении для навигационных ссылок
Демо Ι Скачать
Креативные эффекты для ссылок
Демо Ι Скачать
3d эффект при наведении на ссылку с CSS3
Демо Ι Скачать
Несколько различных эффектов при наведении на ссылки
Демо Ι Скачать
Простой но стильный эффект для ссылок на Вашем сайте
Демо Ι Скачать
Классный и креативный CSS3 и 3d эффект для ссылки
Демо Ι Скачать
Креативная анимация для блоков на сайте
Демо Ι Скачать
Классный анимационный эффект с изображениями
Демо Ι Скачать
Интересные эффекты для изображений на сайте
Демо Ι Скачать
Крутой эффект для картинок при прокрутке на JQuery
Демо Ι Скачать
Увеличение картинок при наведении
Демо Ι Скачать
Плагин для увеличения любого изображения на сайте
Демо Ι Скачать
Появление текста при наведении на блок
Демо Ι Скачать
Несколько простых эффектов при наведении на картинку
Демо Ι Скачать
Случайный цвет для блока на jQuery
Демо Ι Скачать
Всплывающая подсказка для сайта
Демо Ι Скачать
Множество крутых анимационных эффектов для блока
Демо Ι Скачать
Эффект при наведении на изображение
Демо Ι Скачать
9 удивительных эффектов для сайта, или Как это повторить?
У вас тоже часто бывает так, что зайдя на сайт и увидев там «классную штучку», вы ужасно хотите узнать, как же это сделали? Неважно, с целью повторить, использовать как базу для своего дизайна или просто полюбопытствовать «а что у него внутри?»
Туториалов и уроков много, но не всегда они достаточно понятны, и не всегда описанное в них применимо на реальном сайте. Я, например, тоже чаще встречаю оригинальные, привлекательные эффекты на живых сайтах, нежели в уроках и статьях.
Целью данной статьи является не просто показать вам интересные эффекты на разных сайтах, а и дать представление о том, как веб-мастера добились этих эффектов.
1. Эффект Parallax
Кликнув по картинке выше, вы попадете на сайт Nike. Покрутите колесико мышки вниз. Правда, прикольно? Это вариант так называемого эффекта Parallax. Он не так уж давно применяется в веб, но его уже можно встретить на десятках сайтов. На днях в статье о дружественном духе сайтов Дежурка публиковала пример дизайна персонажей от Турбомилк, где они используют палаллакс в более привычном варианте. А вот на сайте Silverback эффект заметен только в момент, когда пользователь изменяет размер окна браузера. Кому интересны научные стороны вопроса — загляните одним глазком в статью о параллаксе на Википедии, коротко и ёмко, как и всегда.
Как это делается
Ян Лунн написал отличнейший туториал о том, как воссоздать эффект параллакса с сайта Найк. Смотрим здесь.
2. Листаем страницы мышкой
На сайте Yess BMX представлен один из лучших, и в то же время крайне редко встречающихся эффектов. Попробуйте потянуть мышкой изображение вправо-влево.
И этот впечатляющий эффект не так уж и сложно повторить! Штука эта называется Dragdealer. Это JavaScript компонент, ориентированный на управление мышкой и имеющий воистину неограниченное количество вариантов развития и применения. Отличный подарок для программистов JavaScript.
Как это делается
Навигационное решение Dragdealer. Идем по ссылке и получаем кучу сведений.
3. Выдвигающиеся панели
Этот jQuery-эффект выдвигающихся панелек используется довольно широко, так что не упоянуть его здесь будет неправильно. Выглядит обычно очень внушительно, делаются такие слайд-панели относительно просто, причем способов существует множество. Ниже приводим один из них.
Как это делается
Фантастический туториал от Коннора Звика из Nettuts о том, как сделать форму авторизации, работающую по принципу выдвигающейся панели. Смотрим здесь.
4. Код Konami
Если честно, до недавнего времени даже не слышал о Конами-коде; тем большим было мое удивление и восторг от каждой новой страницы, которую я обнаруживал с помощью кода Конами. Создатель этого «пасхального яйца» был явно впечатлен чит-кодом, действовавшим в видеоиграх производства Konami еще с далекого 1986 года.
Зайдите на сайт, кликнув по картинке выше, и введите комбинацию, указанную в конце этого абзаца. Еще можете загялнуть на konamicodesites.com — получите массу удовольствия 🙂
К сожалению, не все сайты этого списка продолжают поддерживать Конами-код, но на многих он очень даже работает.
Как это делается
Мэтт Кирман предлагает старый, но проверенно эффективный коротенький скрипт, который введет вашу страницу в тайный орден Konami-кода. Смотрим, как воссоздать код Конами на Javascript.
5. Эффект всплывающего текста (Hover-эффект)
Думаю, вы видели этот эффект 100500 раз, но раз уж вам неохота разбираться, как он делается, мы решили привести здесь готовое решение 🙂
А если серьезно, этот всплывающий эффект несколько выходит из моды, так как его сейчас используют все, кому не лень. Однако вы же можете изменить этот эффект, как только заблагорассудится, и он уже не будет выглядеть так банально. Например, сделать эффект затемнения с изменением цвета рамки — будет выглядеть стильно и современно.
Как это делается
Урок от Noura Yehia о том, как сделать выдвигающуюся панель с hover-эффектом смотрим на DevSnippets.
6. Страница-прелоадер
Да, я знаю, многие их не любят. Но тут такой вариант, что просто любо-дорого глянуть. Это простой, но приятный jQuery скрипт. В приведенном примере с сайта Vivascom все включено: и радующая глаз анимация, и функциональная полоса загрузки, и графика, которая будет сопровождать вас на всех страницах сайта. Вообще, отмечу очень красивое управление.
Как это делается
Переходим на Gayadesign, находим там информацию, ссылку для скачивания скрипта и демонстрационный пример. Стильный прелоадер для сайта.
7. Полоса прокрутки
В разделе What We Do вышеуказанного сайта Sapphire Sound мы видим замечательно выглядящий скроллбар для прокрутки содержащейся в блоке справа информации. Желающим завести у себя подобный скролл стоит воспользоваться плагином jQuery под названием jScrollPane.
Это кросс-браузерный плагин от Кельвина Лака, который преобразует родные скроллы браузера (для элементов с соответствующими свойствами overflow) в HTML-структуру, которую легко применить через CSS.
Как это делается
На сайте jScrollPane вы найдете полную информацию о том, как скачать и где просмотреть демо плагина.
8. Колесо мышки
Заходя на сайт, я люблю проверять, а подумали ли разработчики над удобством для пользователя. Приведу в пример сайт агентства Креативные Люди. Это вообще потрясный сайт, да к тому же ребята внедрили управление колесиком мышки для прокрутки ленты своего портфолио. Зайдите в раздел Web, Brand или Social и крутите колесо на мышке.
Воистину, к чему ограничивать пользователя стрелками влево-вправо для навигации по списку, если у каждого на мышке есть куда более удобное управление? Мелочи вроде этой здорово повышают общий уровень качества страницы.
Как это делается
У Брэндона Аарона есть замечательный простой jQuery-плагин, поддерживающий управление с помощью колесика мышки. Зайдите на его страницу, чтобы узнать больше.
9. Слайдовая навигация
Как и весь дизайн на сайте Spoon Juice, навигация тут отличная. За что всегда люблю этот тип навигации, так это за юзабилити и эффективость. На сайте Spoon Juice применяется самописный скрипт, но вы можете написать ничуть не хуже, воспользовавшись туториалом, что приведен ниже.
Как это делается
Заходим на сайт Tympanus и читаем их увлекательный урок 🙂
По материалам статьи Рубена д’Оливьеры
Комментарии
[an error occurred while processing the directive]Похожие статьи
Случайные статьи
Интересные визуальные эффекты для сайта
Здесь расскажу вам про эффекты для сайтов (параллакс, эффект лупы, загнутых уголков, перелистывание картинки), которые заинтересовали меня, приведу наглядные примеры и ресурсы, где рассказано как их создать.
1. Эффект Parallax
Параллакс (c греч. «смена, чередование») — изменение видимого положения объекта относительно удалённого фона в зависимости от положения наблюдателя.
Пример можно посмотреть по следующей ссылке (при наведении на данную картинку двигайте мышку влево-вправо и вверх-вниз):
Трава, бабочки и лягушка на тростинке будут двигаться относительно фона при перемещении мышки по картинке.
http://www.jquery4u.com/demos/jquery4u-parallax-demo/
Как его осуществить? – можно посмотреть на этом же сайте (на английском языке, но подробно и не так сложно как кажется на первый взгляд):
http://www.jquery4u.com/animation/jquery-parallax-tutorial
На сайте wordpress.org есть 2-а плагина, позволяющих осуществить данный эффект:
Image Parallax
Наглядный пример данного плагина можно увидеть тут (официальный сайт самого плагина):
http://webmaestro.fr/blog/2012/image-parallax-plugin-for-wordpress/
WP Parallax Content Slider – больше напоминает обычный, но впечатляющий слайдер.
Наглядный пример данного плагина можно увидеть тут (официальный сайт самого плагина):
http://jltweb.info/realisations/wp-parallax-content-plugin/
(также с помощью данного плагина можно сделать что-то вроде такого:
http://ruseller.com/lessons/les826/demo/index.html
, только не нужно будет копаться в коде.)
2. Эффект лупы
Раньше на disqus.com стояло изображение, в котором с помощью лупы можно было рассмотреть мелкие детали, помню сам провел несколько минут в исследовании мелких деталей данной картинки. Сейчас дизайн сайта поменялся.
Другой наглядный пример можно увидеть по следующей ссылке:
http://www.dailycoding.com/Uploads/2011/03/imageLens/demo.html
Как все это сделать написано тут:
http://www.dailycoding.com/Posts/imagelens__a_jquery_plugin_for_lens_effect_image_zooming.aspx
А делается это через плагин Imagelens, который есть на wordpress.org.
Аналог вышеуказанного примера:
http://www.htmldrive.net/items/show/864/useful-zoom-into-picture-with-jquery
3. Эффект загнутых уголков сайта
После того как вы нажмете на данный уголок, он отогнется больше и будет видна информация, которую вы хотите преподнести вашим посетителям.
Наглядный пример можно увидеть тут:
http://rabvsety.ru/sozday-svoy-site/plaginy-dlya-wordpress/plagin-page-peel-uglovaya-reklama-na-sajte/
Данный эффект осуществляется с помощью плагина Page Peel, который есть на wordpress.org, сделать данный информационный уголок достаточно легко.
Инструкция по созданию уголка:
http://www.wordpressplugins.ru/look/page-peel.html
4. Листаем картинку мышкой
Ощущение такое, что вам дано маленькое окошко, через которое вы просматриваете большую фотографию, то есть картинку можно двигать мышкой влево-вправо, вверх-вниз.
Пример можно посмотреть по следующей ссылке, картинка расположена в самом внизу (как это создать описано там же, но опять же на английском языке):
http://code.ovidiu.ch/dragdealer/
Аналог вышеуказанного примера:
http://www.htmldrive.net/items/show/882/Simple-Image-Scroller-with-jQuery
PS: Данную статью постараюсь со временем дополнять.
Также думаю, что вас заинтересует следующая интересная статья:
– 80 удивительных слайдеров на JQuery и Карусель плагинов:
http://creativecan.com/2012/06/jquery-slider/
Создаем эффект воды для сайта на WebGL
Библиотека WebGL позволяет создавать в браузере удивительные 3D игры, сцены и эффекты. Пока большинство из них только для развлечений, но некоторые могут быть уже сегодня использоваться на динамичных сайтах. Сегодня мы бы хотели привести пример реализации эффекта воды, который не оставит Вас равнодушным. Впечатляет, что так просто можно реализовать объемную графику прямо в окне браузера. Кроме этого данная технология стремительно набирает обороты и пользуется популярностью в веб-дизайнеров. Советуем Вам присмотреться к данной технологии.
Много различным бесплатных шаблонов вы можете найти на сайте наших партнеров, также имеются и премиум шаблоны с круглосуточной техподдержкой и помощью в настройке:
Не стоит забывать, что работа всего лишь эксперимент, по этому может некорректно отображаться в устаревших версиях браузера, а еще требуют предварительной подгрузки которая зависит от скорости интернета, и так, давайте просмотрим, что у нас получилось.
Шаг 1. HTML
Стоит напомнить, что мы будем использовать небольшой плагин jQuery который называется ripples, именно данный плагин позволяет достичь такого эффекта, по этому после подключения, нам необходимо просто вызвать данную функцию, с помощью следующей команды:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 | $(document).ready(function() { try { $(‘body’).ripples({ resolution: 512, dropRadius: 20, //px perturbance: 0.04, }); $(‘main’).ripples({ resolution: 128, dropRadius: 10, //px perturbance: 0.04, }); } catch (e) { $(‘.error’).show().text(e); }
$(‘.disable’).show().on(‘click’, function() { $(‘body, main’).ripples(‘destroy’); $(this).hide(); });
setInterval(function() { var $el = $(‘main’); var x = Math.random() * $el.outerWidth(); var y = Math.random() * $el.outerHeight(); var dropRadius = 20; var strength = 0.04 + Math.random() * 0.04;
$el.ripples(‘drop’, x, y, dropRadius, strength); }, 400); }); |
В результате мы получаем достаточно простой но эффектный пример, в котором создается иллюзия колебания воды, такой эффект можно применить к различным разработкам на сайте.
Вот и все. Готово!
Читайте также:
13 крутых эффектов загрузки страницы
Рассмотрим, какие эффекты можно применить во время загрузки страницы. Такие эффекты довольно нетривиальны. Для создания анимированной части, используем библиотеку Snap.svg. Эта библиотека позволяет создавать любые формы, пригодные к использованию в качестве анимации загрузки. Основной целью является создание слоя, отображающегося во время загрузки, чтобы пользователь видел готовую страницу, а не процесс ее загрузки.
Эффекты загрузки страницы, смотреть и скачать:
ДемоСкачать
Для этого сначала подключим SVG:
<div data-opening=»M 0,0 80,-10 80,60 0,70 0,0″ data-closing=»M 0,-10 80,-20 80,-10 0,0 0,-10″> <svg xmlns=»http://www.w3.org/2000/svg» viewBox=»0 0 80 60″ preserveAspectRatio=»none»> <path d=»M 0,70 80,60 80,80 0,80 0,70″/> </svg> </div> |
Благодаря атрибуту class с именем pageload-overlay блочный элемент <div> будет отображаться на всей странице. В это время будет происходить загрузка запрашиваемой пользователем страницы. Присвоив элементам width и height тега <svg> значение 100%, мы зададим отображение нашего слоя на весь экран.
Используя CSS, присвоим нашему слою состояние по умолчанию. В этом состоянии он должен быть скрыт.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 |
.pageload-overlay { position: fixed; width: 100%; height: 100%; top: 0; left: 0; visibility: hidden; }
.pageload-overlay.show { visibility: visible; }
.pageload-overlay svg { position: absolute; top: 0; left: 0; }
.pageload-overlay svg path { fill: #fff; }
.pageload-overlay { position: fixed; width: 100%; height: 100%; top: 0; left: 0; visibility: hidden; }
.pageload-overlay.show { visibility: visible; }
.pageload-overlay svg { position: absolute; top: 0; left: 0; }
.pageload-overlay svg path { fill: #fff; } |
Заданное значение position:absolute отображает наш блок поверх содержимого страницы, что, собственно, и требовалось для того, чтобы закрепить слой поверх содержимого запрашиваемой страницы.
Осталось подключить пару скриптов:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 |
<script src=»js/snap.svg-min.js»></script> <script src=»js/classie.js»></script> <script src=»js/svgLoader.js»></script> <script> (function() { var pageWrap = document.getElementById( ‘pagewrap’ ), pages = [].slice.call( pageWrap.querySelectorAll( ‘div.container’ ) ), currentPage = 0, triggerLoading = [].slice.call( pageWrap.querySelectorAll( ‘a.pageload-link’ ) ), loader = new SVGLoader( document.getElementById( ‘loader’ ), { speedIn : 300, easingIn : mina.easeinout } );
function init() { triggerLoading.forEach( function( trigger ) { trigger.addEventListener( ‘click’, function( ev ) { ev.preventDefault(); loader.show();
setTimeout( function() { loader.hide(); classie.removeClass( pages[ currentPage ], ‘show’ ); currentPage = currentPage ? 0 : 1; classie.addClass( pages[ currentPage ], ‘show’ ); }, 2000 ); } ); } ); }
init(); })(); </script> |
Данные эффекты загрузки страницы можно применять на целевых страницах (лендингах). Добавлять такие эффекты на другие типы сайтов обычно не рекомендуют. Однако, как показывает практика, такие эффекты допустимы, в зависимости от дизайна сайта.
Возможно, Вам будет интересно ↓↓↓
10 примеров параллакс эффекта на сайте — Блог Active vision
Параллакс эффект на вашем сайте — это прекрасный способ удивить посетителей и улучшить поведенческий фактор. Такой сайт выглядит привлекательно и ваш посетитель как минимум потратит время на то, чтобы рассмотреть его.
Топ 10 сайтов с параллаксомПараллакс эффект наиболее часто использовался в играх. И в последнее время приобрел второе дыхание на веб ресурсах,
которые хотели добавить себе индивидуальности. Создать такой эффект не очень сложно, у нас есть подробная инструкция
как сделать параллакс на js.
Мы подобрали для вас 10 самых впечатляющих сайтов с примерами параллакса, чтобы вы могли вдохновиться на свой собственный дизайн. Но прежде, чем перейти к ним, давайте разберем что же это за эффект и почему он так привлекает внимание пользователей.
Что такое параллакс скроллинг?
Давайте отделим два слова друг от друга и разберем каждый по отдельности.
Параллакс — это зрительная разница в расстоянии между объектами на переднем и заднем плане. Скроллинг — это прокрутка экрана, то есть перемещение графики и текста в двухмерном пространстве.
Ну а параллакс скроллинг — это техника в веб дизайне, когда элементы фона на переднем и заднем плане двигаются с разной скоростью при прокрутке окна браузера. Это создает эффект трехмерного пространства.
Как создать параллакс скроллинг на своем сайте?10 примеров, которые взорвут ваших посетителей!
Если правильно и гармонично использовать эффект параллакса, то можно создать уникальный пользовательский опыт. Но если сделать плохо, то это отпугнет ваших посетителей или будет отвлекать от основной цели сайта. Будьте особенно осторожны с мобильной версией, там перебор с параллаксом может настолько замедлить работу браузера, что посетитель вашего сайта может сильно расстроиться. Рекомендуем тестировать поведение пользователей, чтобы добиться хороших результатов.
Примеры:
Два крутых американских дизайнера создали сайт, где рассказывают историю своих отношений и используют при этом параллакс скроллинг. В результате получился романтический рассказ, дополненный классной графикой.
10 потрясающих примеров параллакс скроллинга
Твитнуть Пример №1На этом сайте вы можете посмотреть всю историю интернета. Это довольно увлекательно, а параллакс эффект добавляет динамики истории.
Пример №2Этот ресторан расскажет вам о своем заведении, меню и поворах с помощью приятных иллюстраций дополненных параллакс эффектом. Только, пожалуйста, не открывайте этот сайт, если вы голодный.
Пример №3Хоть тема финансов считается довольно сухой и скучной, этот сайт умудрился сделать из этого увлекательную историю, по просмотру которой вы побежите открывать себе счет.
Пример №4Очень аккуратное и не навязчивое применение параллакс эффекта вы можете увидеть на сайте, посвященном волкодаву по имени Ворон. На этом сайте есть как текстовые параллакс эффекты, так и анимации Ворона, подкрадывающегося к своей жертве.
Пример №5Epicurrence — это конференция для творческих людей, которая проводится в Америке, штате Колорадо. Срезу на главном экране нас встречает параллакс эффект с использованием надписи и гор. В меру и со вкусом.
Пример №6Сюрреалистичные иллюстрации в сочетании с параллаксом дают незабываемый пользовательский опыт, проверьте сами!
Пример №7Пожалуй, самый яркий промо сайт в этой подборке! На нем вы во всей красе увидите замороженные итальянские морепродукты.
Пример №8На сайте эпл реализована горизонтальная прокрутка. За счет параллакс эффекта можно покрутить и повертеть Ipad как только вы захотите. Как всегда минималистичное и стильное решение.
Пример №9Возможно вы уже встречали ранее этот сайт как пример параллакса. Но нужно признать, сделан он фантастически. Яркая иллюстрация заката и множество слоев параллакса покоряют с первого раза.
Пример №10Чтобы повторить это у себя на сайте, можете посмотреть наш туториал по параллаксу на js библиотеке SimpleParallax. Вы нашли больше интересных примеров? Оставляйте их в комментариях, лучшие мы добавим в наш топ.
CSS3 hover effects, сделать эффект при наведении сайт wordpress – info-effect.ru
Продолжаем разбирать самые интересные и полезные плагины для сайта wordpress. Сегодня вы узнаете как создать на своём сайте эффект при наведении на изображение или кнопку. С помощью простых шорткодов вы сможете создавать анимационные эффекты. При наведении курсора мыши на изображение или кнопку, будет появляться прозрачный слой и подзаголовок. В изображение можно будет добавлять ссылку, можно делать анонсы записей и т.д. (смотри gif скриншот)
Установить плагин Hover Image Button вы сможете прямо из админ-панели wordpress. Перейдите на страницу: Плагины – Добавить новый, введите название плагина в форму поиска, нажмите Enter, установите и активируйте плагин.
После установки и активации плагина, перейдите на страницу: Настройки – Hover Image Button. Здесь вы сможете настроить основные параметры плагина.
– Color, здесь можно указать html код цвета при наведении.
– Opacity, здесь можно задать уровень прозрачности.
– Width, ширина кнопки или изображения по умолчанию.
– Height, высота кнопки или изображения по умолчанию.
– Code, можно добавить свой CSS код.
– Сохраните изменения.
Чтобы добавить на сайт готовые анонсы записей или кнопки с эффектами, перейдите в Детали плагина. На вкладке “Описание”, внизу страницы, у вас будут готовые шорткоды, которые нужно скопировать и добавить на страницу. В шорткоды нужно вставить свои данные.
– title, здесь нужно указать свой заголовок, который будет отображаться на изображении или кнопки.
– subtitle, здесь можно указать свой подзаголовок.
– link, здесь можете указать свою ссылку страницы, на которую будут попадать при нажатии на изображение.
– image, укажите здесь URL адрес изображения или кнопки.
Копируете шорткод, добавляете свои данные, вставляете шорткод на страницу, на сайте будут отображаться готовые анонсы. Всё готово !
Site Effect — обзор
Полная модель
Наконец, мы подбираем полную модель со случайными эффектами сайта, общим линейным временным трендом, эффектами случайного наблюдателя, эффектами случайного года и фиксированным эффектом наблюдателя первого года. Основываясь на оценках в предыдущей модели, мы в достаточной степени ограничиваем стандартные отклонения случайных эффектов (т.е. указываем меньший диапазон для равномерных априорных распределений), чтобы WinBUGS не легко потерял численно. Также увеличиваем длину цепочки.
# Укажите модель на языке ОШИБОК
раковина («GLMM5.txt»)
cat («
модель {
# Priors
mu ~ dnorm (0, 0,01) # Общий перехват
beta1 ~ dnorm (0, 0,01) # Общая тенденция
beta2 ~ dnorm (0, 0,01) # Эффект наблюдателя за первый год
для (j in 1: nsite) {
alpha [j] ~ dnorm (0, tau .alpha) # Случайные эффекты сайта
}
tau.alpha <- 1 / (sd.alpha * sd.alpha)
sd.alpha ~ dunif (0, 3)
for (i in 1: nyear) {
eps [i] ~ dnorm (0, tau.eps) # Эффекты случайного года
}
tau .eps <- 1 / (sd.eps * sd.eps)
sd.eps ~ dunif (0, 1)
для (k в 1: nobs) {
гамма [k] ~ dnorm (0, tau .gamma) # Случайные эффекты наблюдателя
}
tau.gamma <- 1 / (sd.gamma * sd.gamma)
sd.gamma ~ dunif (0, 1)
# Likelihood
для ( i в 1: год) {
для (j в 1: nsite) {
C [i, j] ~ dpois (lambda [i, j])
lambda [i, j] <- exp (log.лямбда [i, j])
log.lambda [i, j] <- mu + beta1 * год [i] + beta2 * first [i, j] + alpha [j] + gamma [newobs [i, j] ] + eps [i]
} #j
} #i
}
«, fill = TRUE)
раковина ()
# Bundle data
win.data <- list (C = t (C), nsite = nrow (C), nyear = ncol (C), nobs = 272, newobs = t (newobs), first = t (first), year = ((1: 9) -5) / 4 )
# Начальные значения
inits <- function () list (mu = runif (1, 0, 4), beta1 = runif (1, −1, 1), beta2 = runif (1, −1, 1), alpha = runif (235, −1, 1), gamma = runif (272, −1, 1), eps = runif (9, −1, 1))
# Контролируемые параметры
params < - c («mu», «beta1», «beta2», «alpha», «gamma», «eps», «sd.alpha »,« sd.gamma »,« sd.eps »)
# Настройки MCMC
ni <- 12000
nt <- 6
nb <- 6000
nc <- 3
# Вызов WinBUGS из R (BRT 11 мин)
out7 <- bugs (win.data, inits, params, "GLMM5.txt", n.chains = nc, n.thin = nt, n.iter = ni, n .burnin = nb, debug = TRUE, bugs.directory = bugs.dir, working.directory = getwd ())
# Summarize posteriors
print (out7, dig = 2)
mean sd 2.5% 25% 50% 75% 97,5% Rhat n.eff
mu 2,08 0,10 1,87 2,01 2,07 2,14 2,27 1,02 570
beta1 0,02 0,09 -0,16 -0,04 0,01 0,07 0,24 1,04 3000
beta2 0,02 0,02 -0,02 0,01 0,02 0,04 0,07 1,00 3000
альфа [1] -2,43 0,37 -3,18 -2,66 -2,41 -2,18 -1,75 1,00 790
альфа [2] -2,10 0,41 -2,92 -2,37 -2,08 -1,81 -1,33 1,01 210
альфа [3 ] 0,36 0,26 -0,15 0,20 0,36 0,53 0,87 1,01 400
[…]
альфа [233] 1,63 0,30 1,04 1,43 1,62 1.83 2,25 1,01 300
альфа [234] 1,55 0,20 1,17 1,41 1,54 1,69 1,94 1,04 60
альфа [235] 1,78 0,20 1,41 1,64 1,77 1,92 2,17 1,04 61
гамма [1] 0,06 0,25 -0,44 -0,10 0,06 0,23 0,58 1,00 3000
гамма [2] −0,01 0,34 −0,70 −0,24 −0,02 0,22 0,65 1,00 610
гамма [3] −0,50 0,27 −1,05 −0,68 −0,50 −0,32 0,00 1,00 1800
[…]
гамма [270 ] -0,57 0,28 -1,15 -0,75 -0,56 -0,38 -0,03 1,00 1600
гамма [271] 0,02 0,23 -0,44 -0,14 0.02 0,17 0,48 1,00 1300
гамма [272] −0,27 0,20 −0,66 −0,41 −0,28 −0,13 0,08 1,07 36
eps [1] 0,01 0,10 −0,19 −0,05 0,01 0,07 0,24 1,03 220
eps [2] 0,10 0,09 −0,08 0,04 0,09 0,15 0,28 1,03 130
eps [3] −0,14 0,07 −0,29 −0,18 −0,14 −0,10 0,01 1,03 75
eps [4] −0,09 0,06 −0,22 −0,13 −0,10 −0,06 0,02 1,04 55
eps [5] 0,06 0,06 -0,06 0,02 0,06 0,09 0,16 1,05 45
eps [6] 0,09 0,06 -0,04 0,06 0,09 0,13 0,21 1,06 52
eps [7] 0.21 0,08 0,05 0,16 0,21 0,25 0,35 1,06 66
eps [8] −0,16 0,09 −0,36 −0,22 −0,15 −0,10 0,02 1,06 110
eps [9] −0,07 0,11 −0,30 −0,14 −0,06 0,00 0,14 1,06 130
sd.alpha 1,31 0,07 1,18 1,26 1,30 1,35 1,45 1,00 3000
sd. гамма 0,34 0,03 0,28 0,32 0,34 0,36 0,40 1,00 640
sd.eps 0,17 0,06 0,09 0,13 0,15 0,19 0,32 1,02 130
отклонение 10687.47 1.00 2200
Похоже, что существует большая разница в подсчетах синицы из-за различий между участками, а также из-за различий между наблюдателями.Тем не менее, мы отмечаем, что эффекты места и наблюдателя в некоторой степени смешаны, так как только от одного до нескольких наблюдателей проверяются на каждом участке и что наблюдатели не распределяются по участкам случайным образом. Существует довольно небольшая дисперсия по годам. Ни год как непрерывная ковариата (бета1), ни эффекты наблюдателя за первый год (бета2) не кажутся важными, поскольку их 95% CRI покрывает ноль с большим отрывом. Что касается последнего, мы повторяем, что эффекты наблюдателя первого года смешиваются с эффектом первого года.Для более тщательной оценки эффектов наблюдателя в первый год мы можем повторить анализ только для 2–9 лет.
На этом мы завершаем обзор различных вариантов пуассоновской GLMM. Спешим сказать, что модели в этой главе являются чисто феноменологическими и не обязательно являются лучшими моделями для подсчета животных. Например, мы не встроили какую-либо динамику численности населения: изменения от года к году не являются автокоррелированными, как можно было бы ожидать, из-за эффектов зависимости от плотности или показателей жизнедеятельности, вызывающих эти изменения.Для моделей, которые включают такой дополнительный экологический реализм, см. Главы 5 и 11 Глава 5 Глава 11.
Эффекты площадки | Тихоокеанская северо-западная сейсмическая сеть
Большинство из нас заметили, что высота и характеристики океанских волн на разных близлежащих пляжах могут сильно различаться (например, серфингисты распознают определенные пляжи как особые места с их собственными названиями), даже если глубоководные волны одинаковы и постоянны.
Сейсмические волны также изменяются местными геологическими условиями.Эти вариации известны как эффекты места, и они могут сильно влиять на характер и силу тряски на данном участке. Эффекты сайта включают следующие пять факторов.
1) Мягкость почвы или камня под участком.
Упругие свойства материалов Земли варьируются от твердых (трудно деформировать — например, гранит) до мягких (относительно легко деформировать — например, грязь). Сейсмические волны проходят через твердые породы быстрее, чем через более мягкие породы и отложения.По мере того, как волны переходят от более глубоких твердых пород к более мелким и мягким, они замедляются и становятся больше по амплитуде по мере накопления энергии. Чем мягче камень или почва под участком, тем больше волна. Более мягкие почвы усиливают движение грунта.
2) Общая толщина почвы до коренной породы.
Связанная с прямым эффектом усиления мягких материалов Земли, геометрия мягких отложений может еще больше искажать движение грунта на участках мягких пород.Сейсмические волны, входящие в долины, заполненные наносами, такие как долина реки Дувамиш, могут улавливать сейсмическую энергию так, что она отражается, как звук в эхо-камере. Это может привести как к увеличению амплитуды, так и к увеличению продолжительности сотрясения. Поскольку такие эффекты имеют геометрическую природу, они зависят от характеристик набегающей волны, и их направление приближения может быть очень трудно предсказать.
3) Осадочные бассейны (глубокое геологическое строение).
По сути, это тот же процесс, что и в пункте 2 выше, но в более широком масштабе. Таким образом, он воздействует на низкочастотные сейсмические волны и может иметь более широкие эффекты и влиять на более крупные конструкции, которые, как правило, более чувствительны к низкочастотным движениям. Глубокие осадочные бассейны могут иметь большое влияние на движение грунта над ними. Волны землетрясений, распространяющиеся с высокой скоростью через твердые кристаллические породы земной коры, преломляются и резко замедляются при входе в бассейн.Это увеличивает амплитуду волн землетрясений, а резкий контраст плотности мягких пород бассейна с окружающим материалом может вызвать отражение волн, задерживая энергию в бассейне на определенный период времени. Это увеличивает продолжительность встряхивания. Из-за своего размера эти глубокие геологические структуры могут влиять на сотрясение на большой территории.
4) Возможность разрушения земли (см. Разжижение и оползни).
Разрушения грунта могут быть такими же впечатляющими, как большой оползень, или гораздо более незаметными, когда подповерхностные разжиженные грунты приводят к неравномерному оседанию конструкции наверху, но результаты обоих типов повреждений могут привести к большим потерям.
5 ) Топография
Было установлено, что особенности, присутствующие на поверхности Земли, влияют на интенсивность сотрясений. Некоторые исследования распределения интенсивности сотрясений, испытанных во время землетрясения, пришли к выводу, что участки на вершине холма часто сотрясаются на один уровень интенсивности выше, чем близлежащие участки с более пологим рельефом.
Моделирование эффектов сайта в дизайне и анализе многопозиционных испытаний
Am J Злоупотребление алкоголем. Авторская рукопись; доступно в PMC 2012 1 сентября.
Опубликован в окончательной редакции как:
PMCID: PMC3281513
NIHMSID: NIHMS342987
, Ph.D., 1 , Ph.D., 2 and, MA 1Daniel J. Feaster
1 Отдел биостатистики, Департамент эпидемиологии и общественного здравоохранения, Медицинская школа Миллера Университета Майами
Susan Mikulich-Gilbertson
2 Кафедры психиатрии и биометрии / информатики, Университет Колорадо, Денвер
Ахнали М.Бринкс
1 Отдел биостатистики, Департамент эпидемиологии и общественного здравоохранения, Медицинская школа Миллера Университета Майами
1 Отдел биостатистики, Департамент эпидемиологии и общественного здравоохранения, Медицинская школа Миллера Университета Майами
2 Кафедры психиатрии и биометрии / информатики, Университет Колорадо, Денвер
См. Другие статьи в PMC, в которых цитируется опубликованная статья.Более половины опубликованных исследований Сети клинических исследований по лечению злоупотребления наркотиками (CTN) NIDA продемонстрировали значительный эффект от места лечения или от места к лечению (1).Сам по себе этот факт свидетельствует о важности тщательного рассмотрения включения сайтов в анализ многопозиционных клинических испытаний лечения наркозависимости. Выбор статистических данных для моделирования влияния места на результаты лечения имеет важное значение как для планирования испытаний, так и для интерпретации результатов. Мы представляем и обсуждаем различные варианты обработки эффектов площадки в статистической модели и влияние каждого из них на построение и интерпретацию оценки обработки.
Точка зрения исследователя на эффекты площадки должна хотя бы частично зависеть от целей проекта. Если проект больше ориентирован на определение эффективности лечения, а несколько сайтов используются в первую очередь для облегчения найма субъектов, влияние сайта можно рассматривать как помеху в статистическом анализе (2). Большинство фармацевтических исследований, особенно исследований относительно редких состояний, подпадают под эту категорию. В этих испытаниях влияние места считается отклонением из-за методов, которые необходимо контролировать в анализах.И наоборот, если цель исследования состоит в том, чтобы установить, что конкретный подход к лечению имеет широкую применимость, делая больший упор на сторону эффективности континуума исследования, то влияние участка становится значительно более важным, и вариативность на разных участках может дать представление об условиях в какой лечебный подход эффективен.
Есть несколько факторов, которые могут вызвать различия в местах проведения исследования. Эффективность лечебного подхода может быть связана с некоторыми характеристиками людей, которых обычно можно найти на определенном участке.Например, есть основания полагать, что участники одного сайта могут иметь больше общего друг с другом, чем с участниками с других сайтов. Подумайте об общих наблюдаемых характеристиках, которые могут быть связаны с результатом. Характеристики, вызывающие эту однородность, могут исходить от самих клиентов. Например, если социально-экономический статус (SES) связан с результатом, и есть большие различия в SES между сайтами, анализ покажет влияние сайта на переменную результата в результате этих различий в SES.Эффективность лечебного подхода также может быть результатом контекстного аспекта сайта. Например, сайт может обслуживать только тех участников, чья основная проблема связана с алкоголем, опиоидами или какой-либо другой категорией наркотиков. Сайты также могут иметь определенные подходы / философию к лечению или системы оплаты / возмещения, которые влияют на тип клиента, привлеченного на этот сайт. Такие характеристики сайта могут привести к тому, что пул клиентов внутри сайта будет более однородным, чем клиенты на нескольких сайтах.Наконец, могут быть факторы, связанные с местностью, которые приводят к различному ответу на лечение. Конкретные подходы / философия к лечению или системы оплаты / возмещения могут не только привлечь определенную группу клиентов, но также могут напрямую влиять на результаты лечения. Например, на разных объектах могут быть различия в управлении или персонале, что приводит к различиям в реакции на лечение. Наконец, условия лечения могут непреднамеренно различаться на разных сайтах.
Статистические подходы к управлению различиями участков
Существует три широких аналитических подхода к управлению эффектами участков: 1) игнорировать их, 2) моделировать их как фиксированные эффекты и 3) моделировать их как случайные эффекты.Как мы покажем, если присутствуют эффекты сайта, их игнорирование может иметь пагубные последствия для качества статистического вывода. В этом случае более подходящим выбором может быть моделирование эффектов площадки как фиксированных или случайных. Как мы обсудим, в случае непрерывных результатов и линейных моделей (то есть моделей, линейных по параметрам), многие различия между этими подходами исчезают, когда в центрах будут равные размеры выборки и равные пропорции участников, назначенных для каждого условия лечения.К сожалению, в большинстве исследований выборки разных сайтов различаются. Чем больше различаются эти размеры выборки, тем больше разница в оценках эффекта лечения по статистическим методам обработки участка.
Мы представляем влияние моделирования эффектов участка с использованием этих трех подходов в моделях, включая либо основной эффект одного участка, либо главный эффект участка и участка при взаимодействии лечения. На всем протяжении мы предполагаем, что рандомизация происходит внутри сайтов (т.е. отдельные лица, а не сайты, являются уровнем рандомизации), что переменная результата является непрерывной, а статистическая модель является линейной.Мы используем подход ковариационного анализа, чтобы описать, как различные оценки эффектов лечения работают в многоузловой структуре:
y i j = α + β x i j + e i j
(1,10005
где i = 1 ,,,, n j индексирует индивидов внутри сайта, j = 1, .. S, индексирует сайты, x ij — дихотомический индикатор лечения, а y ij — результат для субъекта i в сайте j и e ij — остаточная ошибка.И y ij , и x ij можно разложить на их внутрисайтовые и межсайтовые вариации. Эти различные источники вариации можно использовать в двух простых линейных моделях для получения двух различных оценок эффекта лечения. Оценка внутри участка удаляет зависящее от участка среднее значение результата и назначения лечения из индивидуального значения соответствующей величины:
yij − y ‒ .j = βw (xij − x ‒ .j) + (eij − e ‒ .j)
(1,2)
а оценка между участками основана на конкретных средствах оценки результатов и назначении лечения для конкретных участков:
г.j = α + βbx ‒ .j + e ‒ .j
(1,3)
Внутренние и промежуточные оценки основаны на ортогональном разложении и, следовательно, являются независимыми источниками вариации. Эти две оценки лечебного эффекта используются позже в нашем исследовании фиксированных и случайных локальных эффектов.
В нашей презентации мы сначала обсудим последствия игнорирования сайта в анализе. Затем мы рассматриваем модель только с основным эффектом участка, а затем модель, которая также включает взаимодействие от участка к лечению; для обеих этих моделей обсуждаются последствия определения сайта как фиксированного или случайного.Представлен краткий пример требований к размеру выборки для этих различных моделей, и мы завершаем обсуждение и обобщение вопросов, касающихся воздействия на место проведения испытаний на нескольких участках.
Игнорирование эффектов сайта
Kraemer (3) продемонстрировал, что при наличии средних различий в исходах по сайтам игнорирование влияния сайта может привести к сильно различающимся оценкам взаимосвязи между состоянием лечения и исходом. Эти оценки различаются в зависимости от доли субъектов в каждом учреждении и от того, варьируется ли количество субъектов, назначенных для условий лечения, в разных учреждениях.
Игнорирование сайта может также исказить оценку стандартной ошибки эффекта лечения, если существует нетривиальная тенденция для участников в пределах одного сайта быть более похожими по переменной результата, чем у участников между сайтами. Игнорирование этой однородности в анализах приведет к завышению статистической значимости эффекта лечения (4, 5), даже если участники рандомизированы в пределах участка (6). Величина этого смещения зависит как от того, насколько вариативность результатов объясняется местом (внутриклассовая корреляция, ICC), так и количеством участников, набранных на каждом участке (7, 8, 9).В большинстве испытаний в рамках CTN количество участников на сайт составляет не менее пятидесяти и часто ближе к 100. Даже если сайт объясняет только 1% дисперсии в исходе (ICC = 0,01), это приводит к увеличению дисперсии на 25% или 50% для сайтов размером 50 и 100 соответственно. Это, в свою очередь, означает, что стандартные ошибки, оцененные без учета этого эффекта сайта, должны быть увеличены на 12% и 22% соответственно, чтобы быть точными. Таким образом, поскольку почти невозможно исключить такие небольшие эффекты сайта до запуска многосайтового испытания, игнорирование влияния сайта на самом деле не является жизнеспособным вариантом.
Главный эффект сайта
Фиксированный основной эффект для сайта
Влияние сайта на результат можно оценить как фиксированный эффект, включив индикаторную переменную для каждого сайта:
yij = α + βf1xij + ajdj + eij, ∑i = 1Saj = 0, eij ~ N (0, σe2)
(1,4)
где d j — фиктивный показатель для участка j, α — среднее значение результата для контрольной группы, β f 1 — разница между контрольным средним ( α ) и средним значением группы лечения. (я.е., эффект лечения), a j — отклонение среднего результата для участка j от общего среднего результата. Ограничение позволяет включать фиктивные индикаторы для всех сайтов и постоянный член в полноранговую модель. Этот подход приводит к локальному анализу лечения по исходу, потому что включение фиктивных переменных, зависящих от сайта, приводит к отклонению каждого предиктора (например, лечения) от его среднего значения. Таким образом, оценка лечения в этом случае основана на — изменение участка ( β f 1 = β w , из уравнения 1.2.), а вариации между участками удаляются из оценки лечения. Когда существует только фиксированный основной эффект для участка (т. Е. Когда в модель не включено взаимодействие между участками лечения), оценка эффекта лечения, основанная на стандартных суммах квадратов Типа III, взвешивается по размеру выборки участка. . В результате, если размер выборки на разных участках сильно различается, этот разброс включается в анализ, и предполагаемый эффект лечения представляет собой средневзвешенное значение эффектов лечения на разных участках.
В исследовании с равной долей людей в разных центрах и равным числом пациентов, назначенных каждому условию лечения, различия в назначении лечения между учреждениями не могут объяснить какие-либо вариации в переменной результата. Чтобы проиллюстрировать это, рассмотрим оценку эффекта лечения, основанную на вариабельности между участками (уравнение 3). Индикатор лечения между участками лечения, x ‒ .j, представляет собой долю участников, назначенных на участок экспериментального лечения j. Если размер выборки и пропорция, отнесенная к экспериментальному лечению, одинаковы на каждом участке, это среднее значение показателя лечения не будет различаться для разных участков, поэтому назначение лечения не может объяснить какую-либо вариабельность среднего результата по участкам.Таким образом, когда у нас есть постоянные пропорции людей, назначенных для лечения по всему участку, и нет взаимодействия между участком лечения, анализ эффектов лечения на месте не предполагает потери информации.
Примеры испытаний с использованием фиксированных эффектов для Зоны
Первые два испытания в рамках CTN для проверки эффективности управления в непредвиденных обстоятельствах + обычное лечение (TAU) по сравнению с одним только TAU для злоупотребления стимуляторами проанализировали свои данные с и без эффекта фиксированного места в модель.CTN 0006 включал восемь программ амбулаторного психосоциального лечения (10). Включение сайта в качестве предиктора исхода не повлияло на выводы исследования (что управление непредвиденными обстоятельствами было эффективным в увеличении количества мочи без наркотиков, увеличении удержания и продолжительности воздержания). Аналогичным образом, в CTN 0007, который включал шесть пунктов поддерживающей метадоновой терапии, Site был важным прогностическим фактором в дополнительных анализах, но не изменил выводов о том, что управление на случай непредвиденных обстоятельств эффективно увеличивало воздержание от стимуляторов в клиниках поддерживающей терапии метадоном на уровне сообщества (11).
Преимущества и недостатки фиксированного основного эффекта для сайта
Основным преимуществом использования подхода фиксированного эффекта сайта является простота реализации. Еще одно преимущество состоит в том, что когда количество участников на каждом сайте равно, а назначение условию сбалансировано, определение размера выборки становится простым. Единственный фактор, влияющий на количество сайтов в исследовании, — это выбор достаточного количества сайтов для достижения необходимого общего размера выборки для получения адекватной мощности. Общий необходимый размер выборки является одинаковым, независимо от того, все ли участники прибывают с одного места или с нескольких (хотя для каждого участка должен быть включен дополнительный участник, чтобы учесть степени свободы, используемые при оценке средних для конкретного участка) .Однако, если в исследовании планируется использовать одинаковые размеры выборки по сайтам, но в действительности достигается несбалансированный размер выборки по сайтам, статистическая мощность снижается (12).
Основным недостатком подхода на основе эффекта фиксированного участка является то, что анализ зависит от участков в рамках модели, т. Е. Отсутствует статистическая основа для обобщения на более широкую совокупность участков, которые могли бы быть в исследовании, или для которых вмешательство может в конечном итоге быть осуществлено. Как и в исследовании с одним центром, единственный способ оценить, будет ли лечение иметь аналогичные результаты с определенным типом пациентов, — это качественно оценить, был ли образец в исследовании аналогичен этому типу пациентов.Исследование не дает информации о том, как статистически оценить вероятность эффективности лечения для участника из другого сайта. Другой недостаток заключается в том, что интерпретация общего эффекта сайта зависит от предположения об отсутствии взаимодействия между участком лечения (см. Ниже).
Главный случайный эффект для участка
В модели эффекта случайного участка в модель включается компонент дисперсии для учета вариабельности результата из-за различий между участками:
yij = α + βr1xij + sj + eij, sj ~ N (0, σs2), eij ~ N (0, σe2)
(1.r1 = [∑j = 1s∑i = 1nj (xij − x ‒ .j) 2∑j = 1s∑i = 1nj (xij − x ‒ .j) 2 + θ∑j = 1s (x ‒ .j − x — ..) 2] bw + [θ∑j = 1s (x ‒ .j − x — ..) 2∑j = 1s∑i = 1nj (xij − x ‒ .j) 2 + θ∑j = 1s (x ‒.J − x — ..) 2] bb,
(1,6)
где θ = σe2σe2 + Sσs2 а веса — это количества в больших квадратных скобках. Обратите внимание, что вес на b w имеет вариацию назначения лечения в числителе, тогда как вес на b b имеет вариацию назначения лечения в числителе. Если ни размеры выборки, ни пропорции, назначенные для условий лечения, не различаются в разных учреждениях, то вариабельность между учреждениями в назначении лечения равна нулю (что приводит к x‒.j − x — .. = 0 для всех j, вес внутрисайтового компонента, b w должен быть 1, а вес межузлового компонента b равен 0). В этом случае как оценка, так и стандартная ошибка для эффекта лечения будут равны полученным из модели фиксированного эффекта сайта (13). Однако, если размеры выборки или доли участников в условиях лечения различаются в зависимости от места проведения, то оценка лечения будет представлять собой средневзвешенное значение различий в лечении внутри учреждения и между компонентами участков.Поскольку оценка эффекта случайного участка включает больше информации (то есть компонент между участками), чем оценка эффекта фиксированного участка, стандартные ошибки эффекта обработки должны быть меньше в модели случайных эффектов.
Примеры испытаний с использованием случайного основного эффекта для участка
К настоящему времени было проведено три испытания CTN, в которых участок моделировался как случайный эффект: CTN-0005 с пятью участками, в котором сравнивали мотивационное интервью с TAU (14), CTN-0009 с семью участками, который тестировал лечение для прекращения курения + TAU по сравнению с одним TAU (15), и CTN 0019 с 12 участками, который тестировал группы по формированию навыков безопасного секса по сравнению со стандартными образовательными группами по ВИЧ / ЗППП для женщин в целях снижения рискованного сексуального поведения в связи с ВИЧ. (16).Как это часто бывает, когда эти модели публикуются в рецензируемых журналах, в этих трех испытаниях не было представлено никакой информации о вариациях, связанных с сайтом. В исследовании CTN-0005 были представлены эффекты лечения в каждом месте для основных исходов и обсуждалась вариабельность участков в контексте оценки фиксированного эффекта для измерения точности лечения в исследовании.
Преимущества и недостатки случайного основного эффекта для участка
Основным преимуществом метода случайного воздействия на участок является то, что оценка эффекта лечения всегда столь же эффективна (т.е., имеет, по крайней мере, такую же маленькую стандартную ошибку), как оценка, полученная с помощью модели фиксированного эффекта площадки. При наличии дисбаланса в размере выборки или пропорциях лиц, находящихся в условиях лечения, в разных местах, метод случайного эффекта сайта даст более эффективную оценку эффекта лечения, чем метод фиксированного эффекта сайта. Недостаток такого подхода в том, что он требует минимального количества сайтов. Некоторые одобрили как минимум пять сайтов в качестве ориентира (13). Хотя некоторые рекомендуют большее количество сайтов, эти рекомендации относятся к случаю, когда делается попытка смоделировать ковариату на уровне сайта в качестве объяснения изменчивости сайта (17).В отличие от своего аналога с фиксированным эффектом, модель случайного эффекта сайта действительно обеспечивает статистическую основу для обобщения результатов вмешательства на сайты вне исследования. Репрезентативность участков, участвующих в испытаниях, должна быть принята во внимание при попытке обобщить результаты на участки вне испытания. Любые обобщения, выходящие за пределы исследовательских центров, уместны только при твердом предположении, что нет взаимодействия между участками лечения.
Взаимодействие от участка к лечению
Если участки различаются по эффективности экспериментального лечения, то существует взаимодействие от участка к лечению.Точно так же, как невозможно предсказать, что не будет основного эффекта от места проведения, также невозможно предсказать, что в многосайтовом исследовании не будет взаимодействия от участка к лечению. Kraemer и Robinson (18) решительно выступают за включение взаимодействия как между участком, так и между участком лечения, в анализ клинических испытаний, проводимых на нескольких участках. Результаты многих исследований, проведенных в CTN, также подтверждают необходимость учитывать взаимодействие от участка к лечению (14; 19; 20).
То, как в модели задается основной эффект для участка, определяет, как указывается взаимодействие от участка к лечению, т.е.е., если сайт считается фиксированным (случайным) эффектом, то взаимодействие считается фиксированным (случайным) эффектом. Два метода моделирования взаимодействия от участка к лечению, как фиксированного или случайного эффекта, имеют очень разные основные принципы. Подход со случайным эффектом предполагает наличие вариабельности эффекта лечения в разных местах и пытается оценить эту вариабельность, чтобы полученная оценка эффекта от лечения проверяла, лучше ли экспериментальное лечение в среднем , чем контрольное лечение.Подход с фиксированным эффектом пытается контролировать как основной эффект сайта, так и взаимодействие между участками лечения, но не моделирует изменчивость этих терминов, возникающую из-за различий участков.
Метод фиксированного эффекта обычно применяется в надежде, что взаимодействие между участком лечения будет статистически незначимым и его можно будет исключить из модели. Однако взаимодействие от участка к лечению часто оказывается недостаточным, что означает, что статистически незначимое взаимодействие от участка к лечению может иметь мало значения (18).Чтобы компенсировать это, взаимодействие от участка к лечению часто оценивается с использованием более высокого уровня альфа (например, p <0,10; 21). Когда в подходе с фиксированным эффектом наблюдается значительное взаимодействие от участка к лечению, существуют разногласия по поводу того, следует ли сообщать об общем эффекте лечения, и если да, то как рассчитать эту оценку. Технически, статистически значимое взаимодействие от участка к лечению означает, что эффект от лечения следует анализировать и сообщать отдельно для каждого участка. Однако, особенно в фармацевтических испытаниях, большое внимание уделяется тому, как произвести общую оценку эффекта лечения при наличии значительного взаимодействия между участком лечения (22; 23).
Фиксированные эффекты для взаимодействия участка и участка с обработкой
Модель со всеми участками, включенными в качестве предикторов в дополнение к каждому взаимодействию от участка к лечению, может выглядеть следующим образом:
yij = α + βf2xij + ajdj + bjdjxij + eij, ∑i = 1saj = 0, ∑i = 1sbj = 0, eij ~ N (0, σe2)
(1,7)
где α и β f 2 такие же, как в модели эффекта фиксированного участка (уравнение 1.4). Здесь j — это разница между средним значением контрольной группы из сайта j и общим средним значением контрольной группы ( α ).Взаимодействие от участка к лечению b j представляет собой разницу между средним значением группы обработки для участка j и общим эффектом лечения ( β f 2 ). Таким образом, β f 2 , представляет собой простое среднее значение оценок эффекта лечения для каждого участка (22). Два ограничения необходимы для определения отклонений для всех сайтов и α и β f 2 .
В этом анализе каждый объект подсчитывается одинаково, независимо от количества участников внутри объекта, когда используются стандартные суммы квадратов (тип III SS).Однако некоторые утверждают, что суммы квадратов Типа II, когда размеры выборки на каждом участке различаются, поэтому оценки эффекта лечения будут взвешиваться по размеру выборки в каждом месте (24; 25). Контроль SS типа II для всех переменных в модели, за исключением любых взаимодействий с интересующим эффектом, здесь — лечение.
Примеры испытаний с использованием фиксированных эффектов для локального и локального лечения
В пяти испытаниях CTN использовались фиксированные эффекты для сайта и сайт по лечению взаимодействия.Все три испытания терапии для повышения мотивации (MET) использовали эту стратегию для проверки эффекта MET по сравнению с TAU: исходный MET с пятью площадками в местных наркологических клиниках (CTN-0004; 19), MET с четырьмя центрами. для беременных женщин (CTN-0013; 20) и MET для испаноязычных потребителей психоактивных веществ (CTN-0021; 26). В двух из этих исследований (19, 20) наблюдались незначительно значимые эффекты взаимодействия от участка к лечению, что подчеркивает важность адекватной мощности для этих эффектов взаимодействия.Во всех трех испытаниях MET были полностью изучены эффекты лечения в каждом центре, несмотря на отсутствие статистической значимости взаимодействия между участками лечения. В двух других исследованиях, CTN-0010 с шестью сайтами, сравнивающих 12-недельное лечение с 14-дневным курсом детоксикации бупренорфин-налоксоном для молодых людей, страдающих опиоидной зависимостью (27), и исследование CTN-0015 с семью сайтами в поисках безопасности. для посттравматического стрессового расстройства + TAU по сравнению с санитарным просвещением женщин + TAU (28) взаимодействие между участком лечения оказалось незначительным и впоследствии исключено из окончательной модели.
Преимущества и недостатки фиксированных эффектов для участка и участка за обработкой
Преимущества и недостатки этой модели фиксированного эффекта с взаимодействием участка и участка за обработкой аналогичны тем, которые имеют только фиксированные основные эффекты. К преимуществам можно отнести простоту внедрения и отсутствие необходимости в минимальном количестве сайтов. Основным недостатком снова является то, что анализ зависит от сайтов в модели, что влечет за собой возможность обобщения. Также возникает вопрос о том, следует ли комбинировать эффекты лечения на разных участках для создания общей оценки эффекта лечения, если существует клинически важное взаимодействие между участками лечения.В рамках сети клинических испытаний озабоченность по поводу существования важного взаимодействия между участками лечения привела к тому, что в некоторых исследованиях было набрано достаточное количество образцов на каждом участке, чтобы продемонстрировать значительный эффект лечения внутри участков (29). Когда эффекты лечения объединяются по участкам (например, при наличии статистически незначимого взаимодействия от участка к лечению), дополнительным недостатком является то, что стандартный подход SS типа III одинаково взвешивает эффекты лечения, специфичные для участка. Для исследований с очень разными размерами выборки в разных учреждениях и / или с разными пропорциями назначения лечения внутри центра это может быть нежелательно.Это можно «исправить» с помощью SS типа II, однако это похоже на использование модели основных эффектов при наличии значительных взаимодействий между участками лечения. Кроме того, статистическая мощность как невзвешенного анализа (SS типа III), так и взвешенного подхода (SS типа II) снижается в исследованиях с большой вариабельностью в размерах выборки участков или пропорции назначенного лечения в пределах участков (30; 12).
Случайные эффекты для участка и от участка к лечению
Модель, включающая случайные эффекты как для участка, так и от участка к лечению, может быть представлена как:
yij = α + βr2xij + s1j + xijs2j + eij, s ~ N ((00), [σs002σs012σs012σs112]), eij ~ N (0, σe2)
(1.8)
Здесь s 1j — случайный эффект, связанный с участком, а s 2j — случайный эффект, связанный с взаимодействием от участка к лечению (отзыв x ij — индикатор лечения). Эта модель аналогична модели, использованной Рауденбушем и Лю (31). Как и в простой модели случайного воздействия на участок, оценка эффекта лечения включает информацию как внутри, так и между участками, и представляет собой средневзвешенное значение точности воздействия лечения на конкретном участке.Эти веса включают соответствующие размеры выборки участков, поскольку точность обратно пропорциональна дисперсии. Стандартная ошибка эффекта лечения включает дисперсию, связанную с взаимодействиями от участка к лечению (31). Если вариация от участка к лечению не равна нулю, стандартная ошибка эффекта от лечения больше в этой модели случайного эффекта участка (с взаимодействием), чем в модели фиксированного эффекта (с взаимодействием) или модели случайного эффекта участка (без взаимодействия). взаимодействие). Это означает, что для достижения статистической значимости требуется больший размер выборки (эмпирический пример см. В 32).
Примеры испытаний с использованием случайных эффектов как для участка, так и для каждого участка лечения
В CTN было проведено два испытания, в которые были включены случайные эффекты как для участка, так и для каждого участка лечения. На восьми участках CTN-0014 была проведена сравнительная проверка краткосрочной стратегической семейной терапии подростков, злоупотребляющих наркотиками, и TAU, а также изучены траектории употребления наркотиков в течение 12 месяцев (33, 34). Запланированный анализ включал в себя случайные эффекты для компонентов траектории, участка и участка в зависимости от взаимодействий с лечением. Аналогичным образом, в исследовании CTN-0017 с восемью центрами, в котором проводилось тестирование мероприятий по консультированию и просвещению по вопросам поведения, связанного с риском заражения ВИЧ, по сравнению с вмешательством терапевтического альянса + обычным лечением по сравнению с обычным лечением (35), также изучались траектории (риска заражения ВИЧ), в каком месте и его взаимодействие с другими эффектами, такими как от участка к лечению, моделировались как случайные эффекты.В обоих этих испытаниях дисперсия, связанная с взаимодействием от участка к лечению, оказалась равной нулю, и случайный эффект был исключен из окончательных моделей.
Преимущества и недостатки случайных эффектов для участка и для каждого участка лечения
Основное преимущество этого подхода состоит в том, что есть четкие статистические основания для обобщения результатов на участников, лечившихся на участках, которые не были частью исследования. Еще одно преимущество состоит в том, что нет двусмысленности в том, как рассчитать общий эффект лечения в этой модели, даже если есть различия в эффектах лечения в разных местах.Наконец, этот подход позволяет включить характеристики участка в качестве предикторов воздействия участка и каждого участка лечения. Например, рассмотрим испытание, в котором сайты можно разделить на подтипы (например, стационарные или амбулаторные). В статистической модели со случайными эффектами для взаимодействия как между участком, так и между участком лечения, можно было бы включить подтип участка и взаимодействие подтипа от лечения в качестве ковариант с двумя связанными с участком случайными эффектами, представляющими вариабельность участка, превышающую это объясняется типом сайта.Однако в подходе с фиксированными эффектами фиксированные эффекты взаимодействия участка и участка к лечению оценивают средние различия по участку и, таким образом, контролируют всю изменчивость, связанную с этими факторами (17). Следовательно, для характеристик участка (например, подтипа) не остается вариабельности, позволяющей предсказать, должны ли они быть включены в модель фиксированных эффектов. Модель случайных эффектов обеспечивает естественный способ включения этих предикторов, позволяя исследователю оценить, насколько вариативность сайта объясняется этими факторами (36).
Недостатком подхода со случайными эффектами является то, что требуется больше участков для обеспечения стабильных оценок условий дисперсии. В простой пост-тестовой модели (возможно, с контролем исходных значений переменной результата) это может быть не так проблематично, потому что может быть достаточно всего пяти сайтов (13; но см. Пример в, описанном ниже). В планах с повторными измерениями часто включаются случайные эффекты, чтобы смоделировать независимость повторных измерений внутри субъекта. Включение случайных эффектов как для повторных измерений, так и для взаимодействий между участком и участком обработки обычно требует большего количества участков в этих моделях, хотя в этой области необходимы дополнительные исследования.Можно включить предварительную информацию о вариабельности участков (например, из других испытаний), используя байесовский подход, чтобы уменьшить количество участков, необходимых для стабильных оценок (37; 38; 39).
Таблица 1
Случайный эффект 1 | Фиксированный эффект 2 | ||||||||
---|---|---|---|---|---|---|---|---|---|
80% мощность для Эффект лечения 6 80% для Эффект лечения | 80% мощности для взаимодействия | 80% мощности внутри каждого сайта | |||||||
S | n на | Всего | n на | Всего | |||||
Кол-во площадок | Площадка | N | Площадка | Всего | 38 n на участок | n | | ||
6 | 70 | 420 | — | — | 50 | 300 | 128 | 768 | |
8 | 34 | 272 | — | — | 42 | 336 | 128 | 1024 | |
10 | 22 | 220 | — | — | 38 | 380 | 128 | 1280 | |
12 | 17 | 204 | 265 | 3180 | 34 | 408 | 128 | 1536 | |
14 | 13 | 182 | 127 | 1778 | 30 | 420 | 128 | 1792 | |
16 | 11 | 176 | 84 | 1344 | 28 | 448 | 128 | 2048 |
Оценка статистической мощности
Статистическая мощность для моделей клинических исследований с использованием стандартных мест методы (например,г., 40). Существует меньше инструментов для статистических расчетов мощности для испытаний, использующих модели случайных эффектов сайта. Raudenbush и Liu (31) продемонстрировали, как рассчитать мощность для модели случайных эффектов сайта с помощью простого анализа после тестирования (который может контролировать исходные значения). Фонд W.T. Grant Foundation профинансировал разработку сопутствующей компьютерной программы Optimal Design 2.0 (41). Чтобы проиллюстрировать различия в мощности между подходами случайного и фиксированного воздействия на места, мы провели сравнительный анализ мощности с помощью этой программы.
Наша цель состояла в том, чтобы изучить влияние размера выборки (S = количество сайтов, n = количество людей на сайт, N = общий размер выборки) на статистическую мощность. Для подхода с фиксированным эффектом сайта мы исследовали необходимый размер выборки внутри участков, чтобы иметь 1) адекватную мощность для лечебного эффекта и 2) мощность для взаимодействия от участка к лечению. Для подхода случайного эффекта сайта мы исследовали размер выборки, необходимый в пределах сайтов (n), чтобы иметь 1) адекватную мощность для эффекта лечения и 2) адекватную мощность, чтобы показать, что ковариата на уровне сайта, отличная от условий лечения, значительно влияет на результаты лечения.Во всех случаях предполагается умеренный размер эффекта (d = 0,50) для среднего эффекта лечения и что взаимодействие от участка к лечению объясняет 5,9% вариабельности переменной результата (эквивалент умеренного размера эффекта для взаимодействия, 40). Величина эффекта для ковариаты на уровне сайта также была зафиксирована на уровне d = 0,50. Для исследования одного места при d = 0,5 необходимо 128 участников для достижения 80% мощности. В исследовании с несколькими участками, включая фиксированный эффект для участка, образец, требуемый для мощности 80% для общего лечебного эффекта, будет равен N ’= N + S, т.е.е. 128 плюс количество сайтов (для учета степеней свободы, используемых при оценке средних значений отдельных сайтов).
показывает результирующие требования к размеру выборки. Для наименьшего количества сайтов, шести, модель фиксированного эффекта с взаимодействием имеет наименьший общий размер выборки (N = 300). В подходе со случайным эффектом N быстро падает с увеличением количества сайтов (S). N также быстро уменьшается для модели фиксированного эффекта сайта с взаимодействиями, хотя и не так быстро, как для модели случайного эффекта сайта.Чистый эффект состоит в том, что N является самым низким при S = 8 или более сайтах в модели эффекта случайных сайтов. Для получения адекватной мощности для лечебного эффекта на каждом участке требуется самый большой размер выборки. Напомним, что для получения мощности 80% в одном исследовании на месте требуется 128 участников. Это также размер выборки, необходимый для каждого сайта (n), если цель — получить 80% мощности на каждом сайте. Наконец, столбец ковариат сайта иллюстрирует важность большего количества сайтов, когда цель состоит в том, чтобы объяснить изменчивость на уровне сайта.На меньшем количестве участков невозможно достичь мощности 80% при d = 0,50.
Рекомендации для исследователей
Игнорирование сайта не является жизнеспособным вариантом в многоцентровых клинических испытаниях. Исключение эффектов участков в анализах может смещать эффект лечения и искажать стандартную ошибку, связанную с эффектом лечения, если участники внутри участков более однородны, чем участники между участками (3; 4; 5; 6). Кроме того, рандомизация внутри сайта означает, что рандомизация стратифицируется по сайтам.Большинство статистиков рекомендуют включать эти характеристики в анализ при стратификации рандомизации по набору характеристик (42, 43).
Различие между испытаниями эффективности и испытаниями эффективности редко бывает резким; два типа испытаний — две крайности континуума (44; 3). В большинстве испытаний, кроме первых испытаний нового вмешательства, присутствуют элементы того и другого. В той степени, в которой испытание ближе к стороне спектра эффективности, определение эффектов фиксированного участка для участка является логическим подходом, поскольку основное внимание уделяется установлению того, что лечение может быть эффективным, а не обобщаемости.По мере того, как исследование движется в сторону эффективности континуума, определение случайных локальных эффектов может быть полезным, поскольку цель включает возможность обобщить эффективность лечения для новых групп населения и клиник. Во всех случаях преимущества и ограничения выбранных методов обработки эффектов сайта должны быть явными при представлении результатов.
Принимая во внимание, что подход с фиксированным эффектом сайта не дает статистических оснований для обобщения на сайты, помимо тех, которые включены в испытание, можно использовать другие подходы к обобщению.Даже в одном исследовании участников редко выбирают случайным образом, но результаты часто обобщают, по крайней мере, на типы участников, которые были включены в исследование. Эджингтон (45) называет этот нестатистический вывод, то есть вывод без вероятностной основы, и называет результирующее нестатистическое обобщение стандартной научной процедурой. Например, при оценке результатов одноцентрового исследования поставщики могут посмотреть на качественные характеристики выборки исследования и характеристики условий, в которых проводилось исследование, чтобы оценить, может ли подход вмешательства хорошо работать в их ситуации.Аналогичный подход можно использовать в многосайтовом исследовании. Для этого требуется хорошее, всестороннее описание сайтов, участвовавших в исследовании, чтобы было понятно, какие типы сайтов можно обобщить. Однако в этом процессе не используется никаких статистических выводов.
В рамках подхода с фиксированным эффектом было бы важно либо усилить исследование, чтобы выявить значимое взаимодействие между участком лечения, либо усилить исследование, чтобы продемонстрировать значительные эффекты внутри участков (как это было сделано для нескольких ранних испытаний CTN; 29 ).В то время как последний подход может не показывать значительных различий между сайтами, он должен обладать достаточной мощностью, чтобы показать эффекты лечения на тех участках с большей величиной эффекта. Однако, если исследователь заинтересован в утверждениях о том, какие типы сайтов с наибольшей вероятностью будут успешными при реализации определенного лечения или какие характеристики сайтов связаны с лучшими результатами, тогда необходим подход со случайными эффектами и необходимое количество сайтов. и более крупные размеры выборки на сайтах становятся важными.Количество участков, необходимых для обеспечения достаточной мощности для ковариатного эффекта, значительно больше, чем количество, необходимое для общего лечебного эффекта. Большинство испытаний в CTN не затрагивали такое количество сайтов. Однако, возможно, удастся изучить влияние сайтов на лечение, объединив информацию из исследований. Более стандартизованный подход к сбору информации о сайтах упростил бы как попытки охарактеризовать, как результаты испытаний могут быть обобщены на другие сайты (независимо от статистических методов, используемых в испытании), так и влияние характеристик сайта на испытания.
Выражение признательности
Это исследование было проведено в рамках сети клинических испытаний Национального института по борьбе со злоупотреблением наркотиками при поддержке U10-DA13720.
Сноски
Заявление о заинтересованности: Авторы не заявили о своих интересах, связанных с этой рукописью. Это исследование проводилось в рамках сети клинических испытаний Национального института по борьбе со злоупотреблением наркотиками при поддержке U10-DA13720.
Ссылки
1. Нуньес Е.В., Болл С., Бут Р., Бригам Дж., Калсин Д.А., Кэрролл К., Вуди Г.Многоблочные испытания эффективности лечения злоупотребления психоактивными веществами и сопутствующих проблем: выбрали ли мы лучшие разработки? Журнал лечения злоупотребления психоактивными веществами. 2010; 38 (Приложение 1): S97 – S112. [Бесплатная статья PMC] [PubMed] [Google Scholar] 2. Льюис Дж. Обсуждение статьи Сенна. Журнал Королевского статистического общества, серия D. 2000; 49: 156–157. [Google Scholar] 3. Kraemer HC. Подводные камни многоцентровых рандомизированных клинических испытаний эффективности и действенности. Бюллетень шизофрении. 2000. 26 (3): 533–541.[PubMed] [Google Scholar] 4. Locallo AR, Берлин JA, Have TR Ten, Kimmel SE. Поправки на центр в многоцентровых исследованиях: обзор. Анналы внутренней медицины. 2001; 135: 112–123. [PubMed] [Google Scholar] 5. Вамполд Б. Е., Серлин Р. К.. Последствия игнорирования вложенного фактора при измерении величины эффекта при дисперсионном анализе. Психологические методы. 2000. 5 (4): 425–433. [PubMed] [Google Scholar] 6. Ли К., Томпсон С.Г. Кластеризация медицинским работником в индивидуально рандомизированных исследованиях. Британский медицинский журнал.2005. 330 (7483): 142–144. [Бесплатная статья PMC] [PubMed] [Google Scholar] 7. Хатчисон Д. Эффективное построение выборки: эффекты кластеризации в обследованиях образования. Образовательные исследования. 2009. 51 (1): 109–126. [Google Scholar] 8. McCoach DB, Adelson JL. Работа с зависимостью (часть I): понимание влияния кластеризованных данных. Ежеквартально для одаренных детей. 2010. 54: 152–155. [Google Scholar] 9. Кенни Д.А. Влияние независимости на значимое тестирование в диадических исследованиях. Личные отношения. 1995; 2: 67–75.[Google Scholar] 10. Петри Н. М., Пирс Дж. М., Стицер М. Л., Блейн Дж., Ролл Дж. М., Коэн А., Ли Р. Влияние поощрений на основе призов на результаты у лиц, злоупотребляющих стимуляторами, в программах амбулаторного психосоциального лечения: исследование национальной сети клинических испытаний лечения наркомании. Архив общей психиатрии. 2005; 62: 1148–1156. [PubMed] [Google Scholar] 11. Пирс Дж. М., Петри Н. М., Стицер М. Л., Блейн Дж., Келлог С., Саттерфилд Ф., Ли Р. Влияние более дешевых стимулов на воздержание от стимуляторов при поддерживающем лечении метадоном: исследование Национальной сети клинических испытаний лечения злоупотребления наркотиками.Архив общей психиатрии. 2006. 63 (2): 201–208. [PubMed] [Google Scholar] 12. Рувуна Ф. Неравные размеры центров, размер выборки и возможности в многоцентровых клинических исследованиях. Информационный журнал о наркотиках. 2004. 38 (4): 387–394. [Google Scholar] 13. Браун Х., Прескотт Р. Прикладные смешанные модели в медицине. Wiley; Нью-Йорк, Нью-Йорк: 1999. [Google Scholar] 14. Кэрролл К.М., Болл С.А., Ник К., Мартино С., Франкфортер Т.Л., Фарентинос С., Вуди Г.Э. Мотивационное интервью для улучшения вовлеченности в лечение и улучшения результатов у лиц, обращающихся за лечением от токсикомании: исследование эффективности в нескольких центрах.Наркотическая и алкогольная зависимость. 2006. 81: 301–312. [Бесплатная статья PMC] [PubMed] [Google Scholar] 15. Reid MA, Fallon B, Sonne S, Flammino F, Nunes EV, Jaing H, Rotrosen J. Лечение отказа от курения в программах реабилитации от наркозависимости на уровне общины. Журнал лечения злоупотребления психоактивными веществами. 2008; 35: 68–77. [PubMed] [Google Scholar] 16. Тросс С., Кэмпбелл А. Н., Коэн Л. Р., Калсин Д., Павликова М., Миле Г. М., Ху М., Хейнс Л., Наджент Н., Ган В., Хэтч-Майлетт М., Мандлер Р., Маклафлин П., Эль-Бассель Н., Критс-Кристоф П. .Нунес Э.В. Эффективность групп снижения сексуального риска ВИЧ / ИППП для женщин в программах лечения наркозависимости: результаты сетевого исследования сети клинических испытаний NIDA. Журнал синдрома приобретенного иммунодефицита. 2008. 48 (5): 581–589. [Бесплатная статья PMC] [PubMed] [Google Scholar] 17. Снайдерс Т., Боскер Р. Многоуровневый анализ: введение в базовое и расширенное многоуровневое моделирование. Публикации SAGE; Лондон: 2000. [Google Scholar] 18. Kraemer HC, Робинсон TN. Не вводят ли в заблуждение определенные структуры многоцентровых рандомизированных клинических исследований клинические и политические решения? Современные клинические испытания.2005. 26 (5): 518–529. [PubMed] [Google Scholar] 19. Болл С.А., Мартино С., Ник К., Франкфортер Т.Л., Ван Хорн Д., Критс-Кристоф П., Кэрролл К.М. Важность сайта: рандомизированное испытание терапии для повышения мотивации в местных наркологических клиниках. Журнал консалтинговой и клинической психологии. 2007. 75 (4): 556–567. [Бесплатная статья PMC] [PubMed] [Google Scholar] 20. Винхусен Т., Кропп Ф., Бэбкок Д., Гаага Д., Эриксон С.Дж., Ренц С., Сомоза Э. Терапия для повышения мотивации для улучшения использования лечения и результатов у беременных, употребляющих психоактивные вещества.Журнал лечения злоупотребления психоактивными веществами. 2008. 35 (2): 161–173. [Бесплатная статья PMC] [PubMed] [Google Scholar] 21. Каллен А. Взаимодействие между центрами лечения: в чем проблема? Информационный журнал о наркотиках. 1997; 31: 927–936. [Google Scholar] 22. Fleiss JL. Анализ данных многоклинических исследований. Контролируемые клинические испытания. 1986. 7 (4): 267–275. [PubMed] [Google Scholar] 23. Лин З. Проблема статистического анализа в контролируемых многоцентровых исследованиях: как мы будем взвешивать центры? Статистика в медицине. 1999. 18 (4): 365–373.[PubMed] [Google Scholar] 24. Сенн С. Некоторые противоречия в планировании и анализе многоцентровых исследований Статистика в медицине. 1998. 17 (15-16): 1753–65. [PubMed] [Google Scholar] 25. Сенн С. Консенсус и разногласия в фармацевтической статистике. (Серия D (Статистик)). Журнал Королевского статистического общества. 2000. 49 (2): 135–176. [Google Scholar] 26. Кэрролл К.М., Мартино С., Болл С.А., Ник К., Франкфортер Т., Анез Л.М., Фарентинос С. Многопрофильное рандомизированное исследование эффективности терапии для повышения мотивации для испаноязычных потребителей психоактивных веществ.Журнал консалтинговой и клинической психологии. 2009; 77 (5): 993–999. [Бесплатная статья PMC] [PubMed] [Google Scholar] 27. Woody GE, Poole SA, Subramaniam G, Dugosh K, Bogenschutz M, Abbott P, Patkar A, Publicker M, McCain K, Potter JS, Forman R, Vetter V, McNicholas L, Blaine J, Lynch KG, Fudala P. Extended versus краткосрочное применение бупренорфин-налоксона для лечения молодежи с опиоидной зависимостью: рандомизированное исследование. Журнал Американской медицинской ассоциации. 2008. 300 (17): 2003–2011. [Бесплатная статья PMC] [PubMed] [Google Scholar] 28.Hien DA, Wells EA, Jiang H, Suarez-Morales L, Campbell ANC, Cohen LR, Miele GM, Killeen T, Brigham GS, Zhang Y. Многоцентровое рандомизированное исследование поведенческих вмешательств для женщин с сопутствующим посттравматическим стрессовым расстройством и употреблением психоактивных веществ расстройства. Журнал консалтинговой и клинической психологии. 2009. 77 (4): 607–619. [Бесплатная статья PMC] [PubMed] [Google Scholar] 29. Кэрролл К.М., Фарентинос К., Болл С.А., Критс-Кристоф П., Либби Б., Моргенштерн Дж., Вуди Г.Е. MET встречается с реальным миром: проблемы дизайна и клинические стратегии в сети клинических испытаний.Журнал лечения злоупотребления психоактивными веществами. 2002; 23: 73–80. [Бесплатная статья PMC] [PubMed] [Google Scholar] 30. Лин З. Количество центров в многоцентровом клиническом исследовании: влияние на статистическую мощность. Информационный журнал о наркотиках. 2000. 34 (2): 379–386. [Google Scholar] 31. Рауденбуш С.В., Лю X. Статистическая мощность и оптимальный дизайн для многоцентровых рандомизированных испытаний. Психологические методы. 2000. 5 (2): 199–213. [PubMed] [Google Scholar] 32. Moerbeek M, van Breukelen GJ, Berger MP. Сравнение традиционных методов и многоуровневой регрессии для анализа многоцентровых интервенционных исследований.Журнал клинической эпидемиологии. 2003. 56 (4): 341–350. [PubMed] [Google Scholar] 33. Feaster DJ, Роббинс MS, Horigian V, Szapocznik J. Статистические проблемы в многоцентровых испытаниях эффективности: случай краткой стратегической семейной терапии для лечения подростковой наркозависимости. Клинические испытания. 2004; 1: 428–439. [Бесплатная статья PMC] [PubMed] [Google Scholar] 34. Роббин М.С., Сапочник Дж. С., Хориджан В. Е., Фистер Д. Д., Пуччинелли М., Джейкобс П., Берлев К., Верстляйн Р., Бахрах К., Бригам Г. Краткая стратегическая семейная терапия ™ для подростков, злоупотребляющих наркотиками: исследование эффективности в нескольких местах.Современные клинические испытания. 2009. 30 (3): 269–278. [Бесплатная статья PMC] [PubMed] [Google Scholar] 35. Бут Р.Е., Кэмпбелл Б.К., Микулич-Гилбертсон С.К., Тиллотсон С.Дж., Чой Д., Робинсон Дж., Маккарти Д. Снижение рискованного поведения, связанного с ВИЧ, среди потребителей инъекционных наркотиков в условиях детоксикации по месту жительства. СПИД и поведение. 2010; 15: 30–44. [Бесплатная статья PMC] [PubMed] [Google Scholar] 36. Певец JD. Использование SAS PROC MIXED для соответствия многоуровневым моделям, иерархическим моделям и индивидуальным моделям роста. Журнал образовательной и поведенческой статистики.1998. 23 (4): 323–355. [Google Scholar] 37. Гельман А. Априорные распределения параметров дисперсии в иерархических моделях. Байесовский анализ. 2006; 1 (3): 515–533. [Google Scholar] 38. Гулд А.Л. Повторный анализ многоцентровых исследований. Статистика в медицине. 1998; 17 (15-16): 1779–1797. [PubMed] [Google Scholar] 39. Суббиа М, Кумар Б.К., Шринивасан МР. Байесовский подход к многоцентровым разреженным данным. Коммуникации в статистике — моделирование и вычисления. 2008. 37 (4): 687–696. [Google Scholar] 40. Коэн Дж. Статистический анализ мощности для наук о поведении.Лоуренс Эрлбаум Ассошиэйтс; Хиллсдейл, Нью-Джерси: 1988. [Google Scholar] 42. Фридман Л.М., Фурберг С.Д., Демец Д.Л. Основы клинических исследований. Springer; Нью-Йорк, Нью-Йорк: 1998. [Google Scholar] 43. Розенбергер WF, Lachin JM. Рандомизация в клинических испытаниях: теория и практика. Wiley; Нью-Йорк: 2002. [Google Scholar] 44. Кэрролл К.М., Рунсавиль Б.Дж. Преодоление разрыва: гибридная модель, связывающая исследования эффективности и действенности в лечении наркозависимости. Психиатрические службы. 2003. 54 (3): 333–339. [Бесплатная статья PMC] [PubMed] [Google Scholar] 45.Эджингтон Э.С. Рандомизационный тест. М. Деккер; Нью-Йорк: 1995. [Google Scholar]Оценка эффектов мест с использованием данных о сильном движении массива BYTNet в Турции
Akinci A, Taktak AG, Ergintav S (1994) Затухание кодовых волн в Западной Анатолии. Phys Earth Planet Inter 87: 155–165
Статья Google ученый
Акинджи А., Эйдоган Х. (1996) Частотно-зависимое затухание S- и кодовых волн в регионе Эрзинджан (Турция).Phys Earth Planet Inter 97: 109–119
Статья Google ученый
Акьол Н., Акинджи А., Эйдоган Х. (2002) Разделение источников, распространения и эффектов места от S-волн местных землетрясений в регионе Бурса на северо-западе Турции. Pure Appl Geophys 159: 1253–1269
Статья Google ученый
Anderson JG, Hough SE (1984) Модель формы амплитудного спектра Фурье ускорения на высоких частотах.Bull Seism Soc Am 74: 1969–1993
Google ученый
Эндрюс Д.Дж. (1982) Разделение спектра источника и распространения афтершоков семи Маммот-Лейкс, Труды семинара 16, Динамические характеристики разломов. Отчет открытого файла Геологической службы США 82–591: 437
Google ученый
Барка А., Кадинский-Кейд К. (1988) Геометрия сдвигового разлома в Турции и ее влияние на сейсмическую активность.Тектоника 7: DOI: 10.1029 / 88TC01978. issn: 0278–7407.
Барка А (1992) Северо-Анатолийский разлом. Annales Tectonicae 6: 164–195
Google ученый
Boore DM, Joyner WB (1997) Расширения участков для типовых участков горных пород. Bull Seism Soc Am 87 (2): 327–341
Google ученый
Датта У., Бисвас Н., Мартиросян А., Папагеоргиу А., Киношита С. (2003) Оценка параметров очага землетрясения и реакции участка в Анкоридже, Аляска, по сетевым данным о сильных движениях с использованием метода обобщенной инверсии.Phys Earth Planet Inter 137 (1–4): 13–29
Статья Google ученый
Эйдоган Х., Акинчи А. (1997) Исследование характеристик затухания в регионе и на местах в регионе Бурса с использованием записи ускорения микроземлетрясений. 4-я Национальная конференция по инженерии землетрясений 63–71 (на турецком языке).
Francisco JCG, Rodriguez M, Field EH, Hatzfeld D (1997) Эффекты топографической площадки. Сравнение двух методов без ссылки.Bull Seism Soc Am 87 (6): 1667–1673
Google ученый
Гок Э., Полат О. (2012a) Оценка сейсмичности региона Бурса по временной сейсмической сети. Pure App Geophys 169 (4): 659–675
Статья Google ученый
Гок Э., Полат О. (2012b) В: Себастьяно д’Амико (редактор) Microtremor HVSR, исследование воздействия площадки в городе Бурса (Северный регион Мраморного моря, Турция) в книге «Исследование и анализ землетрясений — Новые рубежи в Сейсмология ».Публикации INTECH, Университетский городок, Риека, Хорватия, стр. 380. ISBN 978-953-307-840-3, 225–236
Hartzell SH (1992) Оценка реакции площадки по данным землетрясений. Bull Seism Soc Am 82: 2308–2327
Google ученый
Haskell NA (1960) Отражения плоских SH волн в земной коре. J Geophys Res 65: 4147–4150
Статья Google ученый
Хассани Х.З., Фарджуди Дж., Ансари А. (2011) Оценка усиления, затухания и спектров источников S-волн в центрально-восточном Иране.Soil Dyn Earthq Eng 31 (10): 1397–1413
Статья Google ученый
Hasemi A, Matsuzawa T, Hasegawa A, Umino N, Kono T, Hori S, Ito A, Suzuki S, Ishikawa H (1997) Q и коэффициенты усиления участка хард-рока в массиве Китаками, Северо-Восточная Япония . J Physics Earth 45 (6): 417–431
Статья Google ученый
Ивата Т., Ирикура К. (1986) Разделение эффектов источника, распространения и участка от наблюдаемых S-волн.Зисин II (J Seismol Soc Jpn) 39: 579–593 (на японском языке с аннотацией на английском языке)
Google ученый
Ивата Т., Ирикура К. (1988) Параметры источника последовательности землетрясений в Японском море 1983 года. J Phys Earth 36: 155–184
Статья Google ученый
Joyner WB, Boore DM (1988) Измерение, характеристика и прогнозирование сильных колебаний грунта, в Earthquake Engineering and Soil Dynamics II, Proc.Являюсь. Soc. Civil Eng. Геотех. Англ. Div. Специальная конференция, 27–30 июня 1988 г., Парк-Сити, Юта, 43–102
Канамори Х. (1972) Механизм цунами-землетрясений. Phys Earth Planet Inter 6: 346–359
Статья Google ученый
Като К., Такемура М., Икеура Т., Урао К., Уэтаке Т. (1992) Предварительный анализ для оценки локального эффекта участка по спектрам сильного движения методом инверсии. J Physics Earth 40 (1): 175–191
Статья Google ученый
Маккензи Д.П. (1972) Активная тектоника Средиземноморского региона.Geophys J R Astron Soc 30: 109–185
Статья Google ученый
Мойя А., Агирре Дж., Ирикура К. (2000) Инверсия параметров источника и эффектов площадки из записей о сильном движении грунта с использованием генетических алгоритмов. Bull Seism Soc Am 90 (4): 977–992
Статья Google ученый
Рекомендуемые положения NEHRP (2001); Национальная программа снижения опасности землетрясений.Часть 1. Положение (FEMA 368), подготовленное для Федерального агентства по чрезвычайным ситуациям. Совет по сейсмической безопасности зданий, Вашингтон, округ Колумбия,
Google ученый
Паролаи С., Бинди Д., Баумбах М., Гроссер Х., Майкрейт С., Каракиса С., Зунбул С. (2004) Сравнение различных методов оценки реакции на местности с использованием афтершоков землетрясения в Измите 1999 года. Bull Seism Soc Am 94 (3): 1096–1108
Статья Google ученый
Сато Х., Яманака Х. (2010) Исследование по моделированию глубинной подповерхностной структуры с учетом случайных колебаний скорости для оценки коэффициента усиления широкополосного участка — фундаментальное исследование на равнине Ниигата.Япония. J Structural Construct Eng (Сделки AIJ) 648: 289–298 (на японском языке)
Статья Google ученый
Сингх С.К., Лермо Дж., Домингес Т., Ордас М., Эспиноза Дж. М., Мена Е., Кваас Р. (1988) Землетрясение в Мексике 19 сентября 1985 г. — исследование усиления сейсмических волн в долине Мексики с уважением. до участка горной зоны. Спектры землетрясений 4: 653–673
Статья Google ученый
Shoji Y, Kamiyama M (2002) Оценка локальных эффектов участка с помощью обобщенной схемы инверсии с использованием данных наблюдений «Малого Титана».Soil Dyn Earthq Eng 22 (9–12): 855–864
Статья Google ученый
Steidl JH, Tumarkin AG, Archuleta RJ (1996) Что такое справочный сайт? Bull Seism Soc Am 86 (6): 1733–1748
Google ученый
Такекоши М., Яманака Х. (2009) Инверсия формы волны данных неглубокой сейсмической рефракции с использованием метода гибридного эвристического поиска. Explor Geophys 40 (1): 99–104. DOI: 10.1071 / EG08113
Артикул Google ученый
Takemura M, Hiehata S, Ikeura T, Uetake T (1989) Региональные вариации свойств очагов средних землетрясений в регионе субдукции. Зисин II (J Seismol Soc Jpn) 42: 349–359
Google ученый
Такемура М., Икеура Т., Сато Р. (1990) Масштабные соотношения для параметров источника и магнитуды землетрясения в районе полуострова Идзу.Tohoku Geophys J (Sci Rep Tohoku Univ Ser 5) 32: 77–89
Takemura M, Kato K, Ikeura T., Shima E (1991) Усиление S-волн на участках из записей сильных движений в особом отношении к геологии поверхности . J Physics Earth 39 (3): 537–552
Статья Google ученый
Тезел Т., Шибутани Т., Кайпак Б. (2013) Толщина земной коры Турции определяется функцией приемника. J Asian Earth Sci 75: 36–45
Яманака Х. (2007) Инверсия фазовой скорости поверхностных волн с использованием метода гибридного эвристического поиска.Буцури Танса 60: 265–275. DOI: 10.3124 / segj.60.265 (на японском языке)
Google ученый
Yamanaka H, Ohtawara K, Grutas R, Tiglao RB, Lasala M, Narag IC, Bautista BC (2011) Оценка усиления на месте и профилей скорости S-волн в столичном городе Манила, Филиппины, по записям движения грунта при землетрясениях. Explor Geophys 42 (1): 69–79
Статья Google ученый
Йылмаз О., Саваскан Е., Бакир С., Йилмаз Т., Эсер М., Аккар С., Тузель Б., Иравул Ю., Озмен Т.О., Денизлиоглу З.А., Алкан А.М., Гурбуз М. (2008 г.) Национальная сеть Турции для сейсмографических станций сильных движений.Материалы 14-й Всемирной конференции по сейсмологической инженерии, Пекин, Китай, Paper I.D. 03-03-0013
Google ученый
Йошимото К., Сато Х., Киношита С., Отаке М. (1993) Высокочастотное влияние твердой породы на площадку в Ашио, Центральная Япония. J Physics Earth 41 (5): 327–335
Статья Google ученый
Zaineh HE, Yamanaka H, Dakkak R, Khalil A, Daoud M (2012) Оценка скоростной структуры мелкой поперечной волны в городе Дамаск, Сирия, с использованием исследования микротремора.J of Soil Dyn and Earthq Eng 39: 88–99
Статья Google ученый
Влияние типа почвы на ущерб от землетрясения
Когда вы думаете о последствиях землетрясения, вы можете представить себе камешек, упавший в пруд, и концентрические круги ряби. Вы можете подумать, что сила землетрясения ослабевает по существу равномерно по мере удаления от центра.
Однако землетрясения ведут себя иначе.
Важность типа почвы
Поверхность суши неоднородна, как вода в пруду, как и эффект ряби после землетрясения.Часть земли покрыта твердыми породами, часть — плотной почвой, а часть — грязью или искусственным заполнителем. Распределение этих типов почв может сильно различаться на небольших территориях.
В результате две точки на одинаковом расстоянии от эпицентра землетрясения могут испытывать существенно разные эффекты. Один может пострадать более чем в десять раз от воздействия другого из-за геологических изменений, известных как эффекты площадки, которые основаны на двух общих характеристиках:
- Мягкость почвы или камня.
- Общая мощность отложений над коренной породой.
Связано:
Модифицированная шкала интенсивности Меркалли для страхового андеррайтинга
Как тип почвы влияет на ущерб от землетрясения
Последствия землетрясения зависят от мягкости наносов. Когда сейсмические волны проходят через землю, они проходят через твердые породы быстрее, чем через мягкую почву. Когда волны переходят от твердой земли к мягкой, их амплитуда (или размер) увеличивается. Чем больше волна, тем сильнее тряска.
Тот же принцип применим и к толщине осадка. Чем глубже слой наносов над коренной породой, тем более мягкая почва для прохождения сейсмических волн. Мягкая почва означает большие волны и более сильное усиление.
На повреждение этого здания землетрясением мог повлиять тип почвы, на которой оно находится.
Тип почвы и классификация участков
Национальная программа уменьшения опасности землетрясений (NEHRP) определила шесть различных классификаций участков в зависимости от типа почвы и горных пород в районе и скорости распространения поперечных волн: 1
A: твердые породы (магматические породы).
B: скала (вулканическая порода).
C: очень плотный грунт и мягкая порода (песчаник).
D: жесткая почва (грязь).
E: мягкий грунт (искусственная насыпь).
F: почвы, требующие оценки для конкретных участков.
Чем раньше в алфавите, тем тверже почва. Грунт класса А является самым твердым и дает наименьшее усиление волн. Земля класса Е противоположна — самая мягкая почва с наибольшим усилением. Площадка класса F может содержать несколько типов грунта, например, уязвимые для возможного разрушения во время землетрясения, торф или некоторые глины.
Хотя тип почвы является важным предиктором последствий землетрясения, это не единственный фактор. Другие характеристики, такие как ориентация разлома, неровности поверхности разрыва и дисперсия волн, когда они ударяются о подземные структуры, могут создавать пятна значительного разрушения, и эти горячие точки являются уникальными для каждого землетрясения.
Узнайте больше о различных факторах риска материального ущерба в результате землетрясения в нашей записи блога .
[1] Положения, рекомендованные NEHRP для сейсмических норм для новых зданий и других сооружений, Федеральное агентство по чрезвычайным ситуациям, https: // www.fema.gov/media-library-data/20130726-1532-20490-4965/fema_450_1_provisions.pdf
Случайные эффекты, фиксированные эффекты и промежуточные спецификации для кластеризованных данных в обсервационных исследованиях здоровья: исследование с помощью моделирования
Образец цитирования: Dieleman JL, Templin T (2014) Random-Effects, Fixed-Effects and the inside-between Specification for Clustered Data in Observational Health Studies: A Simulation Study. PLoS ONE 9 (10): e110257. https: // doi.org / 10.1371 / journal.pone.0110257
Редактор: Эндрю Р. Далби, Вестминстерский университет, Великобритания
Поступила: 12 апреля 2014 г .; Принята к печати: 16 сентября 2014 г .; Опубликовано: 24 октября 2014 г.
Авторские права: © 2014 Dieleman, Templin. Это статья в открытом доступе, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника.
Доступность данных: Авторы подтверждают, что все данные, лежащие в основе выводов, полностью доступны без ограничений. Все соответствующие данные находятся в документе и его файлах с вспомогательной информацией.
Финансирование: Это исследование финансировалось Фондом Билла и Мелинды Гейтс (http://www.gatesfoundation.org/). Финансирующие организации не играли никакой роли в дизайне исследования, сборе и анализе данных, интерпретации данных, решении опубликовать или подготовке рукописи.
Конкурирующие интересы: Авторы заявили, что никаких конкурирующих интересов не существует.
Введение
Наблюдательные исследования здоровья часто имеют дело с сгруппированными или сгруппированными данными. Когда наблюдения сгруппированы в группы, общие характеристики на уровне группы могут повлиять на результаты. Если все из этих уникальных характеристик наблюдаются и измеряются, их можно будет включить в модель, хотя в большинстве случаев это нереально. Медицинские учреждения в одном географическом регионе могут иметь общие бюджеты, определяющие политику, отношение к лечению, группам населения, схемам заболеваний и ограничениям в поставках.Если в одном анализе рассматриваются несколько объектов из нескольких регионов, объекты будут неявно сгруппированы по регионам. Хотя эти общие черты на уровне группы влияют на способность учреждений предоставлять услуги, было бы нереалистично измерить и включить их все в модель. Однако игнорирование объединяющих характеристик на уровне группы нарушает допущения, необходимые для предотвращения систематической ошибки во многих регрессиях. К счастью, есть два относительно общих метода улучшения оценки кластеризованных данных: оценка случайных и фиксированных эффектов (RE и FE, соответственно) [1].Применение этих методов может устранить предвзятость и повысить эффективность.
Универсальность RE и FE вдохновила на множество исследований и комментариев, касающихся как теории, так и практики. Эти работы охватывают науки о здоровье [2] — [6], социальные науки [7] — [10] и эконометрическую теорию [11] — [12]. Во многих предыдущих эмпирических исследованиях были рассмотрены различные спецификации RE и FE для анализа кластерных данных [13] — [17]. В других исследованиях FE и RE сравнивались с обобщенными оценочными уравнениями (GEE) [18] — [19].Хотя теория, поддерживающая оценки RE и FE, хорошо известна, в разных дисциплинах по-прежнему мало единого мнения о том, когда каждая из них является наиболее подходящей. Споры о том, какую оценку использовать, продолжаются в науках о здоровье, даже несмотря на то, что RE, FE и WB были исследованы теоретически и с использованием моделирования [20] — [25].
Рисунок 1 показывает, что исследователи в области здравоохранения непропорционально предпочитают оценку RE по сравнению с исследователями в некоторых социальных науках [26] — [28]. У этой разницы может быть веская причина.Исследователи в области здравоохранения часто работают в рамках рандомизированного контрольного исследования (РКИ), в котором ненаблюдаемые эффекты действительно не коррелируют с переменной, указывающей на лечение. Оценка RE может быть подходящим выбором. Более того, экономисты, которые чаще работают с данными наблюдений, часто больше заинтересованы в причинно-следственных выводах, в то время как практикующие врачи больше заинтересованы в прогнозировании. Хотя возможно, что несопоставимые варианты, показанные на рисунке 1, основаны на принципиально разных данных, требующих разных оценок, последующее исследование показывает, что на практике бывает трудно уверенно выбрать между оценками, особенно в небольших выборках.Наивное следование норме для конкретной дисциплины может привести к необъективным или неэффективным оценкам.
Рисунок 1. Распространенность случайных и фиксированных эффектов в литературе по здравоохранению, экономике и политологии.
В каждом архиве был произведен поиск терминов «случайные эффекты» или «случайный эффект» и «фиксированные эффекты» или «фиксированный эффект», присутствующие в рефератах. Статьи, в которых также использовался термин «мета» в аннотации, не были включены, чтобы избежать метаанализа, который является очень специфическим использованием оценки RE и FE.PubMed — это база данных, в которой хранятся выдержки и ссылки по биомедицине и биологии, в основном взятые из базы данных MEDLINE. EconLit — это также база данных для архивирования, опубликованная Американской экономической ассоциацией, в которой основное внимание уделяется экономической литературе. PAIS — это международная база данных Информационной службы по связям с общественностью, в которой хранятся ссылки, посвященные связям с общественностью.
https://doi.org/10.1371/journal.pone.0110257.g001
Помимо выбора оценщика для использования, важно правильно указать переменные, используемые для каждого оценщика.Традиционные спецификации RE и FE требуют регрессии одной конечной переменной ( y ) по наблюдаемым независимым переменным ( x ). Во многих случаях каждый метод оценки преобразует данные (обсуждается ниже), и для оценки модели применяется обычный метод наименьших квадратов (OLS). Тем не менее, несколько вариантов этой традиционной спецификации оказались полезными. В 1978 году Мундлак убедительно доказывал, что при правильном указании оценки RE и FE фактически являются одной и той же оценкой [29].Таким образом, правильное определение модели оказывается таким же важным, как и выбор используемого оценщика.
С учетом различных взглядов на выбор оценок и важности спецификации, цель данной статьи — обсудить теорию, лежащую в основе традиционных оценок RE и FE, и подробно проиллюстрировать, когда каждая из этих оценок является наиболее подходящей, с помощью моделирования различные ситуации. Кроме того, мы рассматриваем альтернативную спецификацию, в которой используется оценка RE для получения оценок, асимптотически эквивалентных оценкам FE.Этот гибрид, называемый подходом внутри между (WB), представляет собой расширенную версию спецификации, предложенной Мундлаком, и сохраняет лучшие характеристики традиционных оценок RE и FE [7], [30].
Мы следуем за Кларком и Линцером и используем моделирование, чтобы объяснить и проиллюстрировать различия между этими оценками [31]. Кларк и Линцер используют моделирование для оценки теста Хаусмана и сравнения оценок RE и FE, показывая, что тест Хаусмана не является «необходимой или достаточной статистикой» при выборе между двумя традиционными оценками.Мы основываемся на этой работе, включая ряд дополнительных измерений моделирования, оценивая способность каждого оценщика прогнозировать результаты (в дополнение к оценке способности каждого оценщика оценивать предельные эффекты) и оценивая третий оценщик — оценщик Всемирного банка. Из-за его нечастого использования свойства оценки WB ранее не исследовались с помощью моделирования. В частности, мы пролили свет на малоизвестные свойства этой оценки для малых выборок. Включение этих дополнительных функций и другая интерпретация перекрывающихся результатов приводит к уникальному набору рекомендаций.Кроме того, мы рассматриваем обсуждение в контексте здоровья населения, поскольку исследователи в области здравоохранения, изучающие данные наблюдений, кажутся предрасположенными к использованию метода, который может вызвать систематическую ошибку.
При моделировании мы создаем 16 200 уникальных сценариев, каждый из которых представляет собой комбинацию важных параметров: количество групп, размер групп, внутригрупповые вариации, межгрупповые вариации, величина ошибки измерения, величина автокорреляции и количество вариации, объясняемой ковариатами.К каждому набору смоделированных данных мы применяем три оценщика и оцениваем, какой оценщик имеет наименее смещенные оценки предельного эффекта (оценки коэффициентов) и прогнозы (подогнанные результаты). Мы также применяем тест Хаусмана к каждому набору данных. Тест Хаусмана — это традиционный инструмент, который помогает исследователям выбирать между традиционными оценками RE и FE.
Эта статья начинается с объяснения лежащей в основе модели кластеризованных данных и традиционно определенных оценок RE и FE.Мы также обрисовываем и объясняем подход Всемирного банка. Моделирование, описанное ниже, показывает, что для каждого из трех оценщиков есть свое время и место. К сожалению, моделирование также показывает, что ни одно правило не может предложить безошибочного руководства при выборе оценщика, хотя во многих случаях подход Всемирного банка сохраняет лучшие характеристики двух традиционных оценщиков. Хотя тест Хаусмана может быть малоинформативным, он надежен только для больших выборок. Наконец, этот документ завершается предложениями о том, когда следует использовать каждый оценщик.
Кластерная модель данных
Эмпирический анализ здоровья обычно рассматривает группы сгруппированных лиц, такие как домохозяйства, лечебные учреждения и группы состояния здоровья. Эти сгруппированные данные можно дополнительно кластеризовать на более высоких уровнях, таких как платформы услуг, штаты и страны, или даже в эндемичные по болезням регионы или группы доходов. В продольных данных моменты времени могут быть сгруппированы вместе, так что в определенное время толчок влияет на все наблюдения.Это будет второе измерение кластеризации. Без потери общности все, что обсуждается в этой статье, можно обобщить на несколько измерений кластеризации, хотя изучение этого в моделировании выходит за рамки данной статьи.
Хотя членство в группе наблюдается, фактические детерминанты переменной результата считаются ненаблюдаемыми и в большинстве случаев не могут быть включены в модель. Кластерные данные становятся проблематичными, когда ненаблюдаемые характеристики на уровне группы влияют на результат.В этих случаях условные средние значения результата на уровне группы варьируются в зависимости от группы. Эта характеристика, известная как ненаблюдаемая неоднородность, нарушает допущение, необходимое для того, чтобы МНК была наилучшей линейной несмещенной оценкой, что приводит к неэффективной оценке и смещенному выводу (гетероскедастические остатки) и потенциально смещенным оценкам [1], [32].
Уравнение (1) представляет собой наблюдение из такой модели. Здесь y — представляющая интерес конечная переменная, x — объясняющая переменная, β — предельный эффект, ε — остаток и μ — единичный агрегированный ненаблюдаемый эффект на уровне группы.В действительности вполне вероятно, что существует множество ненаблюдаемых эффектов на уровне группы, но в нашем случае μ можно рассматривать как совокупность этих многих эффектов. (Без потери общности следует включать константу, и, если необходимо, модель может быть расширена для включения многих объясняющих переменных. Здесь мы абстрагируемся до простейшего случая.) Предполагается, что ε независимо и одинаково распределены по выборке . Индексы j и n , где и, указывают идентификацию группы и наблюдения в каждой группе, соответственно.Если данные являются продольными, то n указывает время, в которое производится выборка каждого наблюдения, а j указывает наблюдаемую единицу. (1)
Для оценки можно игнорировать ненаблюдаемый эффект на уровне группы и рассматривать ненаблюдаемую неоднородность просто как часть остатка. Это представлено в уравнении (2). Применение МНК к уравнению (2) часто называется объединенной оценкой или оценкой среднего населения [11]. Есть две основные проблемы, связанные с объединенной оценкой.Первая проблема связана с предвзятостью. Поскольку это часть процесса генерации истинных данных, но игнорируется при оценке, объединенная оценка может страдать от смещения пропущенной переменной (OVB). Если мы перепишем так, что z представляет собой набор из J-1 двоичных переменных, указывающих членство в группе, и является вектором эффектов, измеряющим, как влияет членство в группе, тогда можно показать, что [11]. Таким образом, объединенная оценка будет смещена, если только включенные объясняющие переменные и (исключенные) эффекты на уровне группы не являются независимыми ().Вторая общая проблема, связанная с объединенной оценкой, — это гетероскедастичность. Гетероскедастические остатки — это остатки, которые не распределяются с одинаковой дисперсией по выборке. Как следствие, оценщик страдает от смещенного вывода (оцененные стандартные ошибки слишком малы) и неэффективности (он менее точен, чем другие линейные оценщики) [1], [11]. Эти проблемы возникают, если эффекты на уровне группы различаются по выборке (по крайней мере, для некоторых j ). В кластеризованных данных маловероятно, что эффект на уровне группы не различается по группам.В частности, объединенная оценка OLS будет генерировать стандартные ошибки, которые слишком малы для независимых переменных между кластерами, и будут генерировать стандартные ошибки, которые слишком велики для независимых переменных внутри кластера [10]. (2)
Оценка случайных эффектов
Если тогда объединенная оценка не является смещенной (так как OVB = 0), и единственная проблема, связанная с объединенной оценкой, — это гетероскедастические остатки. Альтернативой объединенной оценке, которая контролирует гетероскедастичность, является оценка RE.Как и объединенная оценка, оценка RE не моделирует явным образом ненаблюдаемые эффекты на уровне группы, и, таким образом, она является несмещенной только в том случае, если эффекты на уровне группы не зависят от включенных объясняющих переменных [11]. Оценка RE предполагает нормальное распределение со средним нулевым значением и использует возможные обобщенные методы наименьших квадратов (FGLS). FGLS применяет OLS к уравнению (3) и является эффективным методом решения проблемы гетероскедастичности [12]. На практике оценка максимального правдоподобия часто заменяет FGLS. Это асимптотически эквивалентно.(3)
Оценка фиксированных эффектов
В некоторых дисциплинах термин «фиксированные эффекты» используется для обозначения предельного эффекта, который является постоянным для всей выборки. Используя эту терминологию, все правые переменные из уравнений (1) — (6) будут считаться фиксированными, потому что β предполагается однородным. Используя эту альтернативную терминологию, фиксированные эффекты противопоставляются случайным параметрам (или эффектам), которые учитывают маргинальные эффекты, специфичные для группы. В этой статье оценка FE относится исключительно к ненаблюдаемым групповым эффектам, которые устанавливают специфичный для группы перехват (константу).Здесь оценка RE относится к оценке с перехватом, зависящим от группы.
В отличие от объединенной оценки и оценки RE, оценка FE явно моделирует эффекты на уровне группы. Для этого оценщик FE включает в себя набор двоичных переменных J-1 , указывающих членство в группе. У каждой группы, кроме одной, есть свой индикатор. Когда OLS применяется к уравнению (4), где z — это матрица из J-1 индикаторных переменных, а δ — вектор предельных эффектов, это называется версией FE с фиктивной переменной методом наименьших квадратов (LSDV). оценка [11].(4)
На практике LSDV-версия FE часто заменяется числовым эквивалентом оценщика, который требует меньше вычислительных затрат. Эта оценка регрессирует y , за вычетом группового среднего y , на x , за вычетом группового среднего x . То есть к уравнению (5) применяется OLS. Уравнение (5) показывает, почему при использовании этого преобразования учитываются ненаблюдаемые эффекты на уровне группы, даже если ненаблюдаемые эффекты явно не включены.При оценке FE различия не учитываются все различия между группами и полностью основываются на вариациях внутри групп. Вот почему оценщик FE иногда называют внутренним оценщиком. Оценщик FE в основном оценивает, как изменения в y , в пределах каждой группы связаны с изменениями в x , в пределах каждой группы. (5)
Сравнение оценок случайных и фиксированных эффектов
Оценка RE и FE основывается на предположениях OLS.Предполагаемые модели (уравнения (3) и (5) соответственно) должны быть правильно указаны, каждая переменная x должна быть строго экзогенной и линейно независимой, а остаток должен быть независимо и одинаково распределен. Когда эти условия выполняются, теория утверждает, что оценка FE беспристрастна и непротиворечива. Оценка RE требует дополнительного допущения — эффект на уровне группы и включенные объясняющие переменные должны быть независимыми, чтобы избежать OVB. Когда это предположение выполняется, оценка RE является беспристрастной, непротиворечивой и эффективной, поскольку в ней используются как внутригрупповые, так и межгрупповые вариации.Согласно этому предположению, оценка FE неэффективна, поскольку она использует только внутригрупповые вариации [12]. Таким образом, корреляция между объясняющей переменной (ами) и эффектами на уровне группы позволяет определить, какую из этих двух оценок использовать.
Однако по этому поводу возникла большая путаница [12], [32]. Определение того, являются ли эффекты на уровне группы случайными, что означает, что они являются репрезентативными для случайных выборок из более широкой популяции, имеет маргинальное значение, поскольку (большое) количество результатов из любого поперечного сечения, скорее всего, будет казаться случайным [12], [29].Что еще более важно, если тогда оценка RE превосходит оценку FE, независимо от того, определены ли эффекты на уровне группы как случайные. В этих случаях обе оценки беспристрастны и непротиворечивы, но эффективен только RE.
Во многих обсервационных исследованиях здоровья, даже если интересующая выборка выбирается случайным образом из более крупной выборки, ненаблюдаемый эффект и включенные объясняющие переменные не являются независимыми,. В этих случаях OVB оценки RE увеличивается с ρ .Существует множество причин, по которым ненаблюдаемые эффекты на уровне группы и включенные объясняющие переменные могут быть коррелированы. Когда медицинские учреждения сгруппированы по регионам, ненаблюдаемый эффект на уровне группы контролирует политику, поставку лекарств, характер заболеваний и бюджеты, общие для каждого региона. Весьма вероятно, что эти характеристики, составляющие ненаблюдаемый эффект, коррелируют с переменными, включенными в оценку, такими как плотность населения или количество врачей. Аналогичным образом, при межстрановом анализе здоровья населения исследователи обычно группируют страны по географическим регионам, чтобы контролировать ненаблюдаемые закономерности болезней и демографические характеристики.Весьма вероятно, что эти ненаблюдаемые характеристики на уровне группы коррелируют даже с простейшими ковариатами, включенными в модель, такими как валовой внутренний продукт, исходное состояние здоровья населения или уровень образования. Во всех этих случаях оценка RE является необъективной.
К сожалению, знание о предвзятости оценки RE не может однозначно привести исследователя к оценке FE. Даже когда оценка RE остается более точной оценкой, чем оценка FE. В большинстве случаев, когда ρ уходит от нуля, оценка RE точно оценивает предельный эффект смещения.Как показывают Рабе-Хескет и Скрондал, в некоторых ситуациях модель RE может дать несмещенную оценку FE внутри кластера. Обычно это происходит, когда стандартная ошибка внутри кластера значительно меньше, чем стандартная ошибка между кластерами, что означает, что оценка RE взвешивается по отношению к оценке внутри кластера. Это происходит при очень большом количестве наблюдений на кластер, высоком уровне ρ или низкой межкластерной дисперсии экспозиции [10]. В этих ситуациях RE не обязательно является более точным или более предвзятым.По этой причине выбор между двумя оценщиками, даже если известно ρ , не всегда прост и вращается вокруг компромисса с точностью до смещения. Кларк и Линцер заявляют: «Уместно задать вопрос , насколько велико смещение — и может ли полученное смещение быть оправдано повышением эффективности» [31].
Рисунок 2 показывает, почему оценка компромисса смещения и точности может быть непростой задачей. На каждой из трех панелей показано по два распределения.Для каждого смоделированного набора данных оценщик RE (красный) и оценщик FE (синий) несовершенно оценивают предельный эффект, что приводит к одной ошибке на каждый оценщик на смоделированный набор данных. Это повторяется 1000 раз для смоделированных данных, чтобы создать распределение 1000 ошибок для каждого оценщика. Сопровождающие пунктирные вертикальные линии показывают среднее значение каждого распределения ошибок. Таким образом, смещение иллюстрируется, когда средняя ошибка (пунктирная вертикальная линия) не равна нулю. Точность иллюстрируется узким распределением ошибок.
Рисунок 2. Распределение ошибок.
Красные линии показывают распределение ошибок оценки RE, а синие линии показывают распределение ошибок оценки FE. На каждой панели показана корреляция между независимой переменной и эффектом на уровне группы, установленным на различное значение ρ (0,0, 0,3, 0,6), увеличивающееся слева направо. Моделирование на основе правильной спецификации модели с 50 группами и 10 наблюдениями на группу. 50% вариации переменной результата объясняется остатками, в то время как только 10% вариации независимой переменной приходится на группы.
https://doi.org/10.1371/journal.pone.0110257.g002
Панель (a) на Рисунке 2 показывает случаи, когда, тогда как панель (b) показывает случаи, когда, а панель (c) показывает случаи, когда. На панели (а) RE явно является лучшим оценщиком, поскольку он беспристрастен и более точен (следовательно, эффективен). И наоборот, на панели (c) показаны случаи, когда очевидно, что FE лучше, потому что RE настолько смещен. На панели (b) присутствует большая двусмысленность. Вертикальная линия справа от нуля показывает, что RE смещено вверх, как, но отклонение от среднего значения ошибок RE намного меньше.Возможно, что, несмотря на смещение, абсолютная ошибка оценки RE иногда все же меньше соответствующей ошибки FE. Для панели (b) теория менее поучительна, и практикующему специалисту необходимо сделать суждение между принятием предвзятости или неточностью.
Помимо взвешивания стоимости смещения и неточности, существует несколько других практических различий между традиционными оценками RE и FE. Одно различие существует потому, что оценщик FE удаляет все межгрупповые вариации и использует только внутригрупповые вариации.Это означает, что переменные уровня группы (которые постоянны для всей группы) не могут быть включены в оценочную модель, а для панельных данных нельзя включить переменные, не зависящие от времени. Таким образом, когда целью анализа является измерение влияния переменных на уровне группы, оценка FE не является жизнеспособным методом. Оценка RE, с другой стороны, опирается на вариации как внутри группы, так и между группами, и, следовательно, позволяет включать переменные, которые являются постоянными внутри группы.
Второе различие между двумя традиционными оценщиками заключается в том, что оценка RE имеет тенденцию быть более гибкой и легко вписывается в иерархическую структуру.Используя эту структуру, группы легко вкладываются друг в друга, переменные, влияющие на разные уровни иерархии, легче исследовать, а неоднородные маргинальные эффекты можно исследовать в контексте случайных коэффициентов [7], [11]. Хотя большая гибкость является заметным преимуществом в пользу оценки RE, она не отменяет предположения о независимости между эффектами на уровне группы и независимой переменной. Когда это предположение не выполняется, традиционная оценка RE будет смещена.
Промежуточный подход
В только что обсужденных традиционных спецификациях RE является точным и довольно гибким, но также, вероятно, будет необъективным. В качестве альтернативы, оценка FE является беспристрастной, но менее гибкой, менее точной и не может использоваться для изучения влияния характеристик на уровне группы. В этом подразделе мы исследуем один вариант оценки, предназначенный для объединения двух традиционных оценок и использования лучших характеристик каждой из них. Рассматриваемый нами гибрид имеет несколько названий, которые некоторые называют оценкой «внутри между» [7], [30], «подходом Мундлака» другими [11], [33] и «коррелированными случайными эффектами Мундлака». модель по другой [34].Этот оценщик применяет оценку RE к уравнению (6), где — среднее значение на уровне группы каждой из включенных объясняющих переменных. (6)
Мундлак предложил оценить где, хотя Белл и Джонс (2012) указывают три причины, по которым следует предпочесть уравнение (6). Для пространства мы рассматриваем только уравнение (6) при моделировании. Когда в модель включены как средние значения уровня кластера, так и отклонения от средних значений уровня кластера, оценка коэффициента, связанная с отклонениями от средних значений уровня кластера, не коррелируется со средними значениями уровня кластера.Таким образом, коэффициент не корректируется для межкластерного эффекта, а коэффициент отражает как внутренний, так и промежуточный эффект. Чтобы получить правильный внутрикластерный эффект из уравнения (6), промежуточный эффект (γ) должен быть вычтен из β, приложенного к отклонениям от средних значений на уровне кластера. Если используется альтернативная спецификация Mundlak, генерируются правильно настроенные внутри и между эффектами.
Некоторые считают подход WB компромиссом между RE и FE.В то время как применяемая механика и универсальность основаны на оценке RE, групповое унижение x применяет альтернативную версию оценки FE. Фактически, другие описали подход WB как гибридную модель FE [9]. Спецификация WB может быть оценена с использованием различных методов оценки, включая обычную регрессию наименьших квадратов с устойчивыми стандартными ошибками кластера и обобщенные оценочные уравнения. Практик может выполнить оценку ВБ, представленную в этом документе, используя стандартную оценку случайных эффектов в любом современном статистическом или эконометрическом программном обеспечении, используя случайные эффекты на уровне единицы и указав модель, чтобы включить средние значения на уровне единиц и отклонения от средних значений на уровне единиц. всех объясняющих переменных.
Унижение группы гарантирует, что из уравнения (4), (5) и (6) асимптотически эквивалентны [34]. Неспособность унизить отдельные наблюдения приведет к смещению оценок эффекта. считается «внутренним» эффектом, который оценивает изменения внутри группы (как это делает оценщик FE), в то время как измеряет эффект x между группами [7]. Что наиболее важно, объясняющая переменная и неучтенные эффекты на уровне группы уравнения (6) полностью независимы, если среднее значение группы также включено в качестве объясняющей переменной.Таким образом, эта спецификация RE беспристрастна, и, как элегантно заключил Мундлак, «Вся литература, основанная на воображаемом различии между двумя оценками… основана на неправильной спецификации [RE], которая игнорирует корреляцию между [группой -уровневые] эффекты и объясняющие переменные »[29].
Хотя подход WB и оценка FE асимптотически эквивалентны, для конечных выборок это не так. Кроме того, использование оценщика RE в расширенной спецификации для получения стандартных оценок FE не решает компромисса с точностью до смещения.По-прежнему правдоподобно, что в некоторых сценариях смещенная оценка RE может быть предпочтительнее несмещенной оценки на основе оценки FE или подхода Всемирного банка. Эта возможность еще более вероятна, когда образцы малы. Чтобы изучить эти проблемы, мы обратимся к моделированию.
Методы
Чтобы получить представление об оценках RE и FE и подходе Всемирного банка, мы моделируем и делаем выводы из более чем 16 миллионов наборов данных. Теория предлагает ограниченное руководство для адекватного решения проблемы компромисса смещения и точности, и мало что известно о свойствах небольшой выборки для подхода WB.Хотя может показаться идеальным никогда не использовать смещенную оценку, рисунок 2 (показанный выше) показывает, что иногда использование неточной оценки может быть хуже, чем использование слегка смещенной оценки.
Этот раздел включает объяснение измерений, которые определяют каждый процесс генерации данных, объяснение того, как генерируется каждый набор данных, и объяснение показателей, используемых для сравнения оценок RE, FE и WB.
Входные размеры
Мы рассматриваем 16 200 уникальных комбинаций входных параметров, моделируя 1000 наборов данных для каждой комбинации.Скорректированные размеры перечислены в таблице 1. Число кластеров ( J ) колеблется от десяти до 100, а количество наблюдений на кластер ( N ) колеблется от пяти до 50. Эффект на уровне группы () обычно распределены с нулевым средним и единицей дисперсии. Единственная независимая переменная () обычно распределяется с нулевым средним и дисперсией (). устанавливается равной, половинной или двойной дисперсии группового эффекта. Дисперсию объясняющей переменной можно разделить на дисперсию внутри групп () и дисперсию между группами (), так что.В этом моделировании используются случаи, когда от 10% до 90% дисперсии происходят внутри групп. Остаток () также нормально распределен с нулевым средним и дисперсией (), так что от 10% до 90% вариации y объясняется остатком. Предельный эффект ( β ) единственной независимой переменной устанавливается равным единице. Наиболее важно то, что корреляция ( ρ ) между эффектом на уровне группы и объясняющей переменной установлена в диапазоне от нуля до 0,7. Во многих случаях невозможно получить ρ > 0.7, и поддерживать желаемые значения для внутренней, промежуточной и общей дисперсии объясняющей переменной. В этих случаях ковариационная матрица, необходимая для генерации среднего на уровне группы независимой переменной, которая должным образом коррелирует с эффектом на уровне группы, не является положительной полуопределенной.
Чтобы включить широкий набор вероятных сценариев, мы также рассматриваем два типа неправильной спецификации модели. Первый тип неправильной спецификации модели устанавливает корреляцию между независимой переменной и остатком равной нулю или 0.2 (). Когда объясняющая переменная является эндогенной, а МНК смещен. В наблюдаемых данных эндогенная переменная может быть вызвана ошибкой измерения, обратной причинно-следственной связью (одновременностью), последовательной корреляцией или пропущенной переменной. Второй тип неправильной спецификации модели вызывает серийную корреляцию непосредственно в остатке. В этих случаях корреляция между остатком и предыдущим внутригрупповым остатком (при допущении продольных данных) равна нулю или 0,2.
Моделирование наборов данных
Для создания смоделированных наборов данных мы выполняем четырехэтапный процесс.Сначала мы используем J и N , чтобы установить общее количество наблюдений, так что j и n однозначно идентифицируют каждое из наблюдений J * N . Во-вторых, мы случайным образом извлекаем два вектора с длиной J из многомерного нормального распределения, так что: (7) где, — независимая переменная среднего значения группы, и. В-третьих, мы случайным образом рисуем два вектора с длиной J * N из многомерного нормального распределения, так что: (8) и (9)
Уравнение (9) гарантирует, что дисперсия остатка составляет π дисперсии выходной переменной ().В-четвертых, переменная результата генерируется согласно уравнению (1).
Оценка RE и FE оценка
Для всех 16 200 сценариев мы применяем три средства оценки: традиционную оценку RE, традиционную оценку FE и оценку WB. Затем для каждого оценщика мы измеряем ошибку предполагаемого маржинального эффекта. Мы рассчитываем распределения 1000 ошибок (среднее значение, 2,5 -й процентиль и 97,5 -й процентиль ) и среднеквадратичной ошибки (MSE).MSE представляет собой ценную сводную статистику, поскольку она снижает оценку как за смещение, так и за неэффективность, так что
Мы также оцениваем, насколько хорошо каждый оценщик предсказывает значения выходной переменной (). Для каждого моделирования мы вычисляем среднеквадратичную ошибку (RMSE) предсказанных значений для каждого моделирования. Для каждой оценки и комбинации измерений мы вычисляем распределение 1000 RMSE (среднее значение, 2,5 -й процентиль и 97,5 -й процентиль ).
Наконец, для каждого моделирования мы также проводим тест Хаусмана [35].Тест Хаусмана — это обычный инструмент, используемый для того, чтобы направить практиков к оценке RE или от нее. Тест основан на интуиции, что если предполагаемые предельные эффекты RE и FE статистически не различаются, то обе оценки должны быть беспристрастными и непротиворечивыми. Этот вывод сделан из того факта, что FE беспристрастна и последовательна; Если оцененные предельные эффекты статистически не отличаются, разумно, чтобы смещение пропущенной переменной, которое могло повредить RE, было незначительным.Таким образом, нулевая гипотеза теста Хаусмана состоит в том, что RE и FE согласованы. Если нулевая гипотеза не может быть отвергнута, то согласно общепринятому мнению, следует применить оценку RE, поскольку она эффективна. Однако, если нулевая гипотеза отклоняется, общепринятое мнение предлагает оценку FE. Stata 12.0 использовался для всех симуляций и анализов, а код доступен в файле S1.
Результаты
Исходные результаты
Мы начинаем со сравнения оценок RE, FE и WB, используя нашу «базовую» схему моделирования, изменяя только корреляцию между эффектами на уровне группы и включенными независимыми переменными ( ρ ), количество кластеров ( J ). ), и количество наблюдений в группе ( N ).Исходные данные перечислены в таблице 1. На исходном уровне дисперсия эффекта на уровне группы () и дисперсия независимой переменной () установлены равными единице. Мы дезагрегировали равномерно, так что межгрупповая дисперсия () и внутригрупповая дисперсия () каждая установлена на 0,5 (). Базовая установка также предполагает, что модель задана правильно (не индуцируется эндогенность или серийная корреляция), и 50% дисперсии переменной результата может быть объяснено с помощью группового уровня и независимой переменной ().Для сопоставимости рисунки с 3 по 11 этой статьи смоделированы по образцу исходных графиков Кларка и Линцера [31]. Эти графики — эффективный и действенный метод для вытеснения множества результатов.
Рисунок 3. Распределение ошибок оцененных предельных эффектов при базовой спецификации.
Сплошная красная линия показывает среднюю ошибку оценок предельного эффекта на основе оценки RE, а пунктирные красные линии показывают 95% диапазон ошибок оценки RE. Сплошная синяя линия и пунктирные синие линии показывают это среднее значение и 95% диапазон ошибок оценки FE.Сплошная зеленая линия и пунктирные зеленые линии показывают это среднее значение и 95% диапазон ошибок подхода Всемирного банка. Все входные данные моделирования являются базовыми.
https://doi.org/10.1371/journal.pone.0110257.g003
Рисунок 4. MSE оценок предельного эффекта на исходном уровне.
Красная линия показывает MSE из ошибок в оценках предельного эффекта из оценки RE. Синяя и зеленая линии показывают то же самое для оценки FE и подхода WB соответственно. Все входные данные моделирования являются базовыми.
https://doi.org/10.1371/journal.pone.0110257.g004
Рисунок 5. Тест Хаусмана.
Сплошные оранжевые линии показывают долю моделирования, для которой тест Хаусмана не отвергает при уровне достоверности 90% нулевую гипотезу о том, что оценки RE и FE согласованы. Принято считать, что это предполагает, что исследователи должны использовать оценку RE, поскольку она более эффективна. Пунктирные оранжевые линии показывают долю моделирования, для которой тест Хаусмана предлагает оценку с меньшей абсолютной ошибкой.Красный фон указывает, когда средство оценки RE является предпочтительным для MSE, а синий фон указывает, когда средство оценки FE является предпочтительным для MSE. Белые области указывают на то, что разница между MSE двух оценщиков незначительна. Все входные данные моделирования являются базовыми.
https://doi.org/10.1371/journal.pone.0110257.g005
Рисунок 6. Распределение RMSE от прогнозируемых результатов.
Красные линии показывают среднее значение и 95% доверительный интервал RMSE, полученного из подобранных значений с использованием оценки RE.Каждая комбинация входных данных состоит из 1000 имитаций, и каждая получает свое собственное среднеквадратичное значение, основанное на ошибках подобранных значений. Синие линии показывают среднее значение и диапазон 95% RMSE, полученного с помощью оценщика FE. Зеленые линии показывают среднее значение и 95% диапазон RMSE из подхода Всемирного банка. Все входные данные моделирования являются базовыми.
https://doi.org/10.1371/journal.pone.0110257.g006
Рис. 7. Значительные межгрупповые различия относительно внутригрупповых вариаций.
Строка 1 (интерпретируется как рисунок 3) показывает распределение ошибок в оценках предельных эффектов на основе оценки RE (красный), оценки FE (синий) и подхода WB (зеленый). Строка 2 (интерпретируется как рисунок 4) показывает MSE, связанную с ошибками оценки RE (красный), оценки FE (синий) и подхода WB (зеленый). Строка 3 (интерпретируется как рисунок 6) показывает распределение RMSE от подобранных значений, оцененных с использованием оценки RE (красный), оценки FE (синий) и подхода WB (зеленый).Межгрупповая вариация установлена на 0,9, а внутригрупповая вариация — на 0,1. Все остальные входные параметры моделирования установлены на базовые.
https://doi.org/10.1371/journal.pone.0110257.g007
Рис. 8. Значительные внутригрупповые различия по сравнению с межгрупповыми вариациями.
Строка 1 (интерпретируется как рисунок 3) показывает распределение ошибок в оценках предельных эффектов на основе оценки RE (красный), оценки FE (синий) и подхода WB (зеленый).Строка 2 (интерпретируется как рисунок 4) показывает MSE, связанную с ошибками оценки RE (красный), оценки FE (синий) и подхода WB (зеленый). Строка 3 (интерпретируется как рисунок 6) показывает распределение RMSE от подобранных значений, оцененных с использованием оценки RE (красный), оценки FE (синий) и подхода WB (зеленый). Внутригрупповая вариация установлена на 0,75, а межгрупповая вариация — на 0,25. Все остальные входные параметры моделирования установлены на базовые.
https: // doi.org / 10.1371 / journal.pone.0110257.g008
Рисунок 9. Плохо подходящая модель, которая объясняет лишь небольшую часть дисперсии переменной результата.
Строка 1 (интерпретируется как рисунок 3) показывает распределение ошибок в оценках предельных эффектов на основе оценки RE (красный), оценки FE (синий) и подхода WB (зеленый). Строка 2 (интерпретируется как рисунок 4) показывает MSE, связанную с ошибками оценки RE (красный), оценки FE (синий) и подхода WB (зеленый). Строка 3 (интерпретируется как рисунок 6) показывает распределение RMSE от подобранных значений, оцененных с использованием оценки RE (красный), оценки FE (синий) и подхода WB (зеленый).Дисперсия остатка задается так, что объясняет 90% вариации переменной результата. Все остальные входные параметры моделирования установлены на базовые.
https://doi.org/10.1371/journal.pone.0110257.g009
Рис. 10. Модель точного соответствия, которая объясняет значительную часть дисперсии переменной результата.
Строка 1 (интерпретируется как рисунок 3) показывает распределение ошибок в оценках предельных эффектов на основе оценки RE (красный), оценки FE (синий) и подхода WB (зеленый).Строка 2 (интерпретируется как рисунок 4) показывает MSE, связанную с ошибками оценки RE (красный), оценки FE (синий) и подхода WB (зеленый). Строка 3 (интерпретируется как рисунок 6) показывает распределение RMSE от подобранных значений, оцененных с использованием оценки RE (красный), оценки FE (синий) и подхода WB (зеленый). Дисперсия остатка установлена так, что объясняет только 10% вариации переменной результата. Все остальные входные параметры моделирования установлены на базовые.
https: // doi.org / 10.1371 / journal.pone.0110257.g010
Рисунок 11. Модель неверно указана.
Строка 1 (интерпретируется как рисунок 3) показывает распределение ошибок в оценках предельных эффектов на основе оценки RE (красный), оценки FE (синий) и подхода WB (зеленый). Строка 2 (интерпретируется как рисунок 4) показывает MSE, связанную с ошибками оценки RE (красный), оценки FE (синий) и подхода WB (зеленый). Строка 3 (интерпретируется как рисунок 6) показывает распределение RMSE от подобранных значений, оцененных с использованием оценки RE (красный), оценки FE (синий) и подхода WB (зеленый).Корреляция между независимой переменной и остатком установлена на 0,2. Все остальные входные параметры моделирования установлены на базовые.
https://doi.org/10.1371/journal.pone.0110257.g011
На рисунке 3 показано распределение ошибок для базовой настройки. На рисунке 3 и всех последующих рисунках ось x измеряет ρ , красный цвет используется для оценки RE, синий используется для оценки FE, а зеленый используется для подхода WB. По оси ординат показана ошибка оценки предельного эффекта.Сплошная линия представляет собой среднее значение 1000 ошибок, а пространство между пунктирными линиями показывает 95% -ный разброс ошибок, возникающих в результате каждой оценки. Каждый из девяти графиков имеет разное количество групп ( J ) и наблюдений по группам ( N ). На рисунке 3 смещение существует, когда среднее значение распределения ошибок не равно нулю. Распределение ошибок, то есть ширина (вверх и вниз) полосы, окружающей среднюю ошибку, служит мерой точности.
Три важных вывода подтверждаются на Рисунке 3.Во-первых, сплошные синие и зеленые линии всегда равны нулю, что означает, что оценка FE и подход WB всегда несмещены. Во-вторых, оценка RE более точна, чем две конкурирующие оценки. Разброс ошибок вокруг среднего для оценки RE меньше, чем для любого из других подходов. В-третьих, по мере увеличения и оценка RE становится смещенной. Направление смещения совпадает с направлением корреляции между эффектами на уровне группы и объясняющей переменной, и симметричный набор графиков может быть построен с ρ <0, что приведет к смещению в сторону уменьшения оценки RE.Эти моменты подтверждаются для всех размеров выборки, но наиболее отчетливы и наиболее очевидны в самых маленьких выборках.
Рисунок 3 показывает, что практикующему специалисту может быть выгодно использовать более точную оценку RE в некоторых случаях, даже если она предвзята. Например, случай J = 10, N = 5 и ρ = 0,1 иллюстрирует некоторые сценарии, в которых смещение может быть достаточно небольшим, чтобы практикующий врач предпочел принять смещение, а не полагаться на менее точную оценку FE.
Рисунок 4 проясняет этот момент. На этом рисунке показана MSE из 1000 симуляций для каждой оценки и комбинации J , N и ρ . На рисунке 4 показаны результаты с использованием тех же исходных данных моделирования, при изменении J , N и ρ . MSE — ценный показатель, поскольку он объединяет смещение и точность в одну метрику и, таким образом, может использоваться в качестве руководства для решения проблемы компромисса смещения и точности. На рисунке 4, когда красная линия больше синей и зеленой линий, оценка RE предпочтительнее MSE, даже если она немного смещена.Основываясь на этой метрике, рисунок 4 показывает, что в большинстве базовых случаев существует либо незначительная разница между подходами RE, FE и WB, либо подходы FE и WB явно предпочтительны для MSE.
Рисунок 5 показывает, является ли тест Хаусмана ценным руководством для определения того, какую оценку выбрать, когда ρ неизвестно (как это бывает в большинстве случаев). Фон графиков на рисунке 5 основан на оценках MSE, представленных на рисунке 4. Фон на рисунке 5 красный, если RE является предпочтительным для MSE.Если оценка FE предпочтительна для MSE, то фон рисунка 5 будет синим. Если MSE двух оценщиков находятся в пределах 0,005 друг от друга, мы считаем это тривиальным различием и оставляем фон белым.
На рисунке 5 сплошные оранжевые линии показывают долю из 1000 имитаций, для которых тест Хаусмана не отверг нулевую гипотезу, используя α = 0,1. Другими словами, сплошная оранжевая линия показывает долю из 1000 симуляций, для которых тест Хаусмана рекомендовал стандартную спецификацию оценки RE.Если тест Хаусмана является эффективным тестом, оранжевая линия будет около 1 (100%), когда фон красный, и около нуля, когда фон синий. Пунктирные оранжевые линии на рисунке 5 показывают долю из 1000 имитаций, в которых тест Хаусмана рекомендовал оценку с наименьшей абсолютной ошибкой (), сравнивая только традиционные спецификации RE и FE. Эта метрика предполагает, что практикующий специалист предпочитает минимизировать абсолютную ошибку и имеет двоичный выбор между традиционной оценкой RE и FE.Когда оранжевая пунктирная линия находится рядом с единицей, это означает, что тест Хаусмана рекомендовал «лучшую» оценку почти в 100% случаев.
Рисунок 5 подтверждает, что тест Хаусмана наиболее эффективен для больших выборок. В небольших выборках тест часто не может отклонить нулевую гипотезу даже при относительно большом ρ . В результате тест Хаусмана предлагает «лучшую» оценку примерно в 50% случаев. По мере увеличения размера выборки, особенно в J , тест становится более эффективным.В этих случаях тест Хаусмана более склонен к отклонению нуля, поскольку ρ увеличивается и частота, с которой тест рекомендует «лучшую» оценку, приближается к 100%.
Рисунок 6 показывает, что оценка FE лучше при прогнозировании результатов. Базовая установка на Рисунке 6 такая же, как и на предыдущих рисунках, хотя в этом случае по оси Y измеряется распределение 1000 RMSE, где RMSE-статистика выводится для каждого модуля оценки и каждого моделирования на основе ошибки J *. N прогнозируемые значения ().Сплошная линия показывает среднее значение 1000 RMSE, а пары пунктирных линий показывают 95% диапазон RMSE для каждой оценки. Независимо от того, какая комбинация J , N и ρ , оценка FE является лучшим предсказателем. Среднее RMSE и дисперсия RMSE являются наименьшими для оценки FE (относительно оценки RE и подхода WB), что означает, что оценка FE является менее смещенным и эффективным предсказателем.
Различная межгрупповая и внутригрупповая дисперсия
На рис. 7 оценивается эффект корректировки дисперсии объясняющей переменной таким образом, что большая часть из них вызвана межгрупповой изменчивостью.Эта корректировка оставляет только небольшую часть внутри групп. Для рисунка 7 мы оставляем, но увеличиваем до 0,9 и уменьшаем до 0,1 (путем установки). Это характерно для данных с большой (наблюдаемой) неоднородностью между группами и небольшими изменениями внутри групп. Примеры таких данных могут включать дородовую помощь в регионе, расходы медицинских учреждений с течением времени или уровень материнской смертности в странах с течением времени. Если данные являются лонгитюдными, это можно считать «вялыми» данными [31].
С учетом трех (вместо девяти) комбинаций J и N , на рисунке 7 показано распределение ошибок оценок предельного эффекта (строка 1), MSE оцененных предельных эффектов (строка 2) и эффективности. каждого оценщика при прогнозировании переменной результата (строка 3). В строке 1 показано, что при небольшом размере выборки оценка RE намного точнее, чем оценка FE и подход WB. Это связано с тем, что RE использует как межгрупповые, так и внутригрупповые вариации, тогда как FE использует только внутригрупповые вариации, а коэффициент, оцениваемый в подходе WB, измеряет только внутригрупповой эффект.При наименьшем размере выборки строка 2 показывает, что RE всегда предпочтительнее MSE, несмотря на смещение, когда ρ > 0. Однако самый большой размер выборки ( J = 100, N = 50) показывает, что различия между оценками RE, FE и WB либо незначительны, либо оценка FE и подход WB предпочтительнее для MSE. Между этими двумя крайностями образец среднего размера ( J = 50, N = 10) демонстрирует большую неоднозначность. Строка 3 подтверждает, что FE остается незначительно, но однозначно лучшим предсказателем переменных результата независимо от J , N и ρ .
Хотя здесь и не показан, тест Хаусмана дает лишь незначительное понимание этих случаев, особенно когда размер выборки от малого до среднего. Это было недавно задокументировано в других местах этой литературы [36]. В этих симуляциях тест рекомендует «лучшую» оценку в 55%, 54% и 74% случаев для трех размеров выборки, показанных на рисунке 7. В сценариях размера выборки от малого до среднего (с наблюдениями, меньшими или равными 500), тест Хаусмана дает ограниченное руководство, за исключением случая, когда ρ исключительно велико.По мере того, как размер выборки превышает 1000 наблюдений, на критерий Хаусмана можно полагаться все больше.
Рисунок 8 иллюстрирует настройку базовой линии, скорректированную таким образом, что 75% вариации объясняющей переменной обнаруживается внутри групп, в то время как только 25% вариации приходится на группы. Этот тип данных характерен для показателей здоровья, сгруппированных по учреждениям, национальных показателей смертности, сгруппированных по регионам, или распространенности ВИЧ с течением времени. В этих условиях внутри группы наблюдается большая неоднородность.На рисунке 8 показано, что за исключением самых маленьких образцов с ρ на уровне 0 или очень близком к нему, оценка FE и преформа подхода WB, а также оценка RE или лучше.
Различная величина отклонения, объясняемая моделью
На рисунках 9 и 10 показана подгонка модели. То есть теперь мы рассматриваем результаты, в которых мы изменяем долю дисперсии переменной результата, которая объясняется моделью ( π ). Возвращая все остальные входные данные обратно к базовому уровню, мы устанавливаем π = 0.9, который устанавливает дисперсию остатка таким образом, чтобы оцениваемая модель была оборудована для измерения только 10% вариации y . Эти данные будут характерны для любой плохо подходящей модели с относительно небольшим R 2 (коэффициент вариации). На рисунке 9 показано, что в небольших выборках оценка RE явно превосходит оценку FE и подход WB, а оценка RE однозначно предпочтительна для MSE, независимо от ρ . По мере увеличения размера выборки, особенно в J , подходы FE и WB становятся более правдоподобными оценками.В самой большой выборке ясно, что подходы FE и WB либо эквивалентны оценке RE, либо предпочтительнее MSE.
На рисунке 10 рассматривается модель, которая исключительно хорошо согласуется с остатком, объясняющим только 10% дисперсии y . В этих случаях подходы FE и WB явно эквивалентны или предпочтительны для MSE по сравнению с оценкой RE даже в самых маленьких выборках. Строка 3 показывает, что хотя FE остается лучшим предсказателем переменных результата, он имеет только наименьший запас.
Изменение всех остальных размеров
На рис. 11 рассматривается моделирование с базовой установкой, но ψ настроено на 0,2, так что независимая переменная является эндогенной. Это характерно для данных, страдающих от ошибки измерения, обратной причинной связи, последовательной корреляции или пропущенной объясняющей переменной, которая коррелирует с включенной объясняющей переменной. Уникальность рисунка 11 заключается в том, что мы впервые видим, что метод оценки FE и подход WB смещены, поскольку необходимые предположения OLS не выполняются.Тем не менее, эндогенность x не меняет наших первичных исходных данных, за исключением очень маленьких выборок, где оценка FE и подход WB фактически эквивалентны или предпочтительнее MSE по сравнению с оценкой RE. Моделирование показывает, что изменение дисперсии объясняющей переменной или индукция последовательной корреляции в остатке оказывает тривиальное влияние на выбор между тремя оценками. Во всех этих симуляциях исходные результаты остаются в силе.
Сравнение традиционной оценки фиксированных эффектов и подхода Всемирного банка
Асимптотически метод оценки FE и метод WB эквивалентны, поскольку оба согласованы.Но эти две оценки не обязательно эквивалентны в конечных выборках. Рисунки с 5 по 11 показывают, что оценка FE является однозначно лучшим предсказателем. Среднее RMSE для каждого сценария меньше для оценщика FE, чем для подхода WB. Кроме того, распределение RMSE более жесткое для оценщика FE, что означает, что он также является более точным предсказателем.
Этого нельзя сказать о предполагаемых (внутригрупповых) предельных эффектах (). Рисунки 3 и 6–11 показывают, что распределение ошибок кажется идентичным, но сравнение MSE предполагает, что в небольших выборках две оценки не одинаковы.Чтобы количественно оценить эту разницу, мы сравниваем MSE оценки FE с подходом WB для каждого из 16 200 сценариев. По мере увеличения числа наблюдений оценки двух оценщиков должны сходиться друг к другу и к истинному предельному эффекту. В небольших выборках мы видим, что разница между двумя MSE не равна нулю и не центрирована на нуле. Для 40% симуляций с менее чем 500 наблюдениями MSE оценки FE больше, чем у подхода WB, более чем на 0.01. Кроме того, MSE подхода WB больше, чем MSE оценки FE, более чем на 0,01 в 0% этих имитаций. Это означает, что в непропорционально большом количестве сценариев с небольшой выборкой подход Всемирного банка обеспечивает меньшую MSE.
Чтобы исследовать это дальше, мы смотрим на попарную корреляцию между входными параметрами моделирования и разницей между MSE подхода WB и MSE оценщика FE, оценивая только сценарии с менее чем 500 наблюдениями. Таблица 2 показывает, что несколько входных параметров коррелируют с разницей в MSE, статистически значимой на уровне достоверности 99%.Самый важный предиктор MSE подхода WB меньшего размера — это количество групп и количество наблюдений на группу; при увеличении любого из них разница между MSE WB и MSE FE приближается к нулю; то есть повышение эффективности метода WB незначительно в больших выборках. Следующие два детерминанта, наиболее коррелирующие с различием в MSE, — это доля вариации внутри группы по сравнению между группами и степень согласия модели. По мере того, как доля вариации в объясняющей переменной смещается в сторону большего количества внутри групп, разница между двумя оценками приближается к нулю.Кроме того, по мере ухудшения соответствия модели две оценки становятся более равными. Подводя итог этим моментам: оценка FE и подход WB в целом очень похожи, хотя в небольших выборках подход WB, как правило, превосходит оценку внутригрупповых предельных эффектов. Это превосходство особенно верно, чем меньше размер выборки, чем больше доля вариаций между группами и тем лучше подходит модель.
Обсуждение
Теория предлагает один важный совет: предвзятость RE напрямую связана с.Таким образом, когда оценка RE является очевидным выбором. Однако в большинстве наблюдательных исследований это кажется вероятным. В большинстве случаев нетрудно представить, почему некоторая корреляция между эффектами на уровне группы и объясняющими переменными будет искажать оценку предельного эффекта. Когда невозможно сделать уверенный вывод, выбор между оценками FE и RE оказывается сложной задачей. Исследователи вынуждены выбирать между потенциально точной смещенной оценкой и неточной несмещенной оценкой .Существует мало соглашения о том, как уравновесить этот компромисс с точностью до смещения и правильно указать оценку. К счастью, моделирование может дать некоторые подсказки. Мы вывели пять простых и практических практических правил из этого набора симуляций.
Во-первых, если целью анализа является прогнозирование (в отличие от вывода о предельных эффектах), то оценка FE является однозначно предпочтительной оценкой. Рисунок 6 и строка 3 рисунков 7, 8, 9, 10, 11 показывают, что прогнозы FE всегда имеют меньшее RMSE.Поскольку оценщик FE не может предсказать результаты для групп, которые не включены в исходную оценку, подход WB является явной второй лучшей оценкой в этих ситуациях.
Во-вторых, когда целью анализа является вывод о предельных эффектах, моделирование предполагает, что подход WB предпочтительнее традиционной оценки FE. Моделирование подтверждает, что оценки внутригрупповых предельных эффектов асимптотически идентичны, но подход Всемирного банка предоставляет исследователям дополнительную информацию относительно межгрупповых предельных эффектов ().Для небольших выборок, включенных в наш анализ, подход WB постоянно имеет (по существу) эквивалентную или меньшую MSE, чем оценка FE. Помимо вариаций, которые можно отнести к шуму, нет сценариев, когда FE предпочтительнее MSE, чем WB.
В-третьих, как правило, чем больше размер выборки, тем больше практик должен избегать традиционной оценки RE. Применение оценки FE ко всем смоделированным выборкам с более чем 500 наблюдениями привело к средней абсолютной ошибке в 4% от истинного предельного эффекта.Оценка RE привела к средней абсолютной ошибке 8% от истинного предельного эффекта. В симуляциях с более чем 1000 наблюдений оценка RE была предпочтительна только для MSE сверх тривиального порога (0,005) в очень немногих случаях, когда 90% вариации y не могли быть объяснены с помощью модели (). Важно отметить, что это правило противоречит тенденции исследователей использовать оценку RE для задач с большими J . По-видимому, исследователи не решаются «тратить впустую» степени свободы для каждой из групп J , когда J довольно велико.Хотя верно то, что при выборе оценки FE используется больше степеней свободы, моделирование показывает, что использование этой оценки FE является предпочтительным для MSE (по сравнению с оценкой RE) в большинстве сценариев большого размера. Это тот случай, когда подход Всемирного банка представляет собой ценный компромисс между двумя традиционными оценками. Подход WB генерирует практически эквивалентные оценки как FE, но использует только часть степеней свободы.
В-четвертых, небольшие выборки отмечают обстоятельства, при которых практикующий врач может последовательно предпочитать точность предвзятости.Наше моделирование показывает, что в сочетании с небольшими выборками (меньше или равными нескольким сотням наблюдений) две наблюдаемые характеристики данных делают особенно вероятным, что оценка RE будет предпочтительнее для MSE. Один из сценариев — это когда оценочная модель объясняет очень небольшую часть вариации в оценке результатов. Когда небольшой размер выборки сочетается с плохо подходящей моделью, неточность оценок FE и WB имеет тенденцию вводить исследователя в заблуждение больше, чем систематическая ошибка оценки RE, даже при больших ρ .Степень соответствия кластерной модели может быть исследована путем изучения статистики R 2 , связанной с оценкой LSDV. Учитывая только моделирование с R 2 <0,5 и менее 500 наблюдений, традиционная оценка RE имела меньшую абсолютную ошибку, чем оценка FE в 57% случаев.
Еще один уникальный сценарий, когда оценщик RE последовательно отдает предпочтение MSE и его следует учитывать, — это небольшие выборки, которые имеют относительно небольшие внутригрупповые вариации для интересующей переменной.Опять же, в этих случаях неточность оценок FE и WB может быть более едкой, чем смещение оценки RE. В случаях моделирования с менее чем 500 наблюдениями и вариациями внутри группы менее 20% от общей вариации оценка RE приводит к меньшей абсолютной ошибке в 53% случаев. Однако с небольшими выборками оценки WB и FE менее надежны, поскольку они делают выводы из слишком небольшого количества наблюдений и, вероятно, слишком малых вариаций. При выборе модели RE может быть большое, но неточное различие по сравнению с FE и WB.У практикующего специалиста может быть недостаточно возможностей для адекватной корректировки смешения на уровне кластеров.
Пятое правило, полученное в результате этого моделирования, заключается в том, что тест Хаусмана наиболее проницателен для больших выборок. К сожалению, это те самые случаи, когда тест нужен меньше всего. При моделировании с более чем 1000 наблюдений тест Хаусмана рекомендует использовать оценщик с меньшей ошибкой в 67% случаев. Однако, когда оценщик FE вслепую применяется ко всем этим же случаям, он генерирует ту же самую медианную абсолютную ошибку и является «лучшим» оценщиком (по сравнению с традиционным оценщиком RE) в 70% симуляций.
Эти практические правила применимы не ко всем ситуациям, с которыми может столкнуться практикующий специалист. Например, для моделей бинарных ответов и сложных данных обследований требуются различные методы оценки. Когда переменная результата является двоичной, определение модели RE, FE или WB в этой структуре создает новые проблемы для правильной спецификации модели и интерпретации предельных эффектов. Модель бинарных результатов RE — это особая форма модели средней численности населения. Вместо оценки (как в линейном случае) предполагается, что u j имеет параметрическое распределение и не зависит от [9].Маргинальный эффект от модели бинарного отклика RE — это средний популяционный эффект для индивидуума при = 0 [12].
Проблема исключения для модели бинарного отклика FE не решается путем добавления отдельных индикаторов, так как это приведет к возникновению проблемы случайных параметров [9]. Существуют методы условного правдоподобия для исключения в логит-модели, но не в случае пробитовой или дополнительной логарифмической модели [9], [37]. Подход WB также может быть реализован путем включения средств, специфичных для единиц, и отклонений от средств, специфичных для единиц, каждой объясняющей переменной в структуру RE [17].Если используется подход WB с двоичным результатом, можно использовать другие функции связи, такие как пробит и дополнительный журнал — журнал [9].
Также здесь не обсуждается вопрос комплексных данных обследования. Поскольку сложные планы выборки включают неравные вероятности выбора, стандартные оценщики FE, RE и WB могут привести к смещенным оценкам. Чтобы решить эту проблему, расчетные веса должны быть включены в функцию правдоподобия [38]. Мы направляем практикующего специалиста к многочисленным исследованиям, касающимся этого вопроса, для дальнейшего обсуждения теории и практики [38] — [43].
Во многих дисциплинах различию между оценкой RE и FE уделяется мало внимания. При обсуждении внимание, кажется, сосредотачивается на относительно нерелевантных предположениях о распределении или тесте Хаусмана, и слишком часто игнорируется компромисс между погрешностью и точностью. Когда оценка RE определяется с использованием подхода WB, исследователь получает несмещенные оценки, асимптотически эквивалентные оценке FE. Кроме того, поскольку подход WB работает с использованием оценки RE, он имеет гибкую среду с параметрами, распространяющимися на вложенные группы, иерархические модели и случайные коэффициенты.Более того, есть некоторые свидетельства того, что подход Всемирного банка также подходит для нелинейного оценивания [34]. Понимание этих трех оценщиков, их спецификаций и того, когда их использовать, имеет первостепенное значение для проведения строгих, точных и непредвзятых анализов состояния здоровья.
Участок эрозии почвы — Воздействие эрозии на месте
Основным воздействием эрозии почвы на месте является снижение качества почвы в результате утраты богатых питательными веществами верхних слоев почвы и сниженного водоудержания емкость многих эродированных почв.В богатых регионах мира ускоренная воздействие водной эрозии на сельскохозяйственные почвы может быть смягчается увеличением использования искусственных удобрений; однако это не вариант для большей части населения Земли.
Воздействие эрозии на месте: сильное бурение в Роттингдине на южных холмах Великобритании в 1987 году. Фото: Джон БордманУдаление верхних горизонтов почвы в результате эрозии приводит к сокращению качество почвы i.е. снижение пригодности почвы для сельского хозяйства или другая растительность. Это связано с тем, что размытые верхние горизонты имеют тенденцию быть максимально богатым питательными веществами. Кроме того, потому что лучшие составляющие эродированной почвы имеет тенденцию переноситься дальше всего, эродированные почвы становятся предпочтительно со временем истощаются более мелкой фракцией; это часто снижает их водоудерживающую способность. Другими словами, «Эрозия снимает крем почвы ».
Увеличение использования искусственных удобрений может до некоторой степени и на время компенсировать потери, вызванные эрозией качества почвы при благоприятных экономических условиях. Это однако обычно это невозможно в развивающихся странах. Потеря качества почвы это долгосрочная проблема; во всем мире наиболее серьезное воздействие эрозии почвы вполне может быть его угрозой к долгосрочной устойчивости продуктивности сельского хозяйства, которая возникает в результате причиненного им ущерба на месте.
Зерновые культуры особенно зависят от верхних горизонтов почвы, которые наиболее уязвимы к эрозии водой и ветром. В этом смысле эрозия удаляет «крем почвы». Сельскохозяйственная обработка почвы также перераспределяет почвы, что приводит к более тонкой почве на топографически выпуклых участках внутри поле.
Вредное воздействие эрозии на местах, выражающееся в снижении урожайности сельскохозяйственных культур, хорошо известен в развивающихся странах Африки и Азии.Но даже в в развитом мире есть повод для беспокойства. Водная эрозия локально тяжелые в Австралии, Новой Зеландии, некоторых частях США, Южной Европе, и Восточная Европа (часто в результате бывшего крупного государственного фермы).
В подверженных эрозии районах более богатых стран мира производительность может быть сохранена в краткосрочной и среднесрочной перспективе за счет увеличения внесения удобрений.Эффекты Таким образом, эрозия редко признается фермерами в более богатых странах. Однако эта стратегия неосуществима в отношении эрозии в развивающихся странах. страны.
Доктор Дэвид Фэвис-Мортлок, апрель 2017 г.
.