Описание тега pomegranate
Снежок выборки предполагает потенциал сколь угодно длинные цепочки ссылок (я связаться с Элис, которая получает меня с Бобом, который получает меня с Крисом...) так что это не так.
Если вы уже начали отбор проб, изменение методологии середине образца является, вероятно, плохая идея. Файл этот под вещи, чтобы думать о в следующий раз вы дизайн образец, и, пожалуйста, не забудьте поговорить с статистиком перед запуском образца.
Если вы еще не начали отбор проб, тогда да, вы абсолютно должны собрать эту дополнительную информацию, но нужно учитывать фактор вероятности выбора в том, как вы анализируете данные. Полноценное обсуждение за пределы того, что может разумно вписывается в ФБ пост, но основная идея заключается в том, что вам нужно знать вероятность отбора для каждой единицы (например, AED) и затем, соответственно, вес этих вероятностей отбора.
Например, давайте скажем, моя выборка включает в себя 1000 малых предприятий, в которых каждый собственный один дирхам, и 100 крупных предприятий, которые каждый собственный 10 ПЭП. (Всего: 2000 ПЭП, 1000, принадлежащих малым предприятиям и 1000 крупных предприятий.)
Давайте предположим, что вы пытаетесь оценить, какая доля аэп были использованы в прошлом году, и предположим, что существует систематическое различие между малыми и крупными предприятиями: все большой бизнес ПЭП используются каждый год, и никто из малого бизнеса.
(Очевидно, что это нереально, но утрированный пример упрощает вопросы, чтобы увидеть.)
Теперь предположим, что я веду свой опрос случайным выбором АВД из моего списка 2000, звонит бизнеса, которому он принадлежит, и спрашивать о всех своих ПЭП. Так как 50% ПЭП принадлежит представителям малого бизнеса и 50%, в крупных компаниях, каждый случайный выбор имеет 50% шанс получить мне информацию об одной малого бизнеса дирхам, а также 50% шанс попасть информация о десяти крупных бизнес-ПЭП.
Если я сделаю это в 100 раз, я могу ожидать, чтобы в конечном итоге получить сведения о 50 малых предприятий, ПЭП и 500 крупных предприятий ПЭП. Даже если только 50% ПЭП там были использованы в прошлом году, 500/550 в моем образце были использованы, так наивный анализ завышения оценки использования ПЭП.
Решение это вес по вероятности отбора. В этом случае, каждый малый бизнес Аэд имеет шанс 1/2000 появляться на каждом "нарисовать", и каждый большой бизнес Аэд имеет шанс 1/200 появляться. Поэтому, когда я, анализируя мои данные, я должен вес малого бизнеса ПЭП 10х, как сильно, как большой бизнес ПЭП.
Если вы пытаетесь оценить такие вещи, как стандартные ошибки на основе ваших данных, тогда оно становится немного более сложным, и вы действительно должны поговорить с вашей дружной статистик районе.