FAQ маркет рисёч

6.6. Приемлемая точность зависит от задач

Завершим экскурс в азы ответом на вопрос, какие же цифры – достаточно большие, чтобы быть выборкой. Как ни странно, любые.

Смотря для чего «достаточно». Всегда возможна задача, где точности не требуется вообще. Если в выборке в 10 учеников троечники все поголовно, то в классе в целом уж наверняка их больше половины[1]. Вот, чем не результат. Или, скажем, мы проверяли визиты медицинского представителя, и три из десяти посещенных врачей его не помнят. Ну что, попался. Сколько он там не дохаживает, кто ж его знает, погрешность-с, но в эти-то три раза он пойман за руку! В общем, крайне грубые «измерения» тоже могут иметь смысл.

Если нужны более точные – нужно решить, насколько. То есть задать погрешность, она же доверительный интервал. Из него автоматически следует размер выборки.

Например, когда мы измеряем долю своего бренда – чаще всего хочется видеть минимальную погрешность, +/- пару процентов. Потому что это же продажи (ну, почти), и там даже небольшая динамика говорит о важном. Мы уже начали падать, или таки еще нет? Словом, есть смысл стараться.

Если вопрос в том, сколько народу спонтанно вспомнит наш бренд – это более субъективно, «сегодня вспомнил, завтра отвлекся» – так что здесь бесполезно гнаться за единичными процентами, приемлема погрешность на уровне 5%. Более тонкая динамика скрадется неточностью ответов. Что тоже погрешность, только не статистическая.

И так далее. Требования к ошибке выборки, в первую очередь зависят от того, для чего нам это измерение. Здесь нет формул, достаточно бытовой логики, на уровне здравого смысла: для одних решений достаточно примерной картинки, (вспомним пример с тестированием промо материалов), для других – недостаточно (скажем, всякая разная динамика). А где-то сам показатель настолько «аморфный» (например, любые «отношения выраженные в баллах», или «одобряете ли вы деятельность князя Рюрика») что измерения будут грубыми при любой выборке.

Есть ли универсальный размер выборки, которой хватит для любых задач? Для вообще любых – конечно, нет[2]. Для более-менее любых (и, естественно, только в маркетинге) – это 300 респондентов. На эту цифру стоит обратить внимание, она завершит картину про большие числа.

А вот практической ценности тут немного. Для большей части задач, по крайней мере при опросах врачей, 300 – большой перебор. Но чтобы понять почему, нужно углубиться в суть погрешности; об этом позже.

Чем больше выборка – тем медленнее снижается ошибка. Если вы раньше этого не делали – нагуглите любой так называемый «калькулятор выборки», и поиграйте с параметрами. Вы увидите, что начиная с тысячи все выборки – три, семь или десять тысяч человек – дадут очень маленькую, и уже почти не убывающую погрешность – единичные проценты. На выборках от 300 до 1000 точность меняется шустрее, но тоже сравнительно мало. А вот до 300 погрешность снижается вполне зримо, особенно до 120. Вот эти цифры, примерно от 100 до 300, и есть «достаточно большие», которые нас чаще всего устраивают.

А еще где-то в районе 300 доверительный интервал (он же ошибка) проходит порог в 5%[3]. Это красиво. Впрочем, не стоит слишком обращать внимание на доверительный интервал из калькуляторов выборки. На самом деле, мы а) пока еще не знаем, какая будет погрешность, заранее-то, и б) вообще любим ее переоценивать. Об этом речь пойдет дальше.

[1] Строго говоря, есть ничтожная вероятность, что их все же меньше. В переводе на нормальный – да нет, больше, конечно.

[2] Потребительские медиа-исследования, сегментации, бусты, ценовой анализ и особенно реп-чеки могут потребовать выйти и за тысячу респондентов; однако, не считая первого – по соображениям, не слишком связанным с погрешностью.

[3] При «дефолтной» доверительной вероятности в 95%, конечно. Об этом мы еще напишем подробнее.

Задать вопрос Посмотреть другие вопросы