Почему в A/B сравнивают средние, а не «общие» метрики?
Практически каждый, кто впервые проводит A/B, интуитивно тянется к «общим» метрикам: общая выручка, количество платящих, число установок. И бизнес тоже любит «итоги в деньгах/штуках».
Но на практике в экспериментах почти всегда сравниваются «средние»: ARPU, доля платящих, конверсии. Почему так?
1. Сумма становится «шумнее», среднее – стабильнее
Дисперсия суммы независимых одинаково распределенных случайных величин растёт с размером выборки: nσ^2. А для среднего – дисперсия падает: (σ^2) / n.
Т. е. чем больше данных, тем «шумнее» становится сумма (общая метрика, в абсолютном выражении), и тем хуже она подходит для сравнения между группами.
А среднее наоборот становится все стабильнее и лучше подходит для выявления даже небольших эффектов.
2. «Общие» метрики ломаются о разный размер групп
Сумма будет честной для сравнения только в редком частном случае: когда размеры групп строго равны. Тогда «деление на n» сокращается.
В реальных же экспериментах группы A и B почти никогда не совпадают по размеру идеально. Если сравнивать общие значения, то большая группа чаще «победит» просто потому, что в ней больше наблюдений.
Средние метрики нормализуют размер: мы сравниваем что происходит на пользователя, а не сколько пользователей попало в группу.
3. Статистические тесты заточены на средние
Большинство привычных стат. тестов нацелены именно на сравнение средних (долей, отношений, квантилей и т. д.).
А общая метрика по сути – это среднее × количество наблюдений. Поэтому если хочется понять влияние, например, на общую выручку – обычно достаточно проверить значимость изменения ARPU, а потом перевести это в деньги.
Что тогда делать на практике?
✅ Тестируйте среднюю метрику (долю, отношение); ✅ Общую метрику показывайте как перенос эффекта на деньги/штуки.
Например:
Так вы сохраняете корректность статистики, сравнимость групп и понятность языка для бизнеса.
A/B-тесты
Хочешь глубже разобраться в аналитике?
Посмотри программу курса по продуктовой аналитике и экспериментам.