Анализ корзины компенсационного пакета

Анализ корзины — анализ предпочтений потребителей, когда у нас нет данных о самих покупателях, а есть только данные чеков — какие покупки в одном чеке были куплены. Мы смотрим, что с чем чаще покупают. Бизнес польза — ассоциативные правила: зная, что вместе с товарами A и B покупают товар C, мы можем выкладывать их в нужной последовательности или делать соответствующие акции в магазинах.
Набор компенсационного пакета в нашем исследовании лучше всего подходит под данную задачу: в данным вопросе респонденты выбирают набор компенсаций и льгот, которые предоставляет им компания. Данные представлены в таком виде:
1 ДМС, мобильная связь, проезд в транспорте
2
3 корпоративное питание, ДМС, абонемент в фитнес…
4 мобильная связь
5 льготные кредиты, другое
В нашем случае речь идет не о предпочтениях респондента, а о предпочтениях компании — это она выбирает те или иные опции компенсационного пакета.
Счетчик опций компенсационного пакета выглядит так

Я не рекомендую смотреть на этот счетчик опций компенсационного пакета как на бенчмарк опций: мобильная связь на первом месте, скорее всего, по причине того, что в исследовании половина респондентов это HR-ы, рекрутеры, мобильная свзь для которых — рабочий инструмент, а не компенсационный пакет как таковой.
Компенсационный пакет может даваться разным количеством опций

Самое популярное число опций компенсационного пакета — одна. Удивительно, но есть компании, предоставляющие своим сотрудникам сразу семь опций компенсационного пакета — есть таких 10 компаний.
Самые популярные сочетания компенсационного пакета — связь и ДМС — 617 раз эти опции идут вместе (и это очевидно).
С корзиной все тоже достаточно очевидно. Работает правило:если в компании есть ДМС и связь, то следующей опцией с бОльшей вероятностью будет обучение.
Но здесь очень важный момент: дело не в том, что обучение чаще всего выбирают. Тогда бы, например, в книжных интернет магазинах работало бы простое правило: всем рекомендовать бест селлеры, которые продаются со всем, что продается.
Правило «обучение» подается вместе с «мобильная связь» + «ДМС» формируется так:
- обща частота выбора опции компенсационного пакета — 0, 29 или у 29 % респондентов эта опция указана (я убрал строки, де опции компенсационного пакета не указаны вообще, т.е. 29 % среди тех, кто указал хоть одну опцию компенсационного пакета);
- а в компании с «мобильная связь» + «ДМС» опция «обучение» встречается в 36 % случаев, т.е. в 1, 24 раза чаще, чем просто в целом в выборке.
- Вот этот показатель — 1, 24 (lift по терминологии анализа корзины) говорит нам про сочетаемость товаров.
1, 24 для реальных ситуаций откровенно слабый показатель, в учебном примере я видел показатель 255 — когда товар C встречается в 255 раз чаще в сочетании с товарами A и B, чем в целом по выборке товаров. Но у нас всего 9 «товаров» — опции компенсационного пакета.
Буду вам благодарен, если подскажете идею, как соединить анализ корзины и профиля респондента (сфера деятельности, отрасль, регион, размер зарплаты и т.п.), буду благодарен.
Источник : edwvb.blogspot.com