Настал черед стажа.
Идея крайне простая: кто чаще готовы рекомендовать компанию: новички, ветераны или связь не линейна, а хитро закручена?
* я взял в анализ только тех респондентов, кто на момент заполнения анкеты работал в компании. Т.е. речь только про работающих.
Стаж как числовая переменная
На этой диаграмме (если вы не умеете читать диаграмму boxplot, вам сюда Как читать диаграмму boxplot (ящик с усами))
- Ось X — стаж работы в месяцах;
- Ось Y — ответ респондента на вопрос, готовы ли рекомендовать компанию
Заметно, что медиана стажа тех, кто готов рекомендовать компанию, будет повыше, чем тех, кто не готов. Ну и вроде бы это логично. Работает, значит, лоялен.
Но
Kruskal-Wallis rank sum test
data: q$stag by q$ref
Kruskal-Wallis chi-squared = 2.4175, df = 1, p-value = 0.12
Различия не значимы! А значит, готовность рекомендовать компанию в такой постановке вопроса не зависит от стажа.
Страты
А теперь давайте посмотрим другую логику. Я разбиваю стаж на страты.
- До трех месяцев;
- От трех до полугода;
- От полугода до года;
- От года до двух;
- От 2 до 3 лет;
- От трех до 5 лет;
- Более 5 лет.
Надеюсь, вы не будете возражать против такой разбивки на страты.
Каждый столбец нормированной диаграммы обозначает промежуток по стажу и процентное соотношение готовых и не готовых рекомендовать.
Пик лояльности — более пяти лет и до трех месяцев. Одних уже никуда не возьмут, другие еще на что-то надеются (шютка юмора, если чё);
Пик антилояльности — от полугода до двух лет — карьерные амбиции, надежды реализоваться….
И Pearson’s Chi-squared test
data: t
X-squared = 16.041, df = 5, p-value = 0.006728
Это значит, что различия значимы!
Почему критерии показали разные результаты?
Почему критерий Крускал Уолисс показал незначимость результатов, а в случае Хи квадрат различия значимы?
Это вам вопрос.
Скажу только, что математикой здесь все в порядке, никаких ошибок, все очень логично. Дело в самих данных.
Источник : edwvb.blogspot.com