Суть вкратце: я исходил из версии, что переработки отрицательно влияют на текучесть, т.е. увеличивают текучесть.
Однако анализ показал другое.
Систематические переработки снижают риск увольнения в 2,6 раза в сравнении с теми, кто не перерабатывает в компании.
Если же работник имел переработки в первый месяц работы, то риск увольнения в сравнении с теми, кто не имел переработок в первый месяц снижается в 1, 34 раза.
Давайте посмотрим на график
По оси X — стаж работы в месяцах. ось Y — процент сотрудников, оставшихся работать в компании на том или ином месяце стажа. Синей линией показана динамика тех, кто перерабтывал в первый месяц работы в компании, пунктирной — кто не перерабатывал.
Т.е. например, через полгода работы в компании осталось чуть более 50 % тех, кто не перерабатывал и примерно две трети (66 %) тех, кто переработал в первый месяц работы в компании.
Я думаю, есть повод для разговора с Заказчиком, правда?
Есть несколько версий:
- Если переработки назначаются случайным образом, то получается, что люди получили дополнительные деньги и их это вдохновило на дальнейшую работу;
- Если переработки не случайны, т.е. работники сами напрашиваются, то по тому, кто накинулся на переработки в первый месяц работы, можно прогнозировать стаж человека в компании (хотя версия вызывает сомнения, поскольку переработки возникают не по желанию администрации (ну нет смысла ей переплачивать);
- Совсем коварный вариант: приписывают переработки своим людям.
- Мотивация: допустим, что на мотивированных переработки влияют позитивно (они оплачиваются вдвойне), а на не мотивированных они сказываются негативно. У Наследова в книге «Математические методы психологического исследования» приводится классный пример двухфакторного дисперсионного анализа, когда разные уровни измерения двух номинативных переменных оказывают разное влияние на метрическую переменную.
Проверка мотивационной версии
В идеале процедура должна была выглядеть примерно так: мы измеряем мотивацию работников и оцифровываем: 1 — мотивированный, 0 — не мотивированный. Кроме того, у нас есть переработки: 1 — есть переработки на первом месяце работы в компании, 0 — нет переработок в компании на первом месяце. Почему я беру переработки на первом месяце? С тем, чтобы избежать получения корреляции вместо причинности. Т.е. вполне возможно, что тех, кто работает дольше нагружают больше. И в этом смысле переработки могу являться следствием, а не причиной более длительного стажа. Поэтому я исхожу из указания Заказчика, что в первый месяц переработки достаются случайным образом. И дальше возможна такая ситуация:
- мотивированные воспринимают переработки как возможность дополнительного заработка, т.е. со знаком плюс;
- немотивированные — как дополнительную нагрузку или со знаком минус.
И для первых тогда коэффициент регрессии должен быть положительным, а для вторых — отрицательным — снижающим срок жизни в компании.У нас нет возможности вычислить мотивированных и не мотивированных, поэтому я придумал простой ход. Он спорный, но за неимением лучшего смотрите.Я, как указывал ранее, брал только тех, кто устроился на работу в 2014 году. Те, кто за это время не уволился, можно считать мотивированными, а тех, кто успел устроиться на работу и уволиться же — немотивированными. (Условно говоря!!!)
Далее я беру только «немотивированных», т.е. только тех, кто устроился и уволился в 2014 году. Если моя гипотеза верна, то переработка в первый месяц будет в уравнении регрессии со знаком минус или снижать срок работы в компанииНам надо построить уравнение регрессии для двух переменных: 1) стаж и 2) наличие / отсутствие переработок в первый месяц работы в компанииЛинейная регрессия в данном случае нам не очень подходит для стажа, поскольку стаж носит не нормальное распределениеСм. распределение стажа принятых и уволенных работников в 2014 году.
По оси X — время работы в компании в днях.Данные Min. 1st Qu. Median Mean 3rd Qu. Max. 34.0 62.0 89.0 104.7 136.0 285.0 И здесь замечу, что я брал только тех, кто отработал не менее 30 дней в компании, чтобы наличие / отсутствие переработок искажалось тем фактом, что человек уволился до того, как успел дожить до этих переработок.Чтобы построить линейную регрессию, логарифмируем стаж и получаем вот такое распределение.
Min. 1st Qu. Median Mean 3rd Qu. Max. 3.526 4.127 4.489 4.527 4.913 5.652 Считаем регрессию для логарифмированной переменной стажаCoefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 4.47380 0.03267 136.959 < 2e-16 ***n 0.17249 0.05878 2.935 0.00358 ** —Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ‘ 1
Residual standard error: 0.4911 on 325 degrees of freedomMultiple R-squared: 0.02582, Adjusted R-squared: 0.02282 F-statistic: 8.613 on 1 and 325 DF, p-value: 0.003576
R^2 как то совсем скромный, но коэффициент значим на уровне 0.00358 и, главное, он положителен.И это не опровергает гипотезу про немотивированных, но ставит ее под большое сомнение.
В качестве интересного дополнения давайте сравним показатели регрессии, если мы не будем логарифмировать стажCoefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 99.155 3.551 27.921 < 2e-16 ***n 18.013 6.390 2.819 0.00511 ** —Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ‘ 1
Residual standard error: 53.39 on 325 degrees of freedomMultiple R-squared: 0.02387, Adjusted R-squared: 0.02087 F-statistic: 7.947 on 1 and 325 DF, p-value: 0.005111
Мы видим, что коэффициент также значим, а разница в коэффициенте несущественная. Зато смысл коэффициента становится осязаемым: наличие переработок в первый месяц работы в компании добавляет от 6 до 30 дней работы в компании (с учетом 95 % интервала).
Источник : edwvb.blogspot.com