Вот такую идею я сегодня хочу проверить. Сразу извиняюьс на кучу грамматических и стилистических ошибок — время полночь, сил нет, делаю запись набегу.
Часто работодатель, чтобы удержать работника, увеличивает ему зарплату. И, соответственно, чем больше стаж ценных сотрудников, тем больше зарплата.
Если визуализировать графически, то у ценных сотрудников линия тренда более круто завернута кверху.
И вот тут у меня возникла мысль проверить, кто более ценный для работодателя: мужчины или женщины. Конечно, я как всякая порядочная мужская сволочь ставил на мужиков, как на ценных работников.
Дальше тем, кто ничего не понимает в статистике советую сначала пройти наш опрос Исследование времени поиска работы, а потом перейти в самый даун поста — прочитать выводы
Данные взяты по 315 респондентам женщинам и 139 мужчинам.
Респонденты указывали дату приема на работу, дату увольнения, зарплату на момент увольнения
теперь к аналитикам обращаюсь: скажите, где может быть засада (понятно, что отрасль влияет — женская или мужская, но сейчас я пока не могу это проверить, позже).
Во — первых очистил от влияния фактора даты увольнения — среди мужчин и женщин этот показатель не значим (ну т.е. респонденты заполняли данные о себе по разным годам своей работы, а зарплата зависит среди прочего также от года работы, т.е. те, кто заполнял про 2012 получал в среднем меньше, чем тот, кто заполнял анкету за 2014 — и я посчитал, что для М и Ж этот фактор различается незначимо, поэтому мы можем им пренебречь..
Теперь показатель стажа
group: Ж
vars n mean sd median trimmed mad min max range skew kurtosis se
1 1 315 35.07 39.82 21.01 27.62 21.11 0.13 314.27 314.14 2.62 10.28 2.24
———————————————————————————
group: М
vars n mean sd median trimmed mad min max range skew kurtosis se
1 1 139 35.16 37.48 22.98 27.89 20.76 2.04 222.54 220.5 2.18 5.65 3.18
Эти данные указаны в месяцах стажа, Манн Уитни показывает значимость 0, 64.
ну и картинка. Я обрезал картинку 120 месяцами стажа. Из картинки видно, что различия не значимы.
Зарплата
group: Ж
vars n mean sd median trimmed mad min max range skew kurtosis se
1 1 315 73.89 59.6 55 63.89 44.48 5 350 345 1.88 4.48 3.36
———————————————————————————
group: М
vars n mean sd median trimmed mad min max range skew kurtosis se
1 1 139 118.78 83.27 100 107.52 74.13 15 350 335 1.19 0.89 7.06
И здесь невооруженным глазом видно, что мужики честно получают больше: медиана — 100 000 рублей для М, 55 000 для Ж.
Картинка (можно кликнуть для увеличения)
Дальше мы логарифмируем стаж и зарплату и получаем вот такую картинку
Содержательно мы здесь мало что поймем, видимо — это логарифмы
А вот дальше самое смешное
Уравнение регрессии для мужиков (данные логарифмированы)
lm(formula = зп ~ стаж, data = qm)
Residuals:
Min 1Q Median 3Q Max
-1.81412 -0.44130 0.04517 0.45896 1.51052
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.8533 0.4065 26.700 2e-16
стаж 0.0893 0.0619 1.443 0.151
—
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7492 on 137 degrees of freedom
Multiple R-squared: 0.01497, Adjusted R-squared: 0.007776
F-statistic: 2.082 on 1 and 137 DF, p-value: 0.1514
И для женщин
Call:
lm(formula = зп ~ стаж, data = qf)
Residuals:
Min 1Q Median 3Q Max
-2.13750 -0.56650 -0.00783 0.52336 1.83034
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.9987 0.2417 41.367 2e-16 ***
стаж 0.1454 0.0371 3.919 0.000109 ***
—
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7393 on 312 degrees of freedom
Multiple R-squared: 0.04692, Adjusted R-squared: 0.04387
F-statistic: 15.36 on 1 and 312 DF, p-value: 0.0001092
Смешно, правда? на 1 % прироста стажа зарплата женщин при растает на 0, 14 %, если я правильно помню интерпретацию логарифмированных переменных.
Интерпретация
Дам физически понятную картинку
Картинка, конечно, не корректная, но по ней видно, что женщины в перспективе 20 лет стажа не догоняют мужиков по зарплате.
Уровень оплаты мужчин на момент увольнения не зависит от проработанного стажа, у женщин такая связь есть: с возрастанием стажа зарплата на дату увольнения растет.
Сложно сказать, кого больше ценит работодатель, но результаты получились интересные.
Источник : edwvb.blogspot.com