Опции компенсационного пакета были такие (сначала как в опросе, а рядом — сокращение до одного слова):
- корпоративное питание — питание
- ДМС — ДМС
- мобильная связь — связь
- проезд в транспорте — транспорт
- льготные путевки в санатории (для детей в т.ч.) — санатории
- абонемент в фитнес-центры (бассейны, спортзалы) — фитнес
- льготные кредиты — кредиты
- обучение за счет компании — обучение
- другое — другое
Вопрос с множественным выбором, т.е. респонденты могли выбирать несколько опций.
Идея поста простая: найти связь между зарплатой респондентов и компенсационным пакетом. Поскольку мы не знаем размер компенсационного пакета в рублях, то связь зарплаты могли проверить только с:
- качеством или наполнением компенсационного пакета (буквально — какие опции входят в компенсационный пакет);
- количеством опций компенсационного пакета.
Начну со второго, чтоб сразу показать размер выборки.
Всего выборка состоит 2 037 респондента, на диаграмме выше частота встречаемости опций компенсационного пакета. В сумме опции дают более 2 037, поскольку вопрос с множественным выбором. Только опция «ничего» обозначает, что респондент не указал ничего. Я бы не рекомендовал смотреть на эту диаграмму как на некий бенчмарк компенсационного пакета, поскольку наша выборка явно смещенная (почти 50 % респондентов — HR-ы), поэтому я не беру на себя ответственность говорить за весь рынок.
На диаграмме ниже — частота опций компенсационного пакета.
Почти 500, а точнее 493 респондента не указали опций компенсационного пакета, мы это принимаем как отсутствие компенсационного пакета. Самый популярный вариант — одна опция.
Здесь нас ждет разочарование: на тренировочном сете R^2 показал 0, 019, а на тест сете — 0, 000.
Качество и наполнение компенсационного пакета
Здесь более интересная картинка. Хотя метод анализа может быть оспорен, но зато он оригинален. Хотя у нас вопрос был вопрос с множественным выбором, я ответы принял как текст. И анализировал как текст, провел анализ тональности текста, где управляемой переменной была зарплата, а зависимая переменная — компенсационный пакет как текст.
В этом месте скажу (этот кусок для профи), что стоит еще попробовать кластерный анализ, чтобы понять, как группируются опции компенсационного пакета. И я уже делал аналогичный анализ Пакетное управление компенсационным пакетом (какие опции компенсационного пакета надо совмещать), где я показал связь между кластерами (пакетами компенсационного пакета) и текучестью персонала. Можно было бы поступить также, но у меня родилась идея, что би граммы, три граммы и т.п. по сути и есть сочетания опций компенсационного пакета.
Давайте посмотрим, что получилось.
- По X — прогнозные значения зарплаты;
- Y — фактические значения
Диаграмма по тест сету, R^2 = 0, 07. Я использовал ридж регрессию, и можно было бы улучшить показатели, но меня в данном случае интересовало само наличие связи. Картинка убеждает, согласны?
Характер связи
Вам уже знакома такая форма представления результата.
На картинке выше сочетания опций компенсационного пакета , которые связаны с более высокой зарплатой. Одним цветом показаны сочетания, а размер шрифта — вес в зарплате. Т.е. ДМС и мобильная связь вместе показывают более высокую зарплату респондента. Далее 2) мобильная связь и транспорт, 3) корпоративное питание и ДМС и 4) ДМС и льготные кредиты
На этой картинке показаны опции, связанные с низкой зарплатой. На первом месте те, кто указал льготные путевки или фитнес. И что неприятно удивляет, ДМС и связь в разных сочетаниях дают негативную связь.
Но профи, наверное, уже поняли фишку: у нас независимая переменная смещенна: почти 45 % респондентов указали мобильную связь как опцию своего компенсационного пакета и 40 % — ДМС.
Но другой примечательный факт: отсутствие опций компенсационного пакета не связан с низкой зарплатой.
Готов услышать ваши соображения.
И готов данные спецам с тем, чтобы вы провели кластерный анализ.
Источник : edwvb.blogspot.com