Опции компенсационного пакета были такие (сначала как в опросе, а рядом — сокращение до одного слова):

  1. корпоративное питание — питание
  2. ДМС — ДМС
  3. мобильная связь — связь
  4. проезд в транспорте — транспорт
  5. льготные путевки в санатории (для детей в т.ч.) — санатории
  6. абонемент в фитнес-центры (бассейны, спортзалы) — фитнес
  7. льготные кредиты — кредиты
  8. обучение за счет компании — обучение
  9. другое — другое

Вопрос с множественным выбором, т.е. респонденты могли выбирать несколько опций.
Идея поста простая: найти связь между зарплатой респондентов и компенсационным  пакетом. Поскольку мы не знаем размер компенсационного пакета в рублях, то связь зарплаты могли проверить только с:

  1. качеством или наполнением компенсационного пакета (буквально — какие опции входят в компенсационный пакет);
  2. количеством опций компенсационного пакета.

Начну со второго, чтоб сразу показать размер выборки.

Всего выборка состоит 2 037 респондента, на диаграмме выше частота встречаемости опций компенсационного пакета. В сумме опции дают более 2 037, поскольку вопрос с множественным выбором. Только опция «ничего» обозначает, что респондент не указал ничего. Я бы не рекомендовал смотреть на эту диаграмму как на некий бенчмарк компенсационного пакета, поскольку наша выборка явно смещенная (почти 50 % респондентов — HR-ы), поэтому я не беру на себя ответственность говорить за весь рынок.
На диаграмме ниже — частота опций компенсационного пакета.

Почти 500, а точнее 493 респондента не указали опций компенсационного пакета, мы это принимаем как отсутствие компенсационного пакета. Самый популярный вариант — одна опция.
Здесь нас ждет разочарование: на тренировочном сете R^2 показал 0, 019, а на тест сете — 0, 000.

Качество и наполнение компенсационного пакета

Здесь более интересная картинка. Хотя метод анализа может быть оспорен, но зато он оригинален. Хотя у нас вопрос был вопрос с множественным выбором, я ответы принял как текст. И анализировал как текст, провел анализ тональности текста, где управляемой переменной была зарплата, а зависимая переменная — компенсационный пакет как текст.
В этом месте скажу (этот кусок для профи), что стоит еще попробовать кластерный анализ, чтобы понять, как группируются опции компенсационного пакета. И я уже делал аналогичный анализ Пакетное управление компенсационным пакетом (какие опции компенсационного пакета надо совмещать), где я показал связь между кластерами (пакетами компенсационного пакета) и текучестью персонала. Можно было бы поступить также, но у меня родилась идея, что би граммы, три граммы и т.п. по сути и есть сочетания опций компенсационного пакета.
Давайте посмотрим, что получилось.

  • По X — прогнозные значения зарплаты;
  • Y — фактические значения

Диаграмма по тест сету, R^2 = 0, 07. Я использовал ридж регрессию, и можно было бы улучшить показатели, но меня в данном случае интересовало само наличие связи. Картинка убеждает, согласны?

Характер связи

Вам уже знакома такая форма представления результата.

На картинке выше сочетания опций компенсационного пакета , которые связаны с более высокой зарплатой. Одним цветом показаны сочетания, а размер шрифта — вес в зарплате. Т.е. ДМС и мобильная связь вместе показывают более высокую зарплату респондента. Далее 2) мобильная связь и транспорт, 3) корпоративное питание и ДМС и 4) ДМС и льготные кредиты

На этой картинке показаны опции, связанные с низкой зарплатой. На первом месте те, кто указал льготные путевки или фитнес. И что неприятно удивляет, ДМС и связь в разных сочетаниях дают негативную связь.
Но профи, наверное, уже поняли фишку: у нас независимая переменная смещенна: почти 45 % респондентов указали мобильную связь как опцию своего компенсационного пакета и 40 % — ДМС.
Но другой примечательный факт: отсутствие опций компенсационного пакета не связан с низкой зарплатой.
Готов услышать ваши соображения.
И готов данные спецам с тем, чтобы вы провели кластерный анализ.


Источник : edwvb.blogspot.com

Похожая запись