Skip to content

Gabrieljoseg/human-resources-analytics

Repository files navigation

Human Resources Analytics

[OBJETIVO DO PROJETO]

  • INTRODUÇÃO BREVE.
  • PROBLEMA DE NEGÓCIO.
  • IMPACTO.
  • MÉTRICAS DE RESULTADO.

Neste projeto, cobrindo todas as etapas de um focado em Data Science, pude resolver o problema de como utilizar dados para responder a questões importantes, permitindo que uma empresa tenha conhecimento sobre:

  • Os fatores que influenciam para um colaborador deixar a empresa.
  • Como reter pessoas?
  • Como antecipar e saber se um determinado colaborador vai sair da empresa?

Por fim, disponibilizei recursos para que a empresa consiguisse realizar a predição para verificar se um colaborador vai ou não deixar a empresa com base em atributos como comportamento e carga de trabalho, nível de satisfação com a empresa e resultados de performance.

[SOLUÇÃO PROPOSTA]

  • TECNOLOGIAS.
  • ARQUITETURA.
  • FRAMEWORKS.
  • DESAFIOS TÉCNICOS.
  • SOLUÇÕES ESCOLHIDAS.

Para resolver esse problema foi construído uma solução completa para armazenamento, gestão e automatização de fluxos de dados utilizando tecnologias como Apache Airflow, Docker e Minio além de explorar uma suíte poderosa de tecnologias para trabalhar com Análise de Dados e Machine Learning que são: Pandas, Scikit-learn, Pycaret, SweetViz, Streamlit.

Depois da infraestrutura devidamente criada e configurada, levando em consideração o desafio proposto foram criados e modelados atributos relevantes para análise utilizando fontes de dados diversas como arquivos em formato xlsx, json e dados no Sistemas de Gerenciamento de Banco de Dados MySQL.

[RESULTADOS]

  • INSIGHTS E CONHECIMENTO GERADO.
  • PROBLEMAS RESOLVIDOS.
  • MÉTRICAS DE PERFORMANCE.

Na etapa de Análise Exploratória de Dados foram descobertos os vários insights importantes abaixo:

A empresa tem uma rotatividade de 24%.Podemos assumir que os empregados que mais deixam a empresa estão menos satisfeitos.Existe um valor considerável de empregados insatisfeitos. A maioria dos empregados que saíram tinha salário baixo ou médio.

Os departamentos de vendas, técnico e suporte são top 3 departamentos com maior índice de turnover.

1 - Todos os empregados que estavam inseridos sem muitos projetos deixaram a empresa.

2 - Colaboradores com baixa performance tendem a deixar a empresa.

3 - Colaboradores insatisfeitos com a empresa têm uma maior tendência para evadir.

Através da análise foi possível desenvolver 3 grupos distintos para agrupar colaboradores que deixaram a empresa por comportamentos similares que são:

  • Grupo 1 (Empregados insatisfeitos e trabalhadores): A satisfação foi inferior a 20 e as avaliações foram superiores a 75.Que corresponde ao grupo de funcionários que deixaram a empresa e eram bons trabalhadores, mas se sentiam péssimos no trabalho.

  • Grupo 2 (Empregados ruins e insatisfeitos): Satisfação entre 35 à 50 e as suas avaliações abaixo de ~ 58. Corresponde aos empregados que foram mal avaliados e se sentiram mal no trabalho.

  • Grupo 3 (Empregados satisfeitos e trabalhadores):Representa os empregados ideais, que gostam do seu trabalho e são bem avaliados por seu desempenho.

Este grupo pode indicar os empregados que deixaram a empresa porque encontraram outra oportunidade de trabalho. Para a estimativa com o objetivo de predizer se um empregado vai deixar a empresa foi implementado um modelo utilizando o algoritmo Gradient Boosting Classifier que atingiu uma performance de AUC em 0.80.

[CONCLUSÃO]

  • RESUMO FINAL DO PROJETO.
  • BENEFÍCIOS ALCANÇADOS.
  • POSSÍVEIS MELHORIAS.

Através desse projeto foi possível praticar e implementar conceitos importantes da Ciência e Engenharia de Dados e propor uma solução para um problema latente e recorrente de qualquer empresa que é a retenção de talentos através da Análise de Dados de Recursos Humanos.

Como um processo de melhoria contínua podemos desenvolver uma automação para executar não só o pipeline de coleta e transformação de dados como automatizar os passo da etapa de Machine Learning e Deploy.