Skip to content

koohack/kpmg_boosting

 
 

Repository files navigation

🚀 Boosting - 자연어 모델을 활용한 HR Analytics

팀 Boosting은 자연어 모델을 활용해, 기업의 HR Analytics를 돕는 서비스를 제시합니다.

Background

인사(HR) 업무는 특정 산업군에 한정되지 않고, 모든 기업에 적용되는 업무입니다. 전통적인 인사 관리의 경우, 인사권자의 재량과 직관, 경험에 의존적이라는 한계가 존재했습니다. 이와 더불어, 최근 채용 트렌드가 수시채용으로 옮겨가면서, 채용 과정에서 시간과 비용을 절감시킬 수 있는 HR 서비스의 수요가 급증하고 있습니다.

텍스트 형태의 인사 관련 정성적 데이터를 활용해, 기업이 기존의 정량적 분석으로는 답할 수 없었던 채용/평가 관련 문제를 해결할 수 있도록 자연어 모델을 활용하고자 합니다.

Features

채용 - 문단별 요약

🔗 Directory

BART를 활용한 텍스트 요약으로, 지원서 원문을 이해하기 쉽고 가치 있는 정보로 변환합니다. 지원서의 핵심 부분을 요약하여 제시한다면 기업은 빠르게 원하는 역량을 갖춘 인재를 찾을 수 있습니다.

채용 - 키워드 추출

🔗 Directory

KeyBERTMax Sum Similarity, Maximal Marginal Relevance 알고리즘을 활용해, 지원자의 다양한 핵심 역량을 명확히 나타내는 키워드를 추출합니다. 원문에 비해 매우 짧은 단어들만 보고도, 인사 담당자는 지원자에 대한 핵심 정보를 빠르게 인지할 수 있습니다.

채용 - 지원자 군집화

🔗 Directory

BERT를 활용해 지원서 임베딩을 도출하고, FAISS의 MIPS 알고리즘을 통해 유사한 지원자를 군집화합니다.

채용 - 개인정보 비식별화

🔗 Directory

BERT를 활용한 span classification을 통해, 평가에 영향을 줄 수 있는 개인정보 및 블라인드 항목을 마스킹합니다.

채용 - 개체명 인식

🔗 Directory

BERT를 활용한 개체명 인식을 통해, 지원서의 답변 일부가 어떠한 Job Description에서 제시하는 항목에 관련되었는지 판별합니다. 긴 글을 읽지 않고도 분류 결과를 통해 지원자가 어떠한 역량을 서술하고 있는지, 기업이 원하는 항목을 기반으로 확인할 수 있습니다.

채용 - 텍스트 회귀

🔗 Directory

BERT를 활용해, 지원서 질문 및 직군 정보를 바탕으로 지원서가 얼마나 관련 역량을 잘 서술하고 있는지를 수치화합니다.

평가 - 감성 분석

🔗 Directory

BERT를 활용하여 긍/부정과 감사, 분노 등 동료 평가 텍스트에 담긴 주요 감정을 제시합니다. 무분별한 비난을 담은 평가가 오가지 않고, 동료 평가가 발전과 피드백의 역할을 수행할 수 있도록 합니다.

평가 - 순화

🔗 Directory

BART를 활용해 비꼬거나 혐오 표현을 담은 동료 평가 텍스트를 순화합니다.

Demo

Demo_1 Demo_2 Demo_3

Members

김한성 김현수 박승현 설유민 최동민
군집화
문서 요약
감성분석
프로젝트 기획
순화
자연어 추론
프로토타입 개발
개체명 분석
텍스트 회귀
키워드 추출
프로젝트 기획

About

2023_kpmg_Ideathon

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 63.5%
  • Python 19.6%
  • JavaScript 16.5%
  • Other 0.4%