[feat] text similarity 추가 및 LLM 서버 API 연결, MySQL Full text Index 추가 #39

Hoya324 · 2024-07-15T15:58:50Z

혼자 작업하다보니.. branch 생명주기가 너무 길다.. 작업량도 너무 많이 넣었다. 반성..

Elasticsearch를 사용하는 것이 나을지 MySQL의 Full Text Index를 사용하는 것이 나을지 고민했습니다.
프로젝트 | 텍스트 유사도 검색 어떻게 구현할까?(1) - Elasticsearch를 안 쓴 이유와 MySQL Full Text Index 해당 블로그는 이에 대해 고민한 내용을 정리한 문서입니다.
어떤 방식으로 한글 문장의 유사도를 측정해야할지 고민했고, Cosine Similarity와 TF-IDF를 어떤 방식으로 적용할지 고민했스빈다.
프로젝트 | 텍스트 유사도 검색 어떻게 구현할까?(2) - Cosine Similarity과 TF-IDF 해당 블로그는 이에 대해 고민한 내용을 정리한 문서입니다.

고민했던 내용을 실제로 적용했습니다.

✅ 작업 내용

텍스트 유사도 로직을 질문간의 유사도를 확인하는데 적용했습니다.
질문의 토큰(문장 어구 분리(명사만))을 분리합니다.
해당 토큰으로 MySQL에서 Full Text Index Search를 진행합니다.
가져와진 질문이 없는경우 바로 LLM서버에 질문을 요청합니다.
질문이 있는 경우에는, 해당 질문들과 들어온 질문의 유사도를 검사하고, 0.95를 넘는 경우 가장 유사도가 높은 질문의 대답을 응답합니다.
위의 조건을 만족하는 질문이 없는 경우엔 LLM서버에 질문을 요청합니다.
위의 작업을 위해
MySQL Full Text Search - QueryDSL을 적용했습니다
LLM 서버와의 통신 - WebClient 적용
WebClient를 mocking하여 Test하기 위해 MockServer를 도입했습니다.
QuestionService 각 조건에 따른 Test를 분기하여 작업했습니다.

🤔 고민 했던 부분

처음 질문이 들어왔을 때 처음부터 질문의 토큰을 뽑아서 MySQL의 원본 질문과 비교할지 토큰과 비교할지 고민했으나 DB에서는 조금더 넓은 범위로 검색하고, 유사도검사에서는 토큰간의 비교를 통해 유사도가 0.95가 넘는 가장 유사도가 높은 질문을 가져오도록 했습니다.

Hoya324 added 29 commits July 15, 2024 17:32

test: TextSimilarityUtilsTest 검사 단어 수정

e296a9a

test: QuestionService Test 추가

ec27697

test: AnswerServiceTest Test 추가

88d245b

chore: application.yml 수정

63b369f

chore: application-test.yml 수정

2b5c0a0

chore: build.gradle 의존성 추가

51334d3

chore: mySQL full text index를 위한 설정

aa8932e

feat: WebClientConfig 설정

98714a2

rename: 폴더 구조 변경

b3c66d9

feat: LLM 서버 api 연결

1d47d16

feat: LLM request, response dto

a7d04e0

refactor: 질문 유사도 검사 로직 추가

f41de52

feat: QueryDSL full text search 메서드 추가

96e1242

refactor: toString 추가

dce6578

feat: question id, content를 담은 핵심 dto

cc22310

refactor: question request dto validation

1020936

refactor: swagger 예시 object 수정

8242920

refactor: toString 추가

b6c6bc3

refactor: question column 추가 및 jpa 설정

e320af5

refactor: question view count increase 메서드 추가

dd32e8a

refactor: BaseEntity column 수정

ed2bff8

refactor: questionService method 명 변경

a5cb442

refactor: 에러코드 추가

57c965d

refactor: JPA Auditing 기능 사용

7830cb3

test: IntegrationTest에 Config 파일 의존성 추가

502b469

test: RepositoryTest Config 파일 의존성 추가

8c9c4de

test: Config 파일 의존성 추가

35721c3

test: AnswerRepositoryTest Question column 추가 수정

9ee7f86

test: QuestionControllerTest Question column 추가 수정

2203153

Hoya324 self-assigned this Jul 15, 2024

Hoya324 added the enhancement label Jul 15, 2024

Hoya324 merged commit 777ffd6 into develop Jul 15, 2024

Hoya324 deleted the feat/text-similarity branch July 15, 2024 15:59

Hoya324 added 📄문서화 블로그에 정리한 pr입니다. 💡새로운 시도 새로운 시도를 기록한 pr입니다. labels Jul 20, 2024

Hoya324 added this to the SW 경진대회 AI 부분 milestone Aug 5, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[feat] text similarity 추가 및 LLM 서버 API 연결, MySQL Full text Index 추가 #39

[feat] text similarity 추가 및 LLM 서버 API 연결, MySQL Full text Index 추가 #39

Hoya324 commented Jul 15, 2024 •

edited

Loading

[feat] text similarity 추가 및 LLM 서버 API 연결, MySQL Full text Index 추가 #39

[feat] text similarity 추가 및 LLM 서버 API 연결, MySQL Full text Index 추가 #39

Conversation

Hoya324 commented Jul 15, 2024 • edited Loading

✅ 작업 내용

🤔 고민 했던 부분

Hoya324 commented Jul 15, 2024 •

edited

Loading