Jump to content

튜닝 문의


Asher

Recommended Posts

안녕하세요 관리자 님,

유익한 정보 감사합니다!

한 가지 의문점이 있어서 여쭙고 싶습니다.

유행어나 짧게 줄인 단어들을 input 으로 받으면 output 으로 해당 단어들의 의미를 출력하게 하고 싶어서 데이터확장을 통해 데이터셋을 생성해봤습니다.

제가 수동으로 입력한 데이터 50여가지를 넣고 확장을 통해 400개를 채우고 나서 확인해보니 데이터셋이 나쁘지 않았습니다. (데이터셋내에 text부분은 줄임말, 유행어를 넣었고 completion 에는 의미나 풀이를 작성했습니다.)

 

데이터셋의 튜닝을 마치고 인퍼런스 테스트에서 테스트를 해봤는데요, 결괏값을 보니 어느 웹사이트에서 사람들이 댓글로 남겼던 내용을 긁어와서 출력했더라구요.

예를 들어, "존맛탱" 이 input 일때 output 은 존맛탱이 언급됐거나 관련이 있는 댓글 3~4개를 출력됐었습니다. 다른 단어를 입력해봐도 같은 방식입니다.

해당 단어에 대한 단어 풀이나 뜻을 제시해 주길 바랐는데.. 의아하네요. 혹시 이런 현상에 대해 설명해주실 수 있으실까요?!

 

 

링크 복사
다른 사이트에 공유하기

  • 2 weeks later...

게시글 및 댓글을 작성하려면 로그인 해주세요.



로그인
×
×
  • Create New...