clovaGood Posted November 15, 2023 공유하기 Posted November 15, 2023 안녕하세요. 제가 클로바 스튜디오를 처음 사용해보는데 테스트용으로 학습을 하기위해 첨부한 이미지와 같이 데이터셋을 만들었습니다. 총 80건 정도의 데이터가 적혀있는데 이렇게 데이터셋을 만들어서 학습을 완료하였습니다. 하지만 Text에 적혀있는 "오종욱님의 남은 연차를 알려주세요" 라고 하면 Output이 전혀 이상한 대답이 오는데 혹시 데이터셋을 잘못만든것일까요? 감사합니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
CLOVA Studio 운영자1 Posted November 17, 2023 공유하기 Posted November 17, 2023 안녕하세요, @clovaGood님, LLM 특성 상 hallucination 현상을 튜닝 학습으로 완벽하게 제어하기는 어렵습니다. 질의 응답 시에 좀 더 정확한 답변을 하도록 할 경우, chat completions API로 인퍼런스 시 지시문 활용을 권장드립니다. - 클로바 스튜디오가 수행할 구체적인 지시문을 인퍼런스 요청 시 포함할 수 있습니다. - API 가이드 : https://api.ncloud-docs.com/docs/clovastudio-posttaskchatcompletions > messages[].role.system - 지시문 포함 필요 내용 : 입력된 내용에 대해서 정확하게 답변 하라는 지시문과, 실제 답변해야하는 정보 (ex. 대상자, 1. 발생연차) - messages[].role.system 값에 포함 가능한 글자 수는 messages에서 입력한 토큰 수와 maxTokens에서 입력한 토큰 수의 합은 4096 토큰을 초과할 수 없는 범위 내에서 입력 가능합니다. messages에서 입력한 토큰 수는 Chat Completions 토큰 계산 API를 호출하여 확인할 수 있습니다. (https://clovastudio.ncloud.com/explorer/tools/chat-tokenizer) 감사합니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
Recommended Posts
게시글 및 댓글을 작성하려면 로그인 해주세요.
로그인