Jump to content

SiSAFER

Members
  • 게시글

    5
  • 첫 방문

  • 최근 방문

SiSAFER's Achievements

Newbie

Newbie (1/14)

  • Week One Done
  • First Post
  • Conversation Starter

Recent Badges

0

Reputation

  1. 안녕하세요. 아래와 같이 API 호출시에 대화 내용을 기억하고 이어서 대화의 흐름에 따라서 답변을 제공하는게 안되는 것 같아서 문의 드립니다. 어떻게 해야지 이전 대화 내용을 기억하고 흐름에 맞게 답변을 할 수 있나요?? curl --location --request POST 'https://clovastudio.stream.ntruss.com/testapp/v1/chat-completions/HCX-003' \ --header 'Authorization: Bearer {API Key}' \ --header 'X-NCP-CLOVASTUDIO-REQUEST-ID: {Request ID}' \ --header 'Content-Type: application/json' \ --header 'Accept: text/event-stream' \ --data '{ "topK" : 0, "includeAiFilters" : true, "maxTokens" : 256, "temperature" : 0.5, "messages" : [ { "role" : "system", "content" : "test" }, { "role" : "user", "content" : "바나나" }, { "role" : "assistant", "content" : "바나나는 열대과일 중 하나로, 맛이 달콤하고 영양이 풍부한 과일입니다." }, { "role" : "user", "content" : "그러면 얼마야?" }, { "role" : "assistant", "content" : "바나나의 가격은 구매 장소, 브랜드, 중량 등에 따라 다를 수 있습니다." }, { "role" : "user", "content" : "어디서 살 수 있어?" }, { "role" : "assistant", "content" : "바나나는 다양한 장소에서 구매하실 수 있습니다." } ], "stopBefore" : [ ], "repeatPenalty" : 5.0, "topP" : 0.8 }'
  2. 튜닝의 경우 학습에 이용될 데이터를 참고하여 답변을 주는 형태입니다. 따라서 고객님께서 작성하신 답변을 참고하여 생성하여 output을 생성하기 때문에 원하는 형태로 output이 생성되지 않을 수 있습니다. 또한 튜닝 데이터셋 구성 시 데이터의 양보다는 질이 중요하다 라는 내용을 가이드하고 있습니다. https://guide.ncloud-docs.com/docs/clovastudio-instructiondataset 따라서, 가능한 다양하고 많은 데이터를 확보하여 튜닝을 진행해보시기 바랍니다. 라고 답변을 받았는데...흠....
  3. 가이드에 안내하고 있는 1,000~100,000행이 권장하고 있는 데이터 일 때, 140쌍의 데이터를 복사하여 1,000개를 만들어서 튜닝하였다면, 140쌍의 데이터로 이루어진 질문 답변에 대한 내용은 비슷하게 나와야하지 않나요? 제가 잘못알고 있을까요? 140쌍의 데이터로 1,000개를 만들어서 튜닝하고 테스트 해보니까, 140쌍을 넣었을때랑 크게 달라진 차이점을 못느끼겠습니다. 무엇보다 1,000쌍의 데이터를 처음 첨부했던 내용과 같은 예시로 하면 되는게 맞나요? 그럼 제가 의도한 대로 결과 값이 도출이 되어야 하는데... 전혀 다른 결과가 나오고 있어서 문제가 있습니다... 위와 같이 추가 질문 후 응답 대기중....
  4. 오답변의 경우, 데이터셋의 모수가 적을수록 잘못된 답변의 출력 비중이 높아집니다. 따라서, 데이터의 수를 좀 더 확보하실 필요가 있어 보입니다. 권장하고 있는 데이터셋 규격에 대해서는 아래 가이드를 참고해주십시오. https://guide.ncloud-docs.com/docs/clovastudio-instructiondataset 가이드에서 안내드리고 있듯, 1,000~100,000 행이 권장하고 있는 데이터입니다. 따라서 160개의 데이터로는 정확도가 많이 떨어지게 됩니다. 최소 1,000 쌍 이상의 데이터를 확보하여 튜닝 후 진행해보시기 바랍니다. 라고 답변을 받았습니다. 일단 해보고 문제 있을 시 다시 질문할께요.
  5. 안녕하세요. 아래와 같이 약 160개? 정도의 csv 파일로 API를 통하여 학습을 생성하였습니다. 생성 후에 플레이그라운드에서 테스트를 진행 하였습니다. 아래와 같이 테스트를 진행 하였습니다. 보시는 것과 같이 학습을 하고 이에 대한 기대한 결과값은 "현장사진은 등록자만 수정/삭제 가능합니다." 였는데, 전혀 다른 내용으로 답변이 나오고 있습니다. 무엇을 잘못하고 있는 것일까요?
×
×
  • Create New...