Jump to content

튜닝 API관련 예상 결과치 등 문의


Recommended Posts

안녕하세요.

아래와 같이 약 160개? 정도의 csv 파일로 API를 통하여 학습을 생성하였습니다.

image.png.de9e0b118c4de9530dba6e34fca08f17.png

 

생성 후에 플레이그라운드에서 테스트를 진행 하였습니다.

아래와 같이 테스트를 진행 하였습니다.

image.png.2553edb2b516882f29bfbd89b1e90483.png

 

 

보시는 것과 같이 학습을 하고 이에 대한 기대한 결과값은  "현장사진은 등록자만 수정/삭제 가능합니다." 였는데, 전혀 다른 내용으로 답변이 나오고 있습니다.

무엇을 잘못하고 있는 것일까요?

 

링크 복사
다른 사이트에 공유하기

오답변의 경우, 데이터셋의 모수가 적을수록 잘못된 답변의 출력 비중이 높아집니다. 따라서, 데이터의 수를 좀 더 확보하실 필요가 있어 보입니다.

권장하고 있는 데이터셋 규격에 대해서는 아래 가이드를 참고해주십시오.

https://guide.ncloud-docs.com/docs/clovastudio-instructiondataset

가이드에서 안내드리고 있듯, 1,000~100,000 행이 권장하고 있는 데이터입니다.

따라서 160개의 데이터로는 정확도가 많이 떨어지게 됩니다.

최소 1,000 쌍 이상의 데이터를 확보하여 튜닝 후 진행해보시기 바랍니다.

 

라고 답변을 받았습니다.

일단 해보고 문제 있을 시 다시 질문할께요.

링크 복사
다른 사이트에 공유하기

3 hours ago, SiSAFER said:

오답변의 경우, 데이터셋의 모수가 적을수록 잘못된 답변의 출력 비중이 높아집니다. 따라서, 데이터의 수를 좀 더 확보하실 필요가 있어 보입니다.

권장하고 있는 데이터셋 규격에 대해서는 아래 가이드를 참고해주십시오.

https://guide.ncloud-docs.com/docs/clovastudio-instructiondataset

가이드에서 안내드리고 있듯, 1,000~100,000 행이 권장하고 있는 데이터입니다.

따라서 160개의 데이터로는 정확도가 많이 떨어지게 됩니다.

최소 1,000 쌍 이상의 데이터를 확보하여 튜닝 후 진행해보시기 바랍니다.

 

라고 답변을 받았습니다.

일단 해보고 문제 있을 시 다시 질문할께요.

 

가이드에 안내하고 있는 1,000~100,000행이 권장하고 있는 데이터 일 때,
140쌍의 데이터를 복사하여 1,000개를 만들어서 튜닝하였다면,
140쌍의 데이터로 이루어진 질문 답변에 대한 내용은 비슷하게 나와야하지 않나요?
제가 잘못알고 있을까요?
140쌍의 데이터로 1,000개를 만들어서 튜닝하고 테스트 해보니까,
140쌍을 넣었을때랑 크게 달라진 차이점을 못느끼겠습니다.
무엇보다 1,000쌍의 데이터를 처음 첨부했던 내용과 같은 예시로 하면 되는게 맞나요?

그럼 제가 의도한 대로 결과 값이 도출이 되어야 하는데...
전혀 다른 결과가 나오고 있어서 문제가 있습니다...

 

위와 같이 추가 질문 후 응답 대기중....

링크 복사
다른 사이트에 공유하기

튜닝의 경우 학습에 이용될 데이터를 참고하여 답변을 주는 형태입니다.

따라서 고객님께서 작성하신 답변을 참고하여 생성하여 output을 생성하기 때문에 원하는 형태로 output이 생성되지 않을 수 있습니다.



또한 튜닝 데이터셋 구성 시 데이터의 양보다는 질이 중요하다 라는 내용을 가이드하고 있습니다.

https://guide.ncloud-docs.com/docs/clovastudio-instructiondataset



따라서, 가능한 다양하고 많은 데이터를 확보하여 튜닝을 진행해보시기 바랍니다.

라고 답변을 받았는데...흠....

링크 복사
다른 사이트에 공유하기

안녕하세요. 

먼저 문의 주신 내용에 답변드리자면, 작성하신 학습 데이터는 데이터 셋 규격에 맞게 작성된 것이 맞습니다. 
다만 원하는 답변을 얻기 위해서는 규격에 맞아야 할 뿐 아니라 학습 데이터의 구성이 중요한데요, 특히 모델에 정보를 주입하고 주어진 정보 내에서 질의응답을 하는 성격의 작업은 학습 데이터의 질과 양 모두 충분해야 합니다.   
동일한 정보 내용이라도 하더라도, 동일한 문장과 답변을 반복하는 것이 아닌 다양한 형태의 문장과 답변으로 구성하는 것과 
주어진 정보 내에서 답변할 수 있도록 system prompt을 추가하여  구성하는 것을 권장 드립니다. 

먼저 플레이그라운드에서 system prompt을 추가하여 동일한 정보에 대해서 일관된 질의 응답을 할수 있는 정도가 되는지 테스트를 해보고, 해당 테스트 결과를 기반으로 학습 데이터 셋를 만들어 학습 시켜보고, 
결과의 성능을 향상 시키기 위해 학습 시 파라미터 조정과 데이터 셋을 수정하여 다시 학습 하는 과정의 반복이 필요합니다.  

모델 학습에 전체적인 과정에 대한 안내와, system prompt 활용 및 챗봇 사례를 첨부드리니 참고 부탁드립니다.
(*챗봇 사례는 동일한 상황은 아니나 작업 진행 시에 참고가 될 수 있어 함께 첨부드립니다.) 


감사합니다. 

 

링크 복사
다른 사이트에 공유하기

게시글 및 댓글을 작성하려면 로그인 해주세요.



로그인
×
×
  • Create New...