Didim365 Posted January 29 공유하기 Posted January 29 안녕하세요. 기존 HCX-002 로 Chat Completion API 사용했을 땐 maxTokens를 4096으로 해도 리스폰스를 잘 받았었는데요, HCX-003 출시와 동시에 테스트 해보니 (HCX-002도 동일) 4096 Tokens 를 입력 했을 땐 Text Too Long 이라는 에러 리스폰스를 받습니다. 가이드에는 4096 Tokens를 사용 가능하다고 나와 있는데 변경 사항이 생긴걸까요? 'messages': self.input_text, 'maxTokens': 4096, 'temperature': 0.1, 'topK': 0, 'topP': 0.8, 'repeatPenalty': 5.0, 'stopBefore': [], 'includeAiFilters': 'True' 링크 복사 다른 사이트에 공유하기 More sharing options...
CLOVA Studio 운영자 Posted January 29 공유하기 Posted January 29 안녕하세요, @Didim365님, HCX-002에서 정상적으로 response를 받으셨다는 내용에 대해서, 자세히 input/output을 봐야지 알 것 같으나, HCX-002 모델과 HCX-003 모델은 동일한 context length인 4096 토큰입니다. 입력과 출력을 합쳐서 4096 토큰이기 때문에, maxTokens를 4096 토큰으로 설정 후 요청을 하시면, Text too long 응답을 받게 됩니다. System prompt, input과 적절한 output 길이를 고려하시어, maxTokens를 줄인 후 요청을 부탁드립니다. 감사합니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
Didim365 Posted January 29 Author 공유하기 Posted January 29 50 minutes ago, CLOVA Studio 운영자 said: 안녕하세요, @Didim365님, HCX-002에서 정상적으로 response를 받으셨다는 내용에 대해서, 자세히 input/output을 봐야지 알 것 같으나, HCX-002 모델과 HCX-003 모델은 동일한 context length인 4096 토큰입니다. 입력과 출력을 합쳐서 4096 토큰이기 때문에, maxTokens를 4096 토큰으로 설정 후 요청을 하시면, Text too long 응답을 받게 됩니다. System prompt, input과 적절한 output 길이를 고려하시어, maxTokens를 줄인 후 요청을 부탁드립니다. 감사합니다. input text 는 'hello' 입니다. 테스트를 위해 작성한거라 짧은 토큰을 발생시킵니다. 기존에 됐던게 업데이트 후 안되는거라서요... 4096 -> 2048로 수정하면 Text Too Long이 아니라 답변이 잘 옵니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
CLOVA Studio 운영자 Posted January 29 공유하기 Posted January 29 @Didim365님, HCX-003 모델의 context length는 4096이기 때문에, 2048로 요청하면 정상적으로 출력 되는 것입니다. 하지만 이 경우에도 인풋에 hello가 아닌, 아주 긴 텍스트 입력이 있다면, 인풋과 아웃풋의 합이 4096에 도달할 것이기 때문에 출력이 되지 않을 것입니다. 작업 유형에 따라 모델이 출력하는 길이가 달라집니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
Recommended Posts
게시글 및 댓글을 작성하려면 로그인 해주세요.
로그인