사리미로 Posted May 27 공유하기 Posted May 27 안녕하세요. 챗봇과 유사한 서비스를 개발하고있는데 도메인 특성상 LLM의 출력을 완전히 통제할 수 없어 LLM API를 실시간으로 붙이는 것이 아닌 시나리오 기반으로 테스트앱을 이용해 시나리오셋 답변 작성을 하고있는 상황입니다. 그런데 테스트앱엔 TPM이 매우 제한적으로 설정되어있어 출력을 뽑는데 상당한 시간이 소요되고 있어 혹시 이 부분을 서비스앱 등으로 제한을 풀 수 있을지 질문드립니다. 서비스앱을 신청하려고 보니 실시간 서비스에만 신청할 수 있는건가 싶은데 그런 기준이 있나요? 링크 복사 다른 사이트에 공유하기 More sharing options...
CLOVA Studio 운영자 Posted May 29 공유하기 Posted May 29 안녕하세요, @사리미로님, 클로바 스튜디오 담당입니다. 서비스 앱 신청 가능 범위가 실시간 서비스로만 한정되는 것은 아닙니다. 서비스 앱 신청을 진행해주시면 검토하도록 하겠습니다. 감사합니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
사리미로 Posted June 4 Author 공유하기 Posted June 4 답변 감사합니다. 추가로, 서비스 앱 승인 이후 TPM QPM은 어느정도로 책정이 되나요? 링크 복사 다른 사이트에 공유하기 More sharing options...
CLOVA Studio 운영자 Posted June 4 공유하기 Posted June 4 @사리미로님, 서비스 앱 이후의 이용량을 확인하실 수 있도록 이용량 제어 정책 가이드 링크를 전달드립니다. https://guide.ncloud-docs.com/docs/clovastudio-ratelimiting 감사합니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
사리미로 Posted June 5 Author 공유하기 Posted June 5 테스트앱포함 60000 token으로 적절한 지는 테스트해보아야겠지만 혹여 서비스 이용자 수가 매우 많아 여의치 않을 경우 현재 정책상 최대 이용량 제한을 늘려달라고 요청이 가능할까요? 어려운 경우 우회방법으로 메인계정을 추가생성하는 방법이 떠오르는데 다른 방법도 있을까요? 링크 복사 다른 사이트에 공유하기 More sharing options...
CLOVA Studio 운영자9 Posted June 11 공유하기 Posted June 11 안녕하세요 @사리미로님, 관련 요청은 고객문의 창구를 통해 전달주시면 감사하겠습니다. 참고로 실제 이용량이 일정 수준을 넘지 않는 경우 이용량이 증가할 때까지 검토 대상에 포함되지 않을 수 있습니다. 또한, 동일 서비스에 대해 복수 계정을 생성하여 이용하는 것은 서비스 앱 승인이 불가한 등 서비스 정책에 어긋나는 방식인 점 역시 참고 부탁드립니다. 감사합니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
Recommended Posts
게시글 및 댓글을 작성하려면 로그인 해주세요.
로그인