Jump to content

parkjuhong

Members
  • 게시글

    2
  • 첫 방문

  • 최근 방문

  • Days Won

    1

Everything posted by parkjuhong

  1. RAG 서비스를 만들고 있습니다. 장문의 문서의 경우 LLM 적용에서 모델 컨텍스트 윈도우 최적 사용을 위해 토큰 수 기준으로 문단 분리를 하고 있습니다. 다만, 문장 단위로 토큰 수 계산을 하니, HCX 토커나이저를 적용을 하는 과정에서 문서가 길어질 경우 토커나이저 API 에서 Rate Limit 이 발생합니다. 저희 서비스에서 타사 LLM을 사용하는 경우, 그 쪽에서 API가 아닌 토커나이저 라이브러리를 제공하고 있어 토큰 수 계산을 위한 Rate Limit 을 고려하지 않아도 되는 환경이지만, CLOVA의 경우 이를 추가로 고려해야 되는 상황입니다.
  2. RPM이 높은 서비스에 해당 API를 적용하려고 하니 Rate limit이 자주 발생하고 있어서 곤란한 상태입니다. 토큰 계산기에 대한 Rate limit이 더 널널한 테스트 앱이나 서비스 앱은 현재 없는 것 같습니다. 혹시 지원할 생각이 있으신지..?
×
×
  • Create New...