활용법에 올려주신 토큰 수 한계 극복과 관련된 글을 보다 궁금한점이 생겨 문의 드립니다.
1. 최대 토큰 개념
4096 이라는 최대 토큰이라는 개념은 Chat Completion API 를 수 차례 호출할때마다 누적되는 개념인지, 한번 호출할때 체크되는 개념인지요?
예를 들어 대화 맥락유지를 위해서 기존 대화내용을 포함해서 api를 호출한다면 대화가 길어지게 되면 최대 토큰을 초과하겠지만, 맥락 유지가 필요없다면 최대 토큰을 크게 신경쓰지 않아도 되는 부분일까요?
2. 대화 맥락 유지
대화 맥락 유지를 위해서는 Chat Completion API의 messages에 누적된 메세지 내용을 포함해서 전달해야 하는것으로 이해했습니다.
활용법에 올려주신 토큰 수 한계극복(슬라이딩 윈도우, 요약 api) 과 관련된 내용은 대화 맥락을 유지하는 경우를 위한 처리 방법으로 이해하면 될까요?