Jump to content

summary API 의 수치조절이 궁금합니다.


데이터 빅
 Share

Recommended Posts

155조의2(장기저당담보주택에 대한 1세대1주택의 특례) 국내에 1주택을 소유한 1세대가 다음 각호의 요건을 갖춘 장기저당담보대출계약을 체결하고 장기저당담보로 제공된 주택(이하 이 조에서 장기저당담보주택이라 한다)을 양도하는 경우에는 제154조제1항의 규정을 적용함에 있어 거주기간의 제한을 받지 아니한다.

1. 계약체결일 현재 주택을 담보로 제공한 가입자가 60세 이상일 것

2. 장기저당담보 계약기간이 10년 이상으로서 만기시까지 매월ㆍ매분기별 또는 그 밖에 기획재정부령이 정하는 방법으로 대출금을 수령하는 조건일 것

3. 만기에 당해 주택을 처분하여 일시 상환하는 계약조건일 것

1주택을 소유하고 1세대를 구성하는 자가 장기저당담보주택을 소유하고 있는 직계존속(배우자의 직계존속을 포함한다)을 동거봉양하기 위하여 세대를 합침으로써 1세대가 2주택을 소유하게 되는 경우 먼저 양도하는 주택에 대하여는 국내에 1개의 주택을 소유하고 있는 것으로 보아 제154조제1항의 규정을 적용하되, 장기저당담보주택은 거주기간의 제한을 받지 아니한다.

1세대가 장기저당담보주택을 제1항의 규정에 의한 계약기간 만료 이전에 양도하는 경우에는 제1항 및 제2항의 규정을 적용하지 아니한다.

2항의 규정을 적용받으려는 자는 기획재정부령이 정하는 장기저당담보주택에 대한 특례적용신고서를 소득세법105조 또는 동법 제110조에 따른 양도소득세 과세표준신고기한 내에 장기저당담보주택에 관한 제1항의 대출 계약서와 함께 제출하여야 한다. 이 경우 납세지 관할세무서장은 전자정부법36조제1항에 따른 행정정보의 공동이용을 통하여 다음 각 호의 서류를 확인하여야 한다.

1. 장기저당담보주택 외의 다른 주택의 토지 및 건축물대장 등본

2. 장기저당담보주택의 토지 및 건축물대장 등본

 

이라는 하나의 법률 조항을 summary API를 이용해서 테스트했습니다.

 

처음으로는,
        "segMinSize" : 1,
        "includeAiFilters" : true,
        "autoSentenceSplitter" : true,
        "segCount" : 1,
        "segMaxSize" : 20

의 parameter를 준 후 테스트를 해봤는데 

- 장기저당담보주택에 대한 1세대 1주택의 특례에 대해 설명하고 있음

의 결과가 나왔고, MaxSize로 둔 20을 넘는 것을 확인했습니다.

 

두번째로는,
        "segMinSize" : 1,
        "includeAiFilters" : true,
        "autoSentenceSplitter" : true,
        "segCount" : 3,
        "segMaxSize" : 20

의 parameter를 준 후 테스트를 해봤는데,

- 장기저당담보주택에 대한 1세대 1주택의 특례에 대해 설명하고 있음
- 1세대가 장기저당담보주택을 소유하고 있는 직계존속을 동거봉양하기 위하여 세대를 합침으로써 1세대가 2주택을 소유하게 되는 경우 먼저 양도하는 주택에 대하여는 국내에 1개의 주택을 소유하고 있는 것으로 보아 제154조제1항의 규정을 적용함
- 장기저당담보주택은 거주기간의 제한을 받지 않음
- 장기저당담보주택을 계약기간 만료 이전에 양도하는 경우에는 제1항 및 제2항의 규정을 적용하지 아니함
- 제2항의 규정을 적용받으려는 자는 기획재정부령이 정하는 장기저당담보주택에 대한 특례적용신고서를 소득세법 제105조 또는 동법 제110조에 따른 양도소득세 과세표준신고기한 내에 장기저당담보주택에 관한 제1항의 대출 계약서와 함께 제출하여야 함
- 장기저당담보주택의 토지 및 건축물대장 등본을 제출해야 함

와 같이 segCount 이상의 결과가 나오는 것을 확인했습니다.

 

저의 생각으로는 첫번째는 결과가 20단어 이하로 나와야 하고, 두번째는 결과가 3문장이 나와야 한다고 생각했습니다.

혹시 이것이 버그인지, 제가 잘못 이해하고 있는 것인지 알려주시면 감사하겠습니다.

 

 

 

 

 

추가적인 질문으로, 파이썬 기준 request data를 보낼 때

    request_data = json.loads("""{
        "texts" : [],
        "segMinSize" : 1,
        "includeAiFilters" : true,
        "autoSentenceSplitter" : true,
        "segCount" : 3,
        "segMaxSize" : 20
    }""", strict=False)

와 같이 texts를 list의 형태로 보내게 되는데요, 만약 앞선 법령을 요약하고 싶을 경우

 

155조의2(장기저당담보주택에 대한 1세대1주택의 특례) 국내에 1주택을 소유한 1세대가 다음 각호의 요건을 갖춘 장기저당담보대출계약을 체결하고 장기저당담보로 제공된 주택(이하 이 조에서 장기저당담보주택이라 한다)을 양도하는 경우에는 제154조제1항의 규정을 적용함에 있어 거주기간의 제한을 받지 아니한다.

1. 계약체결일 현재 주택을 담보로 제공한 가입자가 60세 이상일 것

2. 장기저당담보 계약기간이 10년 이상으로서 만기시까지 매월ㆍ매분기별 또는 그 밖에 기획재정부령이 정하는 방법으로 대출금을 수령하는 조건일 것

3. 만기에 당해 주택을 처분하여 일시 상환하는 계약조건일 것

1주택을 소유하고 1세대를 구성하는 자가 장기저당담보주택을 소유하고 있는 직계존속(배우자의 직계존속을 포함한다)을 동거봉양하기 위하여 세대를 합침으로써 1세대가 2주택을 소유하게 되는 경우 먼저 양도하는 주택에 대하여는 국내에 1개의 주택을 소유하고 있는 것으로 보아 제154조제1항의 규정을 적용하되, 장기저당담보주택은 거주기간의 제한을 받지 아니한다.

1세대가 장기저당담보주택을 제1항의 규정에 의한 계약기간 만료 이전에 양도하는 경우에는 제1항 및 제2항의 규정을 적용하지 아니한다.

2항의 규정을 적용받으려는 자는 기획재정부령이 정하는 장기저당담보주택에 대한 특례적용신고서를 소득세법105조 또는 동법 제110조에 따른 양도소득세 과세표준신고기한 내에 장기저당담보주택에 관한 제1항의 대출 계약서와 함께 제출하여야 한다. 이 경우 납세지 관할세무서장은 전자정부법36조제1항에 따른 행정정보의 공동이용을 통하여 다음 각 호의 서류를 확인하여야 한다.

1. 장기저당담보주택 외의 다른 주택의 토지 및 건축물대장 등본

2. 장기저당담보주택의 토지 및 건축물대장 등본

 

1. '\n' 단위로 split해서 texts에 넣는 것(list의 길이가 9)

2. 전체를 texts에 넣는 것(list의 길이가 1)

두가지 경우 summary API의 성능 차이가 없는지 알려주시면 감사하겠습니다.

링크 복사
다른 사이트에 공유하기

안녕하세요 @데이터 빅님, 

클로바 스튜디오를 이용해주셔서 감사합니다.

아래 문의주신 내용 답변드리니 확인 부탁드리며, 추가로 궁금하신 점이 있거나 개선이 필요한 사항이 있다면 편히 말씀주세요. 

감사합니다.

  1. 요약 API 파라미터 관련: `segCount`, `segMinSize`, `segMixSize` 는 길이가 긴 문서를 보다 효과적으로 요악하기 위해 입력된 문서를 먼저 문단으로 나누어 처리하는 과정에 적용되는 파라미터입니다. 다시 말해 해당 파라미터는 최종 요약 결과를 명시적으로 제어하기 위한 값이 아니며, LLM 특성상 출력 결과를 완벽하게 제어하기 어려운 상황에서 중간 과정에 제약 조건을 설정함으로서 보다 원하는 형상의 결과를 얻도록 보조하는 역할을 합니다.
  2. segMaxSize는 '문단 분리 시 한 문단에 포함될 최대 문자열의 글자 수'를 의미하며, segCount를 1로 설정하여 이미 문단을 나누지 않는 것으로 설정되었으므로 작동하지 않을 것으로 보입니다. 결과적으로 입력된 문서 전체를 1개 문단으로 처리하여 요약했으므로 상대적으로 짧은 1개 문장을 출력합니다.
  3. segCount 는 '요약할 문장 목록을 분리할 문단 수'를 의미하며, 이를 3으로 설정하셨으므로 입력된 문서를 3개 문단으로 나누어 각각 요약한 결과를 받게 됩니다. 이 때도 입력한 문서가 이미 60자를 넘어 어떤 문단이든 설정하신 segMaxSize를 초과하게 되므로 해당 파라미터는 작동하지 않습니다. 나뉜 문단에 담긴 내용에 따라 여러 개의 문장으로 요약될 수 있는 점도 함께 참고해주십시오.
  4. 두가지 경우에 대해 차이를 논하기에 앞서 요약 API가 문단을 나눌 때 autoSentenceSplitter 파라미터에 따라 문장을 인식하는 방식이 달라지는 점에 유의해주십시오. 이를 `true`로 설정 시 모델이 그 외 파라미터 설정에 따라 전체 입력을 자체적으로 문장 및 문단으로 나누어 요약을 진행하며, `false`로 설정 시 입력된 형태 그대로 요약을 진행합니다. 따라서 autoSentenceSplitter 파라미터가 true인 경우 차이가 없으며, false인 경우 차이가 발생합니다.
  • Like 1
링크 복사
다른 사이트에 공유하기

게시글 및 댓글을 작성하려면 로그인 해주세요.



로그인
 Share

×
×
  • Create New...