데이터 빅 Posted February 6 공유하기 Posted February 6 RAG, Hyper CLOVA X 를 이용하여 챗봇을 만드려고 합니다. 이때, 가지고 있는 문서(ex. 형사소송법)를 학습시키기 위해 문서를 일정 단위로 나눈 뒤 임베딩 후 DB에 저장하는 과정을 거쳤습니다. 대부분 조 단위로 나눠서 학습을 시켰기 때문에 문제가 없었지만, 중간에 하이퍼클로바에서 제공하는 임베딩 api 최대 토큰 수를 넘어가는 조가 있어서 필연적으로 하나의 조를 나눌 수 밖에 없는 경우가 생겼습니다. 그 경우 나누기에 가장 적당한 길이나 토큰이 보통 어느 정도 되는지 내부적으로 정해 둔 기준이 있으신가요? ex. 제214조의2(체포와 구속의 적부심사) ① 체포되거나 구속된 피의자 또는 그 변호인, 법정대리인, 배우자, 직계친족, 형제자매나 가족, 동거인 또는 고용주는 관할법원에 체포 또는 구속의 적부심사(適否審査)를 청구할 수 있다. <개정 2020. 12. 8.> ②피의자를 체포하거나 구속한 검사 또는 사법경찰관은 체포되거나 구속된 피의자와 제1항에 규정된 사람 중에서 피의자가 지정하는 사람에게 제1항에 따른 적부심사를 청구할 수 있음을 알려야 한다. <신설 2007. 6. 1., 2020. 12. 8.> ③법원은 제1항에 따른 청구가 다음 각 호의 어느 하나에 해당하는 때에는 제4항에 따른 심문 없이 결정으로 청구를 기각할 수 있다. <개정 1987. 11. 28., 1995. 12. 29., 2007. 6. 1., 2020. 12. 8.> 1. 청구권자 아닌 사람이 청구하거나 동일한 체포영장 또는 구속영장의 발부에 대하여 재청구한 때 2. 공범이나 공동피의자의 순차청구(順次請求)가 수사 방해를 목적으로 하고 있음이 명백한 때 ④ 제1항의 청구를 받은 법원은 청구서가 접수된 때부터 48시간 이내에 체포되거나 구속된 피의자를 심문하고 수사 관계 서류와 증거물을 조사하여 그 청구가 이유 없다고 인정한 경우에는 결정으로 기각하고, 이유 있다고 인정한 경우에는 결정으로 체포되거나 구속된 피의자의 석방을 명하여야 한다. 심사 청구 후 피의자에 대하여 공소제기가 있는 경우에도 또한 같다. <개정 2020. 12. 8.> ⑤ 법원은 구속된 피의자(심사청구 후 공소제기된 사람을 포함한다)에 대하여 피의자의 출석을 보증할 만한 보증금의 납입을 조건으로 하여 결정으로 제4항의 석방을 명할 수 있다. 다만, 다음 각 호에 해당하는 경우에는 그러하지 아니하다. <개정 2020. 12. 8.> 1. 범죄의 증거를 인멸할 염려가 있다고 믿을 만한 충분한 이유가 있는 때 2. 피해자, 당해 사건의 재판에 필요한 사실을 알고 있다고 인정되는 사람 또는 그 친족의 생명ㆍ신체나 재산에 해를 가하거나 가할 염려가 있다고 믿을 만한 충분한 이유가 있는 때 ⑥ 제5항의 석방 결정을 하는 경우에는 주거의 제한, 법원 또는 검사가 지정하는 일시ㆍ장소에 출석할 의무, 그 밖의 적당한 조건을 부가할 수 있다. <개정 2020. 12. 8.> ⑦ 제5항에 따라 보증금 납입을 조건으로 석방을 하는 경우에는 제99조와 제100조를 준용한다. <개정 2020. 12. 8.> ⑧ 제3항과 제4항의 결정에 대해서는 항고할 수 없다. <개정 2020. 12. 8.> ⑨ 검사ㆍ변호인ㆍ청구인은 제4항의 심문기일에 출석하여 의견을 진술할 수 있다. <개정 2020. 12. 8.> ⑩ 체포되거나 구속된 피의자에게 변호인이 없는 때에는 제33조를 준용한다. <개정 2020. 12. 8.> ⑪법원은 제4항의 심문을 하는 경우 공범의 분리심문이나 그 밖에 수사상의 비밀보호를 위한 적절한 조치를 하여야 한다. <개정 2007. 6. 1., 2020. 12. 8.> ⑫ 체포영장이나 구속영장을 발부한 법관은 제4항부터 제6항까지의 심문ㆍ조사ㆍ결정에 관여할 수 없다. 다만, 체포영장이나 구속영장을 발부한 법관 외에는 심문ㆍ조사ㆍ결정을 할 판사가 없는 경우에는 그러하지 아니하다. <개정 2020. 12. 8.> ⑬법원이 수사 관계 서류와 증거물을 접수한 때부터 결정 후 검찰청에 반환된 때까지의 기간은 제200조의2제5항(제213조의2에 따라 준용되는 경우를 포함한다) 및 제200조의4제1항을 적용할 때에는 그 제한기간에 산입하지 아니하고, 제202조ㆍ제203조 및 제205조를 적용할 때에는 그 구속기간에 산입하지 아니한다. <개정 2007. 6. 1., 2020. 12. 8.> ⑭ 제4항에 따라 피의자를 심문하는 경우에는 제201조의2제6항을 준용한다. <개정 2020. 12. 8.> => (변경) <<1>> 제214조의2(체포와 구속의 적부심사) ① 체포되거나 구속된 피의자 또는 그 변호인, 법정대리인, 배우자, 직계친족, 형제자매나 가족, 동거인 또는 고용주는 관할법원에 체포 또는 구속의 적부심사(適否審査)를 청구할 수 있다. <개정 2020. 12. 8.> ②피의자를 체포하거나 구속한 검사 또는 사법경찰관은 체포되거나 구속된 피의자와 제1항에 규정된 사람 중에서 피의자가 지정하는 사람에게 제1항에 따른 적부심사를 청구할 수 있음을 알려야 한다. <신설 2007. 6. 1., 2020. 12. 8.> ③법원은 제1항에 따른 청구가 다음 각 호의 어느 하나에 해당하는 때에는 제4항에 따른 심문 없이 결정으로 청구를 기각할 수 있다. <개정 1987. 11. 28., 1995. 12. 29., 2007. 6. 1., 2020. 12. 8.> 1. 청구권자 아닌 사람이 청구하거나 동일한 체포영장 또는 구속영장의 발부에 대하여 재청구한 때 2. 공범이나 공동피의자의 순차청구(順次請求)가 수사 방해를 목적으로 하고 있음이 명백한 때 ④ 제1항의 청구를 받은 법원은 청구서가 접수된 때부터 48시간 이내에 체포되거나 구속된 피의자를 심문하고 수사 관계 서류와 증거물을 조사하여 그 청구가 이유 없다고 인정한 경우에는 결정으로 기각하고, 이유 있다고 인정한 경우에는 결정으로 체포되거나 구속된 피의자의 석방을 명하여야 한다. 심사 청구 후 피의자에 대하여 공소제기가 있는 경우에도 또한 같다. <개정 2020. 12. 8.> ⑤ 법원은 구속된 피의자(심사청구 후 공소제기된 사람을 포함한다)에 대하여 피의자의 출석을 보증할 만한 보증금의 납입을 조건으로 하여 결정으로 제4항의 석방을 명할 수 있다. 다만, 다음 각 호에 해당하는 경우에는 그러하지 아니하다. <개정 2020. 12. 8.> 1. 범죄의 증거를 인멸할 염려가 있다고 믿을 만한 충분한 이유가 있는 때 2. 피해자, 당해 사건의 재판에 필요한 사실을 알고 있다고 인정되는 사람 또는 그 친족의 생명ㆍ신체나 재산에 해를 가하거나 가할 염려가 있다고 믿을 만한 충분한 이유가 있는 때 <<2>> 제214조의2(체포와 구속의 적부심사) ⑥ 제5항의 석방 결정을 하는 경우에는 주거의 제한, 법원 또는 검사가 지정하는 일시ㆍ장소에 출석할 의무, 그 밖의 적당한 조건을 부가할 수 있다. <개정 2020. 12. 8.> ⑦ 제5항에 따라 보증금 납입을 조건으로 석방을 하는 경우에는 제99조와 제100조를 준용한다. <개정 2020. 12. 8.> ⑧ 제3항과 제4항의 결정에 대해서는 항고할 수 없다. <개정 2020. 12. 8.> ⑨ 검사ㆍ변호인ㆍ청구인은 제4항의 심문기일에 출석하여 의견을 진술할 수 있다. <개정 2020. 12. 8.> ⑩ 체포되거나 구속된 피의자에게 변호인이 없는 때에는 제33조를 준용한다. <개정 2020. 12. 8.> ⑪법원은 제4항의 심문을 하는 경우 공범의 분리심문이나 그 밖에 수사상의 비밀보호를 위한 적절한 조치를 하여야 한다. <개정 2007. 6. 1., 2020. 12. 8.> <<3>> 제214조의2(체포와 구속의 적부심사) ⑫ 체포영장이나 구속영장을 발부한 법관은 제4항부터 제6항까지의 심문ㆍ조사ㆍ결정에 관여할 수 없다. 다만, 체포영장이나 구속영장을 발부한 법관 외에는 심문ㆍ조사ㆍ결정을 할 판사가 없는 경우에는 그러하지 아니하다. <개정 2020. 12. 8.> ⑬법원이 수사 관계 서류와 증거물을 접수한 때부터 결정 후 검찰청에 반환된 때까지의 기간은 제200조의2제5항(제213조의2에 따라 준용되는 경우를 포함한다) 및 제200조의4제1항을 적용할 때에는 그 제한기간에 산입하지 아니하고, 제202조ㆍ제203조 및 제205조를 적용할 때에는 그 구속기간에 산입하지 아니한다. <개정 2007. 6. 1., 2020. 12. 8.> ⑭ 제4항에 따라 피의자를 심문하는 경우에는 제201조의2제6항을 준용한다. <개정 2020. 12. 8.> 링크 복사 다른 사이트에 공유하기 More sharing options...
CLOVA Studio 운영자9 Posted February 6 공유하기 Posted February 6 안녕하세요 @데이터 빅님, 말씀주신대로 현재 클로바 스튜디오에서 제공하는 임베딩 API는 입력 길이에 제한이 있습니다. (~500 토큰) 때문에 가이드에서와 같이 문단나누기 또는 요약 API를 함께 활용할 것을 권장드리고 있습니다. (참고: https://guide.ncloud-docs.com/docs/clovastudio-explorer03) 이와 함께 출력에서 `inputTokens` 필드를 통해 입력 길이(토큰 수)를 반환하고 있으니 참고해주시면 감사하겠습니다. 토큰 수는 문서 종류나 성격에 따라서 달라지므로 일관적인 가이드를 드리기 어려우나, 일반적으로 법률 문서의 경우 500 토큰은 글자수(공백 제외) 기준 7~800자 정도인 점 역시 함께 참고해주십시오. 감사합니다. 1 링크 복사 다른 사이트에 공유하기 More sharing options...
데이터 빅 Posted February 7 Author 공유하기 Posted February 7 혹시 문단 나누기 api 이용중에, 나눠진 문장의 최소 단위를 결정할 수 있는 방법이 있나요? "postProcess" : -100, "postProcessMaxSize" : 500, "alpha" : 0.0, "segCnt" : -1, "postProcessMinSize" : 200, 의 값을 주고 요청을 보냈을 때, 결과값으로 오는 것은 제대로 나눠진 것도 있지만, ['라.'] --- ['「국민기초생활 보장법」에 따른 수급권자 중 대통령령으로 정하는 사람'] --- ['마.'] --- ['「아동복지법」에 따른 가정위탁을 받아 양육하는 아동으로서 대통령령으로 정하는 사람(이하 “위탁아동”이라 한다)'] --- 와 같이 한두글자만 잘려진 경우도 있어서 제대로 된 방법을 알려주시면 감사하겠습니다! 링크 복사 다른 사이트에 공유하기 More sharing options...
CLOVA Studio 운영자9 Posted February 8 공유하기 Posted February 8 안녕하세요 @데이터 빅님, 문단 나누기 API 명세 페이지에 오류가 있었는데요, 현재 수정되었으니 다시 확인해주시면 감사하겠습니다. 우선 문단 나누기 API를 의도하신 바와 같이 사용하기 위해서는 아래와 같이 파라미터를 설정해야 할 것으로 보입니다. "postProcess": true, "alpha": -100, "segCnt": -1, "postProcessMaxSize": 500, "postProcessMinSize": 200, 문단 나누기 API에서 문장 관련 정보 역시 확인하고자 하는 사용자 분들의 니즈를 고려하여 같은 문단 내의 문장 역시 구분하여 보실 수 있도록 했습니다. 파라미터를 재설정할 경우 말씀주신대로 한두글자가 문단으로 나뉘는 경우는 없을 것으로 보이나, 문단 내에서는 문장으로 나뉘어 있을 수는 있습니다. 같은 문단은 같은 array로 묶이기 때문에 이 점 참고하셔서 후처리를 진행하시면 되겠습니다. 감사합니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
데이터 빅 Posted February 8 Author 공유하기 Posted February 8 감사합니다! 알려주신 파라미터를 사용하니 제대로 작동하는 것을 확인할 수 있었습니다. 그런데 몇몇 법률을 나누는 동안 제 문제인지 버그인지 알 수 없는 상황이 생겼는데요, 예를 들면 아래와 같은 소득세법을 나누는 도중에 제45조(결손금 및 이월결손금의 공제) ① 사업자가 비치ㆍ기록한 장부에 의하여 해당 과세기간의 사업소득금액을 계산할 때 발생한 결손금은 그 과세기간의 종합소득과세표준을 계산할 때 근로소득금액ㆍ연금소득금액ㆍ기타소득금액ㆍ이자소득금액ㆍ배당소득금액에서 순서대로 공제한다. ② 제1항에도 불구하고 다음 각 호의 어느 하나에 해당하는 사업(이하 “부동산임대업”이라 한다)에서 발생한 결손금은 종합소득 과세표준을 계산할 때 공제하지 아니한다. 다만, 주거용 건물 임대업의 경우에는 그러하지 아니하다. 1. 부동산 또는 부동산상의 권리를 대여하는 사업 2. 공장재단 또는 광업재단을 대여하는 사업 3. 채굴에 관한 권리를 대여하는 사업으로서 대통령령으로 정하는 사업 ③ 부동산임대업에서 발생한 결손금과 제1항 및 제2항 단서에 따라 공제하고 남은 결손금(이하 “이월결손금”이라 한다)은 해당 이월결손금이 발생한 과세기간의 종료일부터 15년 이내에 끝나는 과세기간의 소득금액을 계산할 때 먼저 발생한 과세기간의 이월결손금부터 순서대로 다음 각 호의 구분에 따라 공제한다. 다만, 「국세기본법」 제26조의2에 따른 국세부과의 제척기간이 지난 후에 그 제척기간 이전 과세기간의 이월결손금이 확인된 경우 그 이월결손금은 공제하지 아니한다. 1. 제1항 및 제2항 단서에 따라 공제하고 남은 이월결손금은 사업소득금액, 근로소득금액, 연금소득금액, 기타소득금액, 이자소득금액 및 배당소득금액에서 순서대로 공제한다. 2. 부동산임대업에서 발생한 이월결손금은 부동산임대업의 소득금액에서 공제한다. ④ 제3항은 해당 과세기간의 소득금액에 대해서 추계신고(제160조 및 제161조에 따라 비치ㆍ기록한 장부와 증명서류에 의하지 아니한 신고를 말한다. 이하 같다)를 하거나 제80조제3항 단서에 따라 추계조사결정하는 경우에는 적용하지 아니한다. 다만, 천재지변이나 그 밖의 불가항력으로 장부나 그 밖의 증명서류가 멸실되어 추계신고를 하거나 추계조사결정을 하는 경우에는 그러하지 아니하다. ⑤ 제1항과 제3항에 따라 결손금 및 이월결손금을 공제할 때 제62조에 따라 세액 계산을 하는 경우 제14조에 따라 종합과세되는 배당소득 또는 이자소득이 있으면 그 배당소득 또는 이자소득 중 원천징수세율을 적용받는 부분은 결손금 또는 이월결손금의 공제대상에서 제외하며, 그 배당소득 또는 이자소득 중 기본세율을 적용받는 부분에 대해서는 사업자가 그 소득금액의 범위에서 공제 여부 및 공제금액을 결정할 수 있다. ⑥ 제1항과 제2항에 따라 결손금 및 이월결손금을 공제할 때 해당 과세기간에 결손금이 발생하고 이월결손금이 있는 경우에는 그 과세기간의 결손금을 먼저 소득금액에서 공제한다. 제46조(채권 등에 대한 소득금액의 계산 특례) ① 거주자가 제16조제1항제1호ㆍ제2호ㆍ제5호 및 제6호에 해당하는 채권 또는 증권과 타인에게 양도가 가능한 증권으로서 대통령령으로 정하는 것(이하 이 조, 제133조의2 및 제156조의3에서 “채권등”이라 한다)의 발행법인으로부터 해당 채권등에서 발생하는 이자 또는 할인액(이하 이 조, 제133조의2 및 제156조의3에서 “이자등”이라 한다)을 지급[전환사채의 주식전환, 교환사채의 주식교환 및 신주인수권부사채의 신주인수권행사(신주 발행대금을 해당 신주인수권부사채로 납입하는 경우만 해당한다) 및 「자본시장과 금융투자업에 관한 법률」 제4조제7항제3호ㆍ제3호의2 및 제3호의3에 해당하는 채권등이 주식으로 전환ㆍ상환되는 경우를 포함한다. 이하 같다]받거나 해당 채권등을 매도(증여ㆍ변제 및 출자 등으로 채권등의 소유권 또는 이자소득의 수급권의 변동이 있는 경우와 매도를 위탁하거나 중개 또는 알선시키는 경우를 포함하되, 환매조건부채권매매거래 등 대통령령으로 정하는 경우는 제외한다. 이하 제133조의2에서 같다)하는 경우에는 거주자에게 그 보유기간별로 귀속되는 이자등 상당액을 해당 거주자의 제16조에 따른 이자소득으로 보아 소득금액을 계산한다. ② 제1항을 적용할 때 해당 거주자가 해당 채권등을 보유한 기간을 대통령령으로 정하는 바에 따라 입증하지 못하는 경우에는 제133조의2제1항에 따른 원천징수기간의 이자등 상당액이 해당 거주자에게 귀속되는 것으로 보아 소득금액을 계산한다. ③ 제1항 및 제2항에 따른 이자등 상당액의 계산방법과 그 밖에 필요한 사항은 대통령령으로 정한다. 제46조의2(중도 해지로 인한 이자소득금액 계산의 특례) 종합소득과세표준 확정신고 후 예금 또는 신탁계약의 중도 해지로 이미 지난 과세기간에 속하는 이자소득금액이 감액된 경우 그 중도 해지일이 속하는 과세기간의 종합소득금액에 포함된 이자소득금액에서 그 감액된 이자소득금액을 뺄 수 있다. 다만, 「국세기본법」 제45조의2에 따라 과세표준 및 세액의 경정(更正)을 청구한 경우에는 그러하지 아니하다. 제5관 근로소득공제ㆍ연금소득공제 및 퇴직소득공제 제47조(근로소득공제) ①근로소득이 있는 거주자에 대해서는 해당 과세기간에 받는 총급여액에서 다음의 금액을 공제한다. 다만, 공제액이 2천만원을 초과하는 경우에는 2천만원을 공제한다. - 500만원 이하 : 총 급여액 * 0.7 - 500만원 초과 ~ 1500만원 이하 : 150만원 + 0.4 * 총 급여액 - 1500만원 초과 ~ 4500만원 이하 : 525만원 + 0.15 * 총 급여액 - 4500만원 초과 ~ 1억원 이하 : 975만원 + 0.05 * 총 급여액 - 1억원 초과 : 1455만원 + 0.02 * 총 급여액 ② 일용근로자에 대한 공제액은 제1항에도 불구하고 1일 15만원으로 한다. ③ 근로소득이 있는 거주자의 해당 과세기간의 총급여액이 제1항 또는 제2항의 공제액에 미달하는 경우에는 그 총급여액을 공제액으로 한다. ④ 제1항부터 제3항까지의 규정에 따른 공제를 “근로소득공제”라 한다. ⑤ 제1항의 경우에 2인 이상으로부터 근로소득을 받는 사람(일용근로자는 제외한다)에 대하여는 그 근로소득의 합계액을 총급여액으로 하여 제1항에 따라 계산한 근로소득공제액을 총급여액에서 공제한다. 제47조의2(연금소득공제) ①연금소득이 있는 거주자에 대해서는 해당 과세기간에 받은 총연금액(분리과세연금소득은 제외하며, 이하 이 항에서 같다)에서 다음 표에 규정된 금액을 공제한다. 다만, 공제액이 900만원을 초과하는 경우에는 900만원을 공제한다. - 350만원 이하 : 총연금액 - 350만원 초과 ~ 700만원 이하 : 350만원 + (350만원을 초과하는 금액 * 0.4) - 700만원 초과 ~ 1400만원 이하 : 490만원 + (700만원을 초과하는 금액 * 0.2) - 1400만원 초과 : 630만원 + (1400만원을 초과하는 금액 * 0.1) ② 제1항에 따른 공제를 “연금소득공제”라 한다. 제48조(퇴직소득공제) ① 퇴직소득이 있는 거주자에 대해서는 해당 과세기간의 퇴직소득금액에서 제1호의 구분에 따른 금액을 공제하고, 그 금액을 근속연수(1년 미만의 기간이 있는 경우에는 이를 1년으로 보며, 제22조제1항제1호의 경우에는 대통령령으로 정하는 방법에 따라 계산한 연수를 말한다. 이하 같다)로 나누고 12를 곱한 후의 금액(이하 이 항에서 “환산급여”라 한다)에서 제2호의 구분에 따른 금액을 공제한다. 1. 근속연수에 따라 정한 다음의 금액 - 5년 이하 : 100만원 * 근속연수 - 5년 초과 ~ 10년 이하 : 500만원 + 200만원 * (근속연수 – 5년) - 10년 초과 ~ 20년 이하 : 1500만원 + 250만원 * (근속연수 – 10년) - 20년 초과 : 4000만원 + 300만원 * (근속연수 – 20년) 2. 환산급여에 따라 정한 다음의 금액 - 8백만원 이하 : 환산급여의 100퍼센트 - 8백만원 초과 ~ 7천만원 이하 : 8백만원 + (8백만원 초과분 * 0.6) - 7천만원 초과 ~ 1억원 이하 : 4520만원 + (7천만원 초과분 * 0.55) - 1억원 초과 ~ 3억원 이하 : 6170만원 + (1억원 초과분 * 0.45) - 3억원 초과 : 1억 5170만원 + (3억원 초과분 * 0.35) ② 해당 과세기간의 퇴직소득금액이 제1항제1호에 따른 공제금액에 미달하는 경우에는 그 퇴직소득금액을 공제액으로 한다. ③ 제1항과 제2항에 따른 공제를 “퇴직소득공제”라 한다. ④ 퇴직소득공제의 계산 방법에 관하여 필요한 사항은 대통령령으로 정한다. 제6관 종합소득공제 제50조(기본공제) ① 종합소득이 있는 거주자(자연인만 해당한다)에 대해서는 다음 각 호의 어느 하나에 해당하는 사람의 수에 1명당 연 150만원을 곱하여 계산한 금액을 그 거주자의 해당 과세기간의 종합소득금액에서 공제한다. 1. 해당 거주자 2. 거주자의 배우자로서 해당 과세기간의 소득금액이 없거나 해당 과세기간의 소득금액 합계액이 100만원 이하인 사람(총급여액 500만원 이하의 근로소득만 있는 배우자를 포함한다) 3. 거주자(그 배우자를 포함한다. 이하 이 호에서 같다)와 생계를 같이 하는 다음 각 목의 어느 하나에 해당하는 부양가족(제51조제1항제2호의 장애인에 해당되는 경우에는 나이의 제한을 받지 아니한다)으로서 해당 과세기간의 소득금액 합계액이 100만원 이하인 사람(총급여액 500만원 이하의 근로소득만 있는 부양가족을 포함한다) 가. 거주자의 직계존속(직계존속이 재혼한 경우에는 그 배우자로서 대통령령으로 정하는 사람을 포함한다)으로서 60세 이상인 사람 나. 거주자의 직계비속으로서 대통령령으로 정하는 사람과 대통령령으로 정하는 동거 입양자(이하 “입양자”라 한다)로서 20세 이하인 사람. 이 경우 해당 직계비속 또는 입양자와 그 배우자가 모두 제51조제1항제2호에 따른 장애인에 해당하는 경우에는 그 배우자를 포함한다. 다. 거주자의 형제자매로서 20세 이하 또는 60세 이상인 사람 라. 「국민기초생활 보장법」에 따른 수급권자 중 대통령령으로 정하는 사람 마. 「아동복지법」에 따른 가정위탁을 받아 양육하는 아동으로서 대통령령으로 정하는 사람(이하 “위탁아동”이라 한다) ② 제1항에 따른 공제를 “기본공제”라 한다. ③ 거주자의 배우자 또는 부양가족이 다른 거주자의 부양가족에 해당되는 경우에는 대통령령으로 정하는 바에 따라 이를 어느 한 거주자의 종합소득금액에서 공제한다. 제51조(추가공제) ① 제50조에 따른 기본공제대상이 되는 사람(이하 “기본공제대상자”라 한다)이 다음 각 호의 어느 하나에 해당하는 경우에는 거주자의 해당 과세기간 종합소득금액에서 기본공제 외에 각 호별로 정해진 금액을 추가로 공제한다. 다만, 제3호와 제6호에 모두 해당되는 경우에는 제6호를 적용한다. 1. 70세 이상인 사람(이하 “경로우대자”라 한다)의 경우 1명당 연 100만원 2. 대통령령으로 정하는 장애인(이하 “장애인”이라 한다)인 경우 1명당 연 200만원 3. 해당 거주자(해당 과세기간에 종합소득과세표준을 계산할 때 합산하는 종합소득금액이 3천만원 이하인 거주자로 한정한다)가 배우자가 없는 여성으로서 제50조제1항제3호에 따른 부양가족이 있는 세대주이거나 배우자가 있는 여성인 경우 연 50만원 6. 해당 거주자가 배우자가 없는 사람으로서 기본공제대상자인 직계비속 또는 입양자가 있는 경우 연 100만원 ② 제1항에 따른 공제를 “추가공제”라 한다. ③ 기본공제와 추가공제를 “인적공제”라 한다. ④ 인적공제의 합계액이 종합소득금액을 초과하는 경우 그 초과하는 공제액은 없는 것으로 한다. 위의 소득세법을 "postProcess": true, "alpha": -100, "segCnt": -1, "postProcessMaxSize": 400, "postProcessMinSize": 200, 의 파라미터를 준 후 문장 나누기를 할 경우 ['⑤ 제1항과 제3항에 따라 결손금 및 이월결손금을 공제할 때 제62조에 따라 세액 계산을 하는 경우 제14조에 따라 종합과세되는 배당소득 또는 이자소득이 있으면 그 배당소득 또는 이자소득 중 원천징수세율을 적용받는 부분은 결손금 또는 이월결손금의 공제대상에서 제외하며, 그 배당소득 또는 이자소득 중 기본세율을 적용받는 부분에 대해서는 사업자가 그 소득금액의 범위에서 공제 여부 및 공제금액을 결정할 수 있다.', '⑥ 제1항과 제2항에 따라 결손금 및 이월결손금을 공제할 때 해당 과세기간에 결손금이 발생하고 이월결손금이 있는 경우에는 그 과세기간의 결손금을 먼저 소득금액에서 공제한다.', '제46조(채권 등에 대한 소득금액의 계산 특례) ① 거주자가 제16조제1항제1호ㆍ제2호ㆍ제5호 및 제6호에 해당하는 채권 또는 증권과 타인에게 양도가 가능한 증권으로서 대통령령으로 정하는 것(이하 이 조, 제133조의2 및 제156조의3에서 “채권등”이라 한다)의 발행법인으로부터 해당 채권등에서 발생하는 이자 또는 할인액(이하 이 조, 제133조의2 및 제156조의3에서 “이자등”이라 한다)을 지급[전환사채의 주식전환, 교환사채의 주식교환 및 신주인수권부사채의 신주인수권행사(신주 발행대금을 해당 신주인수권부사채로 납입하는 경우만 해당한다) 및 「자본시장과 금융투자업에 관한 법률」 제4조제7항제3호ㆍ제3호의2 및 제3호의3에 해당하는 채권등이 주식으로 전환ㆍ상환되는 경우를 포함한다.', '이하 같다]받거나 해당 채권등을 매도(증여ㆍ변제 및 출자 등으로 채권등의 소유권 또는 이자소득의 수급권의 변동이 있는 경우와 매도를 위탁하거나 중개 또는 알선시키는 경우를 포함하되, 환매조건부채권매매거래 등 대통령령으로 정하는 경우는 제외한다.', '이하 제133조의2에서 같다)하는 경우에는 거주자에게 그 보유기간별로 귀속되는 이자등 상당액을 해당 거주자의 제16조에 따른 이자소득으로 보아 소득금액을 계산한다.', '② 제1항을 적용할 때 해당 거주자가 해당 채권등을 보유한 기간을 대통령령으로 정하는 바에 따라 입증하지 못하는 경우에는 제133조의2제1항에 따른 원천징수기간의 이자등 상당액이 해당 거주자에게 귀속되는 것으로 보아 소득금액을 계산한다.', '③ 제1항 및 제2항에 따른 이자등 상당액의 계산방법과 그 밖에 필요한 사항은 대통령령으로 정한다.'] 와 같이 Max Size를 넘어가는 문장을 확인할 수 있었습니다. 혹시 이러한 경우도 파라미터 등을 이용해서 최대 길이를 강력하게 제한할 수 있는 방법이 있을까요? 그리고 혹시 한문단 내에서 문장을 ' ', ' ' 등으로 나누는 것을 없앨 수 있는 방법이 있을까요? 링크 복사 다른 사이트에 공유하기 More sharing options...
CLOVA Studio 운영자9 Posted February 8 공유하기 Posted February 8 안녕하세요 @데이터 빅님, 우선 전달주신 예시에서 문단 나누기 API의 postProcess 모듈에 버그가 있는 것을 확인했습니다. 내부적으로 원인 등 확인하여 알려드릴 수 있도록 하겠습니다. 다만 설 연휴로 인해 해결이 늦어질 수 있는 점 미리 양해 부탁드립니다. 일단 현재 시도해볼 수 있는 방법은 alpha 값을 바꾸는 것인데요. 전달주신 예시의 경우 alpha 값을 1.0 이상으로 설정할 경우 보다 짧은 길이로 문단이 나뉘는 것을 확인했습니다. (다만 여전히 최대 길이 설정을 넘는 문단이 발생할 수 있습니다.) 문단 내 문장 구분 기능의 경우 현재 제외 설정을 할 수 없으나, 향후 개선 시 해당 기능 반영할 수 있도록 고려하겠습니다. 감사합니다. 1 링크 복사 다른 사이트에 공유하기 More sharing options...
Recommended Posts
게시글 및 댓글을 작성하려면 로그인 해주세요.
로그인