CLOVA Studio 운영자 Posted May 26, 2023 공유하기 Posted May 26, 2023 바쁘다 바빠 현대사회! 대부분 사람들은 이와 유사한 경험을 한 적이 있을 것입니다. 길고 복잡한 글이나 문서를 읽어야 하지만 시간이 부족한 경우 말이죠. 만약 긴 글을 간략하게 요약해서 파악할 수 있다면 어떨까요? 아마 더 많은 문서를 이전보다 빠르게 훑어볼 수 있어 업무 생산성을 높일 수 있을 것입니다. 오늘은 요약 API를 소개해 드리겠습니다. 이 API는 하이퍼클로바 언어 모델을 기반으로 문서에서 핵심 내용을 추출하여 요약문을 생성할 수 있습니다. 이 기능을 활용함으로써, 기업은 대량의 문서를 빠르게 분석할 수 있으며, 사용자는 여러 뉴스나 기사를 빠르게 습득할 수 있습니다. 또한 교육 분야에서는 핵심 내용을 강조하여 학생들이 쉽게 이해할 수 있도록 활용할 수 있습니다. 그뿐만 아니라, 요약 기능은 수 많은 문서를 손쉽게 처리할 수 있어 리서치 시간을 획기적으로 줄여줄 것입니다. 이전에는 몇 시간을 소비하여 문서를 훑어봐야 했지만, 요약 API를 활용하면 수 시간을 아낄 수 있을 것입니다. 요약 API 활용하기 사용법은 매우 간단합니다. 클로바 스튜디오의 익스플로러 메뉴에서 ‘요약’ API를 선택하고, 테스트 앱 생성을 생성한 후, curl과 python 코드를 활용하여 요약을 요청하는 방식입니다. ▼ 요청 바디에는 요약할 글을 입력하면, API는 핵심 내용을 추출하고 요약된 결과를 반환합니다. 문단을/주제/단위로/구분하기 요약 API는 긴 분량의 문서에서 문단을 나누면서 요약을 수행합니다. ▼ 긴 분량의 문서를 주제 단위로 단락을 구분해주고, 각각의 단락을 요약함으로써 긴 문서도 요약이 가능한 것이죠. ▼ 문장 간 유사도를 계산하여 주제 단위로 단락을 구분합니다. 이때, 문단을 나누는 데 필요한 설정값도 지원됩니다. 예를 들어, SegCount 설정값은 문단을 나눌 개수를 조절할 수 있습니다. SegCount 값을 -1로 설정하면, 모델이 자동으로 문단 나누기를 수행합니다. 또한, segMaxSize와 segMinSize를 이용하여 한 단락 안에 포함할 글자 수를 제어할 수 있습니다. 이러한 설정값을 적절히 활용하면, 요약문 분량을 제어할 수 있기도 합니다. 문단을 나누면서 요약을 수행하기 때문에 문서의 뒷부분이 요약에서 누락되지 않습니다. ▼ 요약의 결과를 살펴볼까요? 문서의 전반적인 주요 내용을 골고루 담고 있는걸 볼 수 있죠. 이전에는 생성 모델이 원문에 없는 내용을 추출하거나 왜곡하는 등의 문제가 있었지만, 하이퍼클로바 요약 모델은 원문을 근거로 추출하도록 학습되어, 원문에 없는 내용이 발생하는 경우가 크게 줄어들었습니다. 이렇게 활용해보시는 건 어때요? ▼ 회의록의 내용을 파악하여 핵심 요약 결과를 생성할 수 있습니다. ▼ 이메일에서도 중요한 내용을 추려서 쉽게 파악할 수 있습니다. 우리는 웹 환경에서 시간을 많이 소비하고 있습니다. 하이퍼클로바의 요약 API는 이러한 시간 소비 부분을 획기적으로 줄여줄 것입니다. 앞으로 요약 API가 다양한 방법으로 우리들의 업무 생산성을 향상할 수 있기를 기대해 봅니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
Recommended Posts
게시글 및 댓글을 작성하려면 로그인 해주세요.
로그인