Jump to content

시간을 달리는 하이퍼클로바


CLOVA Studio 관리자2

Recommended Posts

안녕하세요. CLOVA Studio 입니다. 😁
 
초대규모 AI, 하이퍼클로바 언어모델에게는 부족한 점이 하나 있어요.
바로 시의성입니다.
 
그도 그럴것이 하이퍼클로바 언어모델 학습에 이용된 데이터는 바로 학습을 한 시점까지의 데이터라는 점이죠.
그래서 최신성을 유지하기가 어렵습니다.
그리고 하이퍼클로바 언어모델은 시간에 대한 기준이 없다보니,
작업을 하다보면 "어라? 이건 요즘 최신 정보가 아닌데?" 싶을때가 있어요.
 
오늘은 시간에 대해서 몇가지 실험을 해보겠습니다!
 
0a710ba9-7e47-1064-817e-9f072e680ffc.thumb.png.07ca20047c9de08ed8d31bc0cce05c8b.png
 
▼하이퍼클로바 언어모델의 최신성을 테스트 하기 위해 음악 차트 검색기를 만들어 봤습니다.
최근 몇년 사이의 대표곡들을 예제로 넣어두고요.
0a710dbd-7e47-1e04-817e-9f3161c87f0e.png.c8382a2fd02111fdc56037c9ab5382da.png
 
▼2021년을 검색 해보았습니다.
2021년 10월까지의 정보는 커버하는 듯 합니다.
2022년 1월의 경우 당연하게도 하이퍼클로바 언어모델이 답을 내지 못했습니다.
0a710ba9-7e47-1064-817e-9eea5e7b7a53.png.33e656654676a770270700031d374490.png
 
'하이퍼클로바 언어모델은 2021년말 이후 발생한 이벤트에 대한 지식이 부족하다'는 점 숙지해두세요.
만약 만들고자 하는 작업이 특정 시점의 정보를 정확히 알아야하는 경우라면,
저희가 준비중인 '튜닝'이라는 서비스를 통해서 원하는 데이터를 직접 학습시키는 방법이 있습니다.
 
잠깐! 여기서 그냥 넘어갈 제가 아니죠.
이왕 시작한거 잠시 시간 여행을 다녀올까요?
0a710ba9-7e47-1064-817e-9ef3a42f7cf4.png.8e5709fc3ad189fc82b9576f1666d884.png
 
▼1930년을 입력하니, 이난영, 남인수의 히트곡이 출력됩니다.
1800년대까지 가봤습니다! 1829년의 오페라가 나오네요.
삼국시대라고 하니 기원전 17년의 '황조가'가 출력됩니다...! 덜덜
0a710ba9-7e47-1064-817e-9ef9e8100587.png.9cffd35ab4b92a224873745a0628ceb1.png
 
0a710ba9-7e47-1064-817e-9f0a6aac12e2.jpg.35da6a2586be9e6e9d2158fbb8f755cf.jpg
 
▼ 좋아! 기원전 1000년까지 가보자고! 😵💫
0a710ba9-7e47-1064-817e-9eff0e6a05a2.png.84900866888b4b1144a36bbbe037395e.png
 
0a710ba9-7e47-1064-817e-9f00c171073f.jpg.fd71a0368ed8621c7bddcda25ddfcacd.jpg
 
클로바에게 특정 연도를 입력하면, 그 연도를 인식하면서 대화를 할 수 있을까요?
 
▼ 1988년도라고 가정하고 프롬프트를 작성해보았습니다.
우리나라에서 가장 높은 건물이 뭐냐고 물었더니, '63빌딩'이라고 답했습니다.
0a710ba9-7e47-1064-817e-9f0dd20912f9.png.f100768a89b219c169d4722dbcb38c40.png
 
▼ 같은 조건에서 2020년이라고만 바꾸고 다시 물어볼까요?
'롯데월드타워'라고 답하네요.
(참고로 이 작업은 몇 턴 내에서만 유효하고, "잠실에서는 뭐가 높은데?"처럼 유도하면 프롬프트의 연도를 따르지 않습니다.)
0a710ba9-7e47-1064-817e-9f0dd20912f8.png.31ac1593dd414657c7768f6b6a17acf5.png
 
연도는 정확성이 떨어지고, 오답을 낼 가능성이 크니까 생성 모델에는 적합하지 않은 듯 합니다.
그러면 약간은 두리뭉실하게 계절로 정의하면 어떨까요?
 
▼ 계절은 가을이라고 지시문을 작성하고, 주말에 입을 옷을 물어보았습니다.
가을엔 바람이 많이 부니 '트렌치 코트'를 입으라고 추천하네요.
0a710ba9-7e47-1064-817e-9f14345e46dd.thumb.png.fa88c6d6198d3c4ac13cc7bdd902a0d6.png
 
▼ 여름이라고 정의해두었더니, 날씨가 더우니 '흰색 티셔츠'를 입으라고 합니다.
흰색 티셔츠...우리 클로바...코디 좀 배워야겠어요...
0a710ba9-7e47-1064-817e-9f14345f46de.thumb.png.42397c2806fd824b34b1866c96480e61.png
 
 
이 실험은 우리에게 어떤 의미가 있을까요?
 
다음은 카드 문구를 작성해주는 예제입니다.
그런데 모델이 출력한 생성 결과 중에서는 계절에 어울리지 않는 카드 문구가 생성이 되는 경우가 있었습니다.
 
▼ 예를들면, 현재는 겨울인데 '날씨가 너무 덥더라'라는 문구가 생성된 것이죠.
0a710ba9-7e47-1064-817e-9f1c595d6c4b.thumb.png.e4729ad8eba1e9f9e35f0435528fd30d.png
 
▼ 이 문제는 계절을 입력하는 것만으로도, 크게 개선할 수 있었다고 합니다.
0a710ba9-7e47-1064-817e-9f23a7e828c8.thumb.png.e3709372115ae6ba5080a37af6e14066.png
 
▼ 이렇게 크리스마스, 발렌타인 데이 처럼 시즌을 입력하는 것도 가능합니다.
0a710ba9-7e47-1064-817e-9f25c706305c.thumb.png.933229b019dde8d2371cf98ad28abdd2.png
 
계절, 시즌을 입력하는 것만으로도 성능이 향상될 수 있다는 사실, 놀랍지 않나요?
 
여기까지 하이퍼클로바의 시간 여행이었습니다.
시간을 다루는 법을 익혀 작업 성능을 더 높혀보세요!
 
0a710ba9-7e47-1064-817e-9f2b165947cc.jpg.7869da56353d30f084bc7ffbf6996c07.jpg
링크 복사
다른 사이트에 공유하기

게시글 및 댓글을 작성하려면 로그인 해주세요.



로그인
×
×
  • Create New...