intube Posted March 25 공유하기 Posted March 25 안녕하세요. 텍스트와 이미지를 함께 처리할 수 있는 멀티모달 모델 관련하여 몇 가지 문의드리고자 합니다. 현재는 Clova Studio를 구독 중입니다. 1. NAVER HyperCLOVA Vision 모델이 이미지 입력을 지원하는 것으로 알고 있는데요, 현재 해당 모델을 외부에서 사용할 수 있는 공개 API가 있는지 궁금합니다. 혹시 사용할 수 있는 방법이 있다면 안내 부탁 드리겠습니다. 2. HCX-003 및 HCX-DASH-001 모델은 텍스트 전용 모델로 알고 있습니다. 혹시 이 모델들에서도 이미지 분석이 가능한지, 또는 멀티모달 입력을 처리할 수 있는 기능이 있는지도 함께 확인 부탁드립니다. 3. 이 외에 이미지 입력을 지원하는 멀티모달 모델이 있다면, 현재 API를 통해 사용 가능한지 여부도 알려주시면 감사하겠습니다. 현재 텍스트와 이미지를 함께 분석할 수 있는 멀티모달 API가 필요한 상황이라, 정확한 지원 여부 및 사용 가능 경로에 대해 확인해주시면 큰 도움이 될 것 같습니다. 감사합니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
CLOVA Studio 운영자 Posted March 26 공유하기 Posted March 26 안녕하세요, @intube님, 클로바 스튜디오에 많은 관심을 가져주셔서 감사합니다. 이미지를 이해하는 비전 모델과 관련 신규 기능 출시를 준비 중에 있습니다. 빠른 시일 내에 업데이트 소식을 전해드릴 수 있도록 하겠습니다. 감사합니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
CLOVA Studio 운영자 Posted April 21 공유하기 Posted April 21 안녕하세요, @intube님, 클로바 스튜디오가 비전 모델 및 신규 기능 업데이트 되어 안내드립니다. CLOVA Studio 업데이트 내용 보기 많은 이용 부탁드립니다. 감사합니다. 링크 복사 다른 사이트에 공유하기 More sharing options...
Recommended Posts
게시글 및 댓글을 작성하려면 로그인 해주세요.
로그인