Jump to content

intube

Members
  • 게시글

    1
  • 첫 방문

  • 최근 방문

Everything posted by intube

  1. 안녕하세요. 텍스트와 이미지를 함께 처리할 수 있는 멀티모달 모델 관련하여 몇 가지 문의드리고자 합니다. 현재는 Clova Studio를 구독 중입니다. 1. NAVER HyperCLOVA Vision 모델이 이미지 입력을 지원하는 것으로 알고 있는데요, 현재 해당 모델을 외부에서 사용할 수 있는 공개 API가 있는지 궁금합니다. 혹시 사용할 수 있는 방법이 있다면 안내 부탁 드리겠습니다. 2. HCX-003 및 HCX-DASH-001 모델은 텍스트 전용 모델로 알고 있습니다. 혹시 이 모델들에서도 이미지 분석이 가능한지, 또는 멀티모달 입력을 처리할 수 있는 기능이 있는지도 함께 확인 부탁드립니다. 3. 이 외에 이미지 입력을 지원하는 멀티모달 모델이 있다면, 현재 API를 통해 사용 가능한지 여부도 알려주시면 감사하겠습니다. 현재 텍스트와 이미지를 함께 분석할 수 있는 멀티모달 API가 필요한 상황이라, 정확한 지원 여부 및 사용 가능 경로에 대해 확인해주시면 큰 도움이 될 것 같습니다. 감사합니다.
×
×
  • Create New...