안녕하세요 여러분! 오늘은 엔비디아에서 개발 중인 획기적인 이미지 생성 모델인 “산하”를 소개해 드리겠습니다.
산하 모델은 고해상도 이미지를 빠르게 생성하는 데 초점을 맞춘 새로운 AI 모델입니다. 기존 디퓨전 트랜스포머가 아니라 리니어 디퓨전 트랜스포머를 사용하여 생성된 새로운 모델입니다.
엔비디아 랩스, MIT, 칭화대가 공동 개발한 산하 모델은 플럭스를 압도할 것으로 기대가 모아지고 있습니다.
주요 특징:
- 딥 컴프레션 오토인코더: 이미지를 32배 압축하여 빠른 이미지 생성을 가능하게 합니다.
- 리니어 DI 메커니즘: 고해상도 이미지 처리의 복잡성을 줄여 빠른 생성 속도를 제공합니다.
- L&M 텍스트 인코더: 텍스트 2 이미지의 프롬프트 능력을 향상시킵니다.
- 플로우 DPM 솔버와 스케줄러: 샘플링 속도를 크게 높여 명확한 이미지를 빠르게 생성합니다.
성능 비교:
산하 모델은 플럭스와 SD 모델과 비교하여 10배 이상의 성능을 제공합니다. 초당 이미지 생성 샘플 수와 이미지 생성 속도는 플럭스보다 훨씬 우수합니다.
이미지 생성 영상:
산하 모델의 빠른 이미지 생성 속도를 확인할 수 있는 영상은 다음과 같습니다.
[[이미지 생성 영상 영상 링크]]
기대되는 영향:
산하 모델은 영상 생성 분야에 혁명을 일으킬 것으로 예상됩니다. 이미지 생성의 속도가 크게 향상되면 영상 생성에도 이러한 이점이 확장될 수 있기 때문입니다.