ニュース

「Stable Diffusion 3.5」がGeForce RTXシリーズで2倍高速化・VRAM使用量40%削減

TensorRTとFP8で最適化されたモデルが研究・非商用であれば無料公開

「Stable Diffusion 3.5」がGeForce RTXシリーズで2倍高速化・VRAM使用量40%削減

 米Stability AIは6月13日、「Stable Diffusion 3.5」をNVIDIA GeForce RTXシリーズのGPUに最適化したモデルを公開した。Stability AI Community Licenseに従い研究・非商用または年間収益が100万ドル以下であれば無償で利用可能。現在、ウェイトはHugging Face、ソースはGitHubからダウンロードできる。

 最適化はNVIDIAと連携し、TensorRTとFP8を使用して行われ、品質を維持しながらモデルサイズを縮小。NVIDIA GeForce RTX 50/40シリーズや、NVIDIA BlackwellおよびAda Lovelace世代のプロフェッショナル向けNVIDIA RTXを搭載したPCでより効率的に動作する。PyTorchとBF16を使用したモデルと比較して最大2.3倍の高速化、ビデオメモリ(VRAM)使用量の最大40%削減を実現しているとのこと。

PyTorchとBF16を使用したモデルと比較して最大2.3倍高速化

 最適化されたモデルは、「Stable Diffusion 3.5 Large」と「Stable Diffusion 3.5 Medium」が用意されており、「Stable Diffusion 3.5 Large」でも11GBのVRAMで動作する。従来は19GBのVRAMが必要とされており、一般的なGPUで動作させるのはむずかしかったが、最適化モデルであれば動作させることも可能だろう。