Stable Diffusion webUI를 돌리려면 스펙이 얼마나 좋아야 할까? : 클리앙


한줄요약 : 그래픽카드가 3060 이상이라면 colab보단 nvme 용량을 비우고 SDwebUI로 운용하는것이 훨씬 편하다.


요새 Stable Diffusion (이하 SD)이 여기저기서 난리입니다.

보통은 colab이나 huggingface에서 시작하는데 어렵고,를돌리려면스펙이얼마나좋아야할까클리앙 많이 느리고, 조금만 사용해도 API 제한에 걸리기도 합니다.

그래서 PC 성능이 여유가 되는 사람은 SD webUI로 넘어가게 되는데요.


어느정도 성능이 되야 만족스러운 성능을 내는지 체크해봤습니다.


1. 그래픽카드

그래픽카드는 일본의 위키에서 집단지성의 힘으로 벤치마크 데이터를 수집하고 있습니다.

로컬 PC 사양 상담 - NovelAI 5ch 위키 (seesaawiki.jp) 

물론 4090이 좋지만 (9초대) 3060으로도 충분히 타협 가능한 결과(37초대)를 보여줍니다.

학습도 하려면 스펙이 좋아야 하지만, 잘 만든 체크포인트를 가져다 쓰는게 시간도 줄이고 결과도 보장 할 수 있다고 봅니다.

다만 엔비디아 이외 제품은 추천하지 않습니다.


2. 램

학습 용도가 아니라면 16gb정도로도 충분하다고 봅니다.

다다익램입니다. 요새 램값도 싸졌으니 32GB로 스타트 해보시기 바랍니다.  (스페어 램을 고점에서 샀는데 반토막이 났습니다..)


3. CPU

생각보다 중요도가 높습니다.

동일스펙에서  i7-10700K는 30초, i9-12900K는 23초로 7초 차이 납니다.


4. 저장공간

체크포인트 하나가 4gb에서 많게는 10gb까지 먹습니다. 용량을 아끼려고 정밀도를 줄인 모델을 쓰기도 하는데요. 결과물에서 차이가 꽤 느껴집니다.

용량이 부족하다보니 HDD에서 돌려볼까도 싶어서.. 테스트 해봤습니다.

980pro는 속도저하가 없는 편이고, SN750 SE는 특정 용량 이상이면 속도가 급격히 떨어집니다.

체크포인트 로딩하는 시간과 이미지 5개 만드는 시간을 재봤는데요.

이미지 생성엔 큰 차이가 없었습니다. 다만 체크포인트 부를때 차이가 있는데요, 체크포인트 로딩뿐만이 아닌 프로그램 전체 로딩에 영향을 끼치기 때문에 차이는 더 크다고 보시면 됩니다. 읽기 속도에 비례해서 로딩 속도가 차이가 납니다. HDD는 사용 불가 수준입니다. 램이 넉넉하다면 체크포인트를 램에 프리로드 하는 방법도 있는데 모델 3개만 불러도 300초 가량 되고 램은 20GB 정도 먹힙니다.

저장공간은 DRAM 있는 좋은 스펙의 nvme를 강력 권장합니다.

?? ?? 2023-02-13 233646.jpg



아무거나질문