무료로 사용할 수 있는 생성형 AI 중에 stable diffusion web 이라는 것이 있다.
할 수 있는 것
- txt2img: 텍스트 입력에 해당하는 이미지 생성
- img2img: 이미지를 입력으로 넣고 요청에 따라 변형된 이미지 생성
- LoRA 학습된 목적에 맞는 생성형 모델 사용 가능
설치는 아래의 github 주소로 들어가서 Installation and Running 부분의 내용을 각자 OS에 맞게 그대로 따르면 됨
github 주소: https://github.com/AUTOMATIC1111/stable-diffusion-webui
나는 linux(ubuntu)라서 아래 순서를 따름
1. Install the dependencies
# Debian-based:
sudo apt install wget git python3 python3-venv libgl1 libglib2.0-0
# Red Hat-based:
sudo dnf install wget git python3 gperftools-libs libglvnd-glx
# openSUSE-based:
sudo zypper install wget git python3 libtcmalloc4 libglvnd
# Arch-based:
sudo pacman -S wget git python3
2. git clone
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
3. 설치된 폴더에서 webui.sh 실행
{webui.sh파일 있는 경로에서} ./webui.sh
4. stable diffusion web 사용
인터넷 창이 켜지면서 아래와 같은 창이 뜰 것인데, 각자 목적에 맞게 사용하면 됨
기본적으로 prompt에는 원하는 내용, negative prompt에는 원하지 않는 내용을 영어 단어로 나열하면 됨.
예시)
prompt: A highly detailed 3D anime character, cel-shading with soft lighting, realistic depth, smooth skin texture, dynamic shadows, volumetic
또한, 여러 parameter 값을 조절해서 이미지를 생성할 수 있는데, 각 parameter가 어떤 값인지는 마우스를 가져다 대면 설명이 있으니 그 설명을 보고 조절하면 됨
LoRA 사용법
LoRA란 원하는 목적에 맞게 생성형 모델을 추가로 학습시키는 fine-tuning 학습법임
기존에는 원하는 대로 생성되지 않던 생성형 모델을, 이 학습법을 통해 학습시켜 원하는 생성형 스타일에 맞게 특화시킬 수 있음
예를 들어, 기존에는 잘 못했던 2D 캐릭터 이미지를 3D 캐릭터 이미지로 바꾼다거나, 유화 스타일로 이미지를 생성하는 등의 작업에 특화된 모델을 만들 수 있음.
이 LoRA 학습법을 이용하여 user가 원하는 작업을 잘 하는 생성형 모델을 가질 수 있음. 이 모델은 자신이 학습시켜도 되고, 다른 사람이 만들어 놓은 것들을 사용해도 됨.
이 방법에 대해서는 google에 "stable diffusion web lora" 라고 검색하면 많은 방법들이 나옴.
'기타' 카테고리의 다른 글
ubuntu에서 blender 설치 (0) | 2025.01.13 |
---|---|
npy 파일 읽기 & pickle 에러 해결 (0) | 2024.05.21 |
Git hub 연결 (ssh 사용) (0) | 2024.01.20 |
"헤더를 기다리는 중입니다" error 발생 시 (0) | 2024.01.20 |
Ubuntu 22.04 NVIDIA driver 설치 (0) | 2024.01.20 |