Generación de imágenes de difusión estable
"En 2022, el rey de la pintura, Hilde Leon, quien poseía color, imaginación y creatividad, y quien era dueño de todo el mundo de la pintura, encendió la pasión de todos los artistas con sus últimas palabras antes de la ejecución. '¿Desean mi arte? Si es así, se los daré todo. ¡Embarquen en el viaje de la pintura! Incrustaré toda mi inspiración en ese lienzo interminable.'"
Proporcionamos una aplicación en línea de generación de imágenes de difusión estable para que se familiarice con todo el proceso de generación de imágenes.
Genera tu primera imagen
Por favor, abra la página de experiencia en línea, ingrese la descripción de la imagen que desea en la primera posición, como un lindo gatito, una nave espacial, un iPhone, etc. Puede ingresar en cualquier idioma que prefiera, y lo traduciremos automáticamente al inglés.
Luego, haga clic en el botón "Generar imagen" debajo y espere de 2s ~ 7s. La imagen aparecerá en el área de visualización a la derecha.
🎉 Felicidades, has generado tu primera imagen.
Ejemplos
Puede ingresar algunos otros textos y hacer algunos intentos aleatorios. Si desea alguna inspiración, puede encontrar algunos ejemplos en la parte inferior de la página.
Haga clic en estos ejemplos, luego haga clic en el botón "Generar imagen", y puede ver los resultados de algunos otros ejemplos. Actualmente, solo proporcionamos ejemplos en inglés.
Proceso de generación de imágenes
Tomando esta aplicación como ejemplo, presentaremos todo el proceso de generación de imágenes.
El lado izquierdo de la herramienta de generación de imágenes completa se utiliza para controlar varios parámetros de generación de imágenes. En el caso más simple, solo necesita ingresar la descripción de la imagen que desea en el primer cuadro de texto.
Parámetros de control para la generación de imágenes
Las funciones de controlar varios parámetros para la generación de imágenes son las siguientes:
Parámetro | Función |
---|---|
Prompt | Descripción de la imagen que desea generar |
Negative Prompt | Contenido que no desea que aparezca en la imagen |
Ancho y alto de la imagen | El ancho y alto de la imagen generada. Por lo general, cuanto mayor sea el tamaño de la imagen, más tiempo tomará generar la imagen. |
Semilla aleatoria | Valor aleatorio. Si desea generar diferentes imágenes en el mismo prompt, puede ajustar este valor para que la imagen generada sea diferente a la anterior. |
Sampler | Diferentes samplers tienen diferentes velocidades y efectos. DPMSolverMultistep es el sampler por defecto, que logra un buen equilibrio entre el efecto y la velocidad. También puede usar otros samplers para probar. |
Pasos de muestreo | El número de pasos que toma el sampler. Cuando este valor es demasiado bajo, la imagen generada tendrá un gran número de bloques de color. Cuando es demasiado alto, la velocidad de generación de la imagen disminuirá. Recomendamos usar 20 para DPMSolverMultistep. |
También hay una configuración de parámetros avanzada.
Este parámetro se utiliza para controlar el grado del efecto del prompt. Cuanto mayor sea el valor, más cerca estará la imagen del prompt dado. Un valor demasiado alto hará que el modelo no pueda expandir su imaginación, y un valor demasiado bajo hará que el modelo ignore su prompt.
Resumen
La calidad general de generación de imágenes del modelo de difusión no es particularmente alta, y a menudo requiere múltiples ajustes de prompts y negative prompts para lograr mejores resultados.
En comparación con los servicios SaaS totalmente alojados como Midjourney, la ventaja del modelo de difusión es que es más conveniente para la personalización. El efecto de la difusión estable personalizada será mejor que Midjourney en campos específicos. Por lo tanto, si la calidad actual de la imagen no es alta, no se desanime. En los siguientes documentos, presentaremos métodos de uso más avanzados y utilizaremos otras herramientas para generar mejores imágenes.