Preguntas frecuentes
Diferencias entre los diferentes modelos de AIGC
Actualmente, clasificamos los modelos en tres categorías según sus funcionalidades: modelos de texto, modelos de imagen y modelos de audio, que corresponden a la generación de contenido textual, visual y auditivo, respectivamente.
¿Qué son los modelos base?
Las diferencias entre diferentes modelos radican en sus pesos y estructuras de red. Si dos modelos tienen la misma estructura de red pero diferentes pesos, pertenecen al mismo modelo base. Para modelos de ajuste fino ligeros como LoRA, solo son compatibles dentro del mismo modelo base.
Subir resultados previos del modelo
Para facilitar la visualización del rendimiento del modelo, requerimos que se envíen los resultados previos del modelo al cargarlo.
Modelos de generación de imágenes
Si utiliza stable-diffusion-webui, por defecto, las imágenes generadas incluirán metadatos sobre los parámetros utilizados para generar la imagen.
Modelos de generación de texto
Debe cargar una captura de pantalla del texto generado, que convertiremos en texto mediante OCR. Sin embargo, si hay otra información en la imagen que interfiere con el texto, el resultado puede no ser preciso y puede requerir una entrada manual de su parte.
Modelos de generación de audio
Debe cargar el archivo de audio generado.