Skip to Main Content

Preguntas frecuentes

Diferencias entre los diferentes modelos de AIGC

Actualmente, clasificamos los modelos en tres categorías según sus funcionalidades: modelos de texto, modelos de imagen y modelos de audio, que corresponden a la generación de contenido textual, visual y auditivo, respectivamente.

¿Qué son los modelos base?

Las diferencias entre diferentes modelos radican en sus pesos y estructuras de red. Si dos modelos tienen la misma estructura de red pero diferentes pesos, pertenecen al mismo modelo base. Para modelos de ajuste fino ligeros como LoRA, solo son compatibles dentro del mismo modelo base.

Subir resultados previos del modelo

Para facilitar la visualización del rendimiento del modelo, requerimos que se envíen los resultados previos del modelo al cargarlo.

Modelos de generación de imágenes

Si utiliza stable-diffusion-webui, por defecto, las imágenes generadas incluirán metadatos sobre los parámetros utilizados para generar la imagen.

Modelos de generación de texto

Debe cargar una captura de pantalla del texto generado, que convertiremos en texto mediante OCR. Sin embargo, si hay otra información en la imagen que interfiere con el texto, el resultado puede no ser preciso y puede requerir una entrada manual de su parte.

Modelos de generación de audio

Debe cargar el archivo de audio generado.