Skip to Main Content

Введение в настройку модели

"Настройка моделей - это конечная тайна алхимии." Легендарный алхимик Идар Алхимия написал в "Руководстве по алхимии"

Введение в настройку модели

Что такое настройка модели?

Давайте сначала рассмотрим несколько реальных сценариев.

  1. Предположим, вы любите определенную знаменитость и хотите, чтобы модель генерировала их фотографии. Как вы скажете модели, что вы хотите сгенерировать фотографии этой конкретной знаменитости?
  2. Предположим, вы хотите, чтобы чат-бот играл в ролевую игру с вами, а чат-бот играл в роли кошечки. Во время разговора вы начинаете испытывать чувства к этой кошечке, но когда вы начинаете новый контекст разговора и хотите, чтобы чат-бот снова играл за эту кошечку, стиль и личность чат-бота заметно отличаются от предыдущего разговора. Как вы можете обеспечить согласованность стиля и личности чат-бота?
  3. Ваш друг X умер, и вы хотите, чтобы чат-бот притворялся им и общался с вами. Чтобы сделать чат-бота как можно более похожим на X, вы предоставляете ему сложные настройки фона. Однако из-за того, что настройки фона слишком длинные, чат-бот часто забывает предыдущий разговор из-за длины контекста разговора. Как вы можете решить эту проблему?

Проблемы, с которыми сталкиваются в этих трех сценариях, нельзя решить простыми изменениями входных данных модели (также известных как подсказки). Проблемы включают в себя:

  1. Возможно, невозможно точно описать желаемый сгенерированный контент с помощью естественного языка.

    Например, когда речь идет о лицах, даже если мы скажем модели, что у знаменитости большие глаза, высокий носовой мостик, черные волосы и т.д., модель все равно не сможет точно определить, какого человека мы хотим сгенерировать. Мы не можем точно описать лицо человека естественным языком.

  2. Простые описания естественного языка не могут гарантировать стабильность сгенерированного контента моделью.

    Например, в сценарии ролевой игры мы говорим чат-боту, что ему нужно играть определенный персонаж. Даже если мы описываем стиль речи или личность персонажа через текст, ответы чат-бота все равно будут отличаться от наших настроек в нескольких играх и разговорах.

    Простые текстовые ограничения на генерацию модели обычно имеют низкую точность, и мы не можем точно описать человека через простой текст.

  3. Простые текстовые ограничения на модель могут привести к слишком коротким разговорам из-за длины ограничивающего текста.

    Чтобы улучшить точность через ограничения естественного языка, необходимы более длинные ограничения естественного языка. Чем длиннее ограничение естественного языка, тем больше места для контекста диалога оно занимает, что приводит к слишком короткому разговору на самом деле.

Когда простые корректировки входных данных не могут решить эти проблемы, необходимы техники настройки модели.

Настройка модели относится к переобучению существующей модели на определенных данных, чтобы сделать модель более подходящей для определенного сценария.

Например, проблемы, с которыми сталкиваются в вышеуказанных сценариях, могут быть решены через настройку модели.

  1. Возможно, невозможно точно описать желаемый сгенерированный контент с помощью естественного языка.

    Поскольку мы не можем описать лицо знаменитости на языке, мы можем использовать их фотографии, чтобы сообщить модели, какого человека мы хотим сгенерировать.

    Сначала мы собираем 10-40 четких фотографий лица знаменитости в Интернете, а затем настраиваем модель на эти фотографии. После настройки мы можем использовать настроенную модель для генерации фотографий этой знаменитости.

  2. Простые описания естественного языка не могут гарантировать стабильность сгенерированного контента моделью.

    Сначала нам нужно собрать данные чата кошечки, которую мы любили раньше, и найти ее стиль общения. Если предыдущих данных разговора недостаточно, мы можем позволить чат-боту напрямую генерировать несколько языков, которые имитируют этот стиль, а затем выбрать подходящий текст. Затем мы настраиваем модель на этот текст, и настроенная модель будет выводить текст, который склоняется к стилю настроенных данных.

  3. Простые текстовые ограничения на модель могут привести к слишком коротким разговорам из-за длины ограничивающего текста.

    Сначала мы также должны подготовить некоторые данные друга X, такие как их разговоры в чате и характерный фон. Затем мы настраиваем модель на этот текст, и настроенная модель может прямо общаться в стиле этого персонажа без сложных настроек фона.

В общем, значение настройки моделей заключается в том, чтобы сделать контент, сгенерированный моделью, более настраиваемым.

Когда вам не нужно настраивать модель

Например, если вы хотите указать, что персонажи на изображении все носят белые футболки, или если вы хотите, чтобы чат-бот играл утилитарную роль, то, как правило, в не настроенных сценариях вы можете использовать общую модель без настройки.

Что вам нужно подготовить для настройки модели

Оборудование: компьютер с графической картой Nvidia (если у вас нет такого оборудования, вы можете арендовать онлайн-сервис)

Данные:

  • Для типов изображений вам нужно подготовить некоторые изображения
  • Для типов текста вам нужно подготовить корпус текста
  • Для типов аудио вам нужно подготовить некоторые музыкальные или песенные файлы

Как использовать настроенную модель

Пожалуйста, обратитесь к содержанию обзора использования модели.