openai-core/com.aallam.openai.api.finetune/HyperParams

HyperParams

@Serializable

data class HyperParams( val batchSize: Int? = null, val learningRateMultiplier: Double? = null, val nEpochs: Long, val promptLossWeight: Double, val computeClassificationMetrics: Boolean? = null, val classificationNClasses: Int? = null, val classificationPositiveClass: String? = null)

Fine-Tune hyper parameters.

Constructors

HyperParams

constructor( batchSize: Int? = null, learningRateMultiplier: Double? = null, nEpochs: Long, promptLossWeight: Double, computeClassificationMetrics: Boolean? = null, classificationNClasses: Int? = null, classificationPositiveClass: String? = null)

Properties

batchSize

@SerialName(value = "batch_size")

val batchSize: Int? = null

The batch size to use for training. The batch size is the number of training examples used to train a single forward and backward pass.

classificationNClasses

@SerialName(value = "classification_n_classes")

val classificationNClasses: Int? = null

The number of classes in a classification task.

classificationPositiveClass

@SerialName(value = "classification_positive_class")

val classificationPositiveClass: String? = null

The positive class in binary classification. This parameter is needed to generate precision, recall, and F1 metrics when doing binary classification.

computeClassificationMetrics

@SerialName(value = "compute_classification_metrics")

val computeClassificationMetrics: Boolean? = null

If set, we calculate classification-specific metrics such as accuracy and F-1 score using the validation set at the end of every epoch. These metrics can be viewed in the results file.

learningRateMultiplier

@SerialName(value = "learning_rate_multiplier")

val learningRateMultiplier: Double? = null

The learning rate multiplier to use for training. The fine-tuning learning rate is the original learning rate used for pretraining multiplied by this value.

nEpochs

@SerialName(value = "n_epochs")

val nEpochs: Long

The number of epochs to train the model for. An epoch refers to one full cycle through the training dataset.

promptLossWeight

@SerialName(value = "prompt_loss_weight")

val promptLossWeight: Double

The weight to use for loss on the prompt tokens. This controls how much the model tries to learn to generate the prompt (as compared to the completion which always has a weight of 1.0), and can add a stabilizing effect to training when completions are short.