跳到正文

模型类型

顶层参数 model_type 用于指定要使用的模型类型。

支持以下模型类型:

  • ecd (默认): 编码器-组合器-解码器神经网络模型。
  • llm: 用于文本生成的大型语言模型。
  • gbm: 基于树的梯度提升机模型。
model_type: ecd

每种模型类型都关联有相应的训练器。有关每种模型类型支持的训练算法的详细信息,请参阅训练器部分。

模型类型:ECD

有关编码器-组合器-解码器深度学习架构的详细信息,请参阅 ECD 文档

注意

ecd 模型类型支持 Ludwig 的所有功能。

模型类型:LLM

LLM 模型类型是用于文本生成的大型语言模型。Llama-2 等大型语言模型也可以在 ECD 模型类型中用作 文本编码器,但在 ECD 中,语言模型头部会被移除,以便将隐藏状态(嵌入)用作输出。相比之下,LLM 模型类型保留了 LM 头部,该头部用于生成 token。

LLM 模型类型支持 HuggingFace Hub 中的所有预训练 HuggingFace 因果语言模型。

注意

选择 llm 模型类型会引入以下限制:

  • (目前)仅支持单个文本输入和文本输出特征
  • combiner 部分将被忽略

模型类型:GBM

GBM 模型类型是梯度提升机 (GBM) 树模型。它是使用受支持的树学习器训练的树模型。目前,唯一受支持的树学习器是 LightGBM。

注意

选择 gbm 模型类型会引入以下限制:

  • 仅支持二元、类别和数值特征
  • 仅支持单个输出特征
  • combiner 部分将被忽略