数据后处理

在预处理阶段获得的 JSON 元数据文件也用于后处理:Ludwig 模型会返回输出预测,并根据其数据类型将其映射回原始数据。

数值和时间序列不需要额外的转换,它们直接从模型返回,保持原样。

类别、集合、序列和文本特征在模型中表示为整数。这些预测使用 JSON 文件中的 idx2str 映射回原始的 token / 名称。

运行 experimentpredict 的用户会找到多个预测结果文件:1) 每个输出对应的 CSV 文件,包含映射后的预测结果;2) 一个概率 CSV 文件,包含该预测结果的概率;3) 一个包含所有候选项概率的 CSV 文件(例如,对于类别特征,包含所有类别的概率)。

用户还会以 NPY 文件的形式获得来自模型的原始、未映射的预测结果。如果不需要这些文件,用户可以使用 --skip_save_unprocessed_output 参数。