2026年2月15日

日报：LoRA 微调测试与 baseline 参数确认 — 2026年2月15日

今天对 LoRA 微调模型进行了测试，但过程并不顺利。

由于在 config 中只设置了基础模型的部分参数，而未完整配置推理相关参数，导致：

问题主要来源于评测端对于超时以及最大输出长度未做限制。

随后重新测试了一个已知具有通过率的基线模型，并对不同 temperature 参数进行了对比：

结果如下：

因此，后续评测将统一采用 temperature = 0.3 作为当前实验基准。

目前仍然对实验结果存在一定担忧。

但今天至少完成了：

即使暂时没有突破性的结果，实验仍在稳步前进。