2026年3月13日

日报：ICIC 论文定稿 · 实验结果可视化完成 — 2026年3月13日

论文定稿

今天终于把论文写完了。用于投稿 ICIC 的论文版本已经生成，经过了几天的修改和格式排版，我准备在这两天就正式投稿了，希望一切能够顺利吧。

整篇论文围绕 数据筛选策略对 SWE-agent LoRA 微调效果的影响 展开，核心实验结果已全部跑完并写入正文。下面是论文中几个关键结果的截图：

论文第12页：假设验证与 Scaling 分析结果

论文中最重要的几个结论：

ResolvedOnly 筛选（仅保留 resolved 的轨迹）相比全量随机采样，在 500 条规模下差异不显著。说明单纯的”是否解决”二元筛选并不足以显著提升微调质量。

TopQ-500 vs BottomQ-500 的 sanity check 显示出统计显著的质量差异，验证了 composite score 评分体系的有效性。评分排序确实能区分出”好数据”和”坏数据”。

这是本研究中最稳健的发现。将训练集规模从 500 翻倍到 1000 后，三种策略均呈现出高度一致的 ~12.7% 相对 loss 下降，绝对 loss 降幅约 Δ ≈ −0.060，是 500 条规模下质量筛选效果（Δ ≈ −0.003）的约 26 倍。

策略	Loss @500	Loss @1000	Δ Loss	相对降幅
Random	0.4737	0.4140	−0.0597	12.6%
TopQ	0.4704	0.4106	−0.0598	12.7%
ResolvedOnly	0.4786	0.4175	−0.0611	12.8%