日报:Perplexity 评测启动与投稿方向讨论 — 2026年2月21日


进展概况

近几天进展有所停滞,但上次修改后的方案已经持续推进。


评测进展

目前已在 GPU 上启动了 Perplexity 评估任务,过程中遇到了若干技术问题:

  • 显存溢出:运行评估时出现 OOM 错误
  • 文件管理问题:PEFT 文件未及时清理
  • 结果被覆盖:baseline 与 exp1 的数据不幸被覆盖,需后续补跑
  • 脚本报错:部分脚本运行时出现异常

目前仅整理出 exp2exp3 的有效结果。


后续计划

后续评测仍在进行中,若进展顺利,预计明早仅剩最后几组实验。按原计划,今晚将暂停评测,明天继续推进。


论文投稿方向

今天查阅了 ICIC 的投稿要求,对论文的创新性是否达到该会议标准存在一定疑虑,后续可能考虑转投层级更合适的会议。

此问题暂不作最终决定,当前首要目标仍是完成论文本身。受限于实验条件与经费,本文更多定位为本人向 AI 领域转型的一次探索性尝试,同时也希望借此弥补此前论文未能发表的遗憾。


附件

附截图为当前阶段性 Perplexity 评测结果,数据有限,供参考。

Perplexity 评测结果截图(exp2 与 exp3)