日报:Perplexity 评测启动与投稿方向讨论 — 2026年2月21日
进展概况
近几天进展有所停滞,但上次修改后的方案已经持续推进。
评测进展
目前已在 GPU 上启动了 Perplexity 评估任务,过程中遇到了若干技术问题:
- 显存溢出:运行评估时出现 OOM 错误
- 文件管理问题:PEFT 文件未及时清理
- 结果被覆盖:baseline 与 exp1 的数据不幸被覆盖,需后续补跑
- 脚本报错:部分脚本运行时出现异常
目前仅整理出 exp2 和 exp3 的有效结果。
后续计划
后续评测仍在进行中,若进展顺利,预计明早仅剩最后几组实验。按原计划,今晚将暂停评测,明天继续推进。
论文投稿方向
今天查阅了 ICIC 的投稿要求,对论文的创新性是否达到该会议标准存在一定疑虑,后续可能考虑转投层级更合适的会议。
此问题暂不作最终决定,当前首要目标仍是完成论文本身。受限于实验条件与经费,本文更多定位为本人向 AI 领域转型的一次探索性尝试,同时也希望借此弥补此前论文未能发表的遗憾。
附件
附截图为当前阶段性 Perplexity 评测结果,数据有限,供参考。
