2026年2月5日

日报：Claude Opus 4.6 与 Trajectory 质量研究 — 2026年2月5日

Claude 发布专业法律模块的一点观察与个人研究记录

今天，Claude 正式发布了一个面向律所及法律专业领域的高级模块。
这一消息在资本市场层面引发了不小的震动，甚至被认为是当日美股下跌的重要诱因之一。
从侧面也能看出，大模型对传统高利润、强专业壁垒行业的冲击，已经开始被市场认真对待。

在这一背景下，我也第一时间尝试了 Claude 新推出的模型 —— Opus 4.6。

从个人使用体验来看，Opus 4.6 的整体表现非常亮眼，尤其是在以下方面：

我尝试与它讨论了一个偏研究向、偏工程实践的课题，并在多轮交互中逐步收敛出了一份相对可行、且成本可控的研究方案。

该研究主要围绕当前代码智能体（Code Agent）领域中一个被频繁忽视、但极其关键的问题展开 —— trajectory 数据的质量。

对 OpenHands 中产生的大规模 trajectory 数据进行系统性的质量评估与筛选。

在后续的记录中，我也会一并附上这份由 Claude 协助生成并反复迭代后的训练计划，作为该研究的具体执行方案。

某种意义上，这次体验让我更加确信：
大模型已经不只是“写代码的工具”，而正在逐步成为可以参与研究设计本身的协作者。