35去重后的唯一论文
3方向:Model Merge / Persona / LoRA-Vector
2023-2026覆盖从 task vector 到 steering theory 的演进
1共同问题:目标能力增强与非目标漂移权衡
二维平面思维导图
点击节点可更新论文详情总脉络:TIES/DARE 解决权重合并干扰;Persona Vectors/PERSONA 把行为特质表示成可加减方向;Weight Arithmetic、Activation Shifts、Implicit Low-Rank 与 Steer2Edit 把“权重更新”和“激活 steering”重新接在一起。
跨领域学习路径
按问题目标而不是文件夹分组先理解合并干扰
TIES、DARE、PCB 给出冗余、符号冲突、参数竞争这些基本概念,是后续 LoRA 合并和 personality vector 合并的底座。
再看 LoRA 几何
KnOTS、Core、TARA、Pico、Implicit Low-Rank 解释为什么低秩空间、A/B 因子和 QK/VO 通路不能混为一谈。
连接 persona 控制
Persona Vectors、PERSONA、NPTI、Trait Interference 说明人格控制的目标得分和 off-target drift 必须同时评测。
最后看统一与编辑
Weight Arithmetic、Activation Shifts、Why Steering Works、Steer2Edit 把 activation direction 转成权重空间、组件级或动态权重更新视角。
3D 动态知识图谱
拖动节点可单独移动;拖空白处旋转;滚轮缩放每个节点都显示论文名;如果文字重叠,直接拖动对应节点把它移开。重置视角会清空手动移动的位置。
论文库
Cloudflare 版只包含这个单 HTML,不上传 PDF,因此不会触发 Direct Upload 的单文件 25MB 限制。