Unified LoRA / Persona / Steering Knowledge Base

LoRA、Persona Vector、Steering 统一论文知识库

合并三个文件夹内的 35 篇唯一论文:模型/LoRA 合并、人格向量控制、LoRA-vector 理论与权重 steering。页面重点理清年份、方法递进、共同目标、评测方式,以及每篇论文的算法步骤。

35去重后的唯一论文
3方向:Model Merge / Persona / LoRA-Vector
2023-2026覆盖从 task vector 到 steering theory 的演进
1共同问题:目标能力增强与非目标漂移权衡

二维平面思维导图

点击节点可更新论文详情
总脉络:TIES/DARE 解决权重合并干扰;Persona Vectors/PERSONA 把行为特质表示成可加减方向;Weight Arithmetic、Activation Shifts、Implicit Low-Rank 与 Steer2Edit 把“权重更新”和“激活 steering”重新接在一起。

跨领域学习路径

按问题目标而不是文件夹分组

先理解合并干扰

TIES、DARE、PCB 给出冗余、符号冲突、参数竞争这些基本概念,是后续 LoRA 合并和 personality vector 合并的底座。

再看 LoRA 几何

KnOTS、Core、TARA、Pico、Implicit Low-Rank 解释为什么低秩空间、A/B 因子和 QK/VO 通路不能混为一谈。

连接 persona 控制

Persona Vectors、PERSONA、NPTI、Trait Interference 说明人格控制的目标得分和 off-target drift 必须同时评测。

最后看统一与编辑

Weight Arithmetic、Activation Shifts、Why Steering Works、Steer2Edit 把 activation direction 转成权重空间、组件级或动态权重更新视角。

3D 动态知识图谱

拖动节点可单独移动;拖空白处旋转;滚轮缩放
每个节点都显示论文名;如果文字重叠,直接拖动对应节点把它移开。重置视角会清空手动移动的位置。

论文库

Cloudflare 版只包含这个单 HTML,不上传 PDF,因此不会触发 Direct Upload 的单文件 25MB 限制。