三色标记垃圾回收

dalang · · 215 次点击 · · 开始浏览

--- ### **一、三色标记法的基本逻辑** 1. **颜色定义** • **黑色**：对象及其所有引用均被扫描完成，视为安全存活。 • **灰色**：对象本身被扫描，但至少存在一个未处理的引用。 • **白色**：未被扫描，默认不可达（需回收）。 2. **标记流程** 从 GC Roots 出发，按灰色集合的广度优先遍历逐步扩散，最终未被染黑的对象（白色）即为垃圾。 --- ### **二、漏标问题的触发条件** 漏标问题的发生需同时满足以下两个条件： 1. **条件一**：黑色对象新增指向白色对象的引用（如 `黑色对象B → 白色对象D`）。 2. **条件二**：所有灰色对象在完成自身扫描前删除了对同一白色对象的引用（如 `灰色对象C → 白色对象D` 被删除）。 **示例场景**： • **初始状态**：灰色对象 C 引用白色对象 D，黑色对象 B 未引用 D。 • **用户线程操作**： 1. 删除 C 对 D 的引用（条件二成立）； 2. 新增 B 对 D 的引用（条件一成立）。 • **结果**：D 因未被任何灰色对象引用，且 B 已为黑色不再扫描，导致 D 被误标为垃圾。 --- ### **三、破坏条件二如何避免漏标** **核心逻辑**：若破坏条件二（即保留至少一个灰色对象对白色对象的引用），则白色对象仍可通过灰色对象的扫描被标记为存活。 **实现方式**：通过 **原始快照（SATB）** 机制： 1. **写前屏障（Pre-Write Barrier）** • 当灰色对象 C 删除对白色对象 D 的引用时，屏障会记录删除前的引用关系（即 C→D 的快照）。 • 即使 C 的引用被删除，D 仍被视为与灰色对象关联，后续标记阶段会重新处理这些记录。 2. **重新标记阶段** • 基于记录的旧引用关系，以灰色对象 C 为根重新扫描，确保 D 被标记为灰色，最终染黑。 **示例修正**： • 用户线程删除 C→D 时，SATB 记录 C→D 的旧引用。 • 重新标记阶段，即使 C 已变为黑色，系统仍会检查记录的旧引用，将 D 标记为灰色并继续处理其引用链，避免 D 被漏标。 --- ### **四、与增量更新的对比** | **方案** | **破坏条件** | **实现方式** | **特点** | |----------------|-------------|-----------------------------------------------------------------------------|-------------------------------------------------------------------------| | **原始快照** | 条件二 | 记录删除前的引用关系，重新标记时基于快照扫描 | 可能产生浮动垃圾（多标），但避免漏标，适合高吞吐场景（如 G1） | | **增量更新** | 条件一 | 记录新增的引用关系，重新标记时以黑色对象为根扫描 | 需额外扫描新增引用，可能增加 STW 时间，适合低延迟场景（如 CMS） | --- ### **五、设计意义** • **安全性与性能的平衡**：破坏条件二通过保留旧引用快照，以少量浮动垃圾为代价，避免程序因对象误删崩溃。 • **并发效率**：SATB 通过写屏障仅记录关键操作，避免了全局暂停，适合大规模堆内存的并发回收。 --- ### **总结** 破坏条件二的核心在于 **保留灰色对象删除前的引用快照**，使白色对象仍能通过历史关联被重新扫描。这种设计通过原始快照机制实现了并发标记的安全性，是 G1 等现代垃圾回收器高可靠性的基石。 --- ### **一、三色标记法的必要性** 三色标记法通过颜色状态管理对象可达性，解决了并发标记中的**对象消失**（漏标）和**浮动垃圾**（多标）问题。其核心机制包括： 1. **颜色边界控制**：通过黑色（已扫描完成）、灰色（部分扫描）、白色（未扫描）的状态划分，确保标记过程的原子性。 2. **屏障技术**：结合**写屏障**（如增量更新或原始快照）记录对象引用变化，避免并发操作破坏标记的正确性。 **关键作用**：三色标记法简化了并发标记的协调逻辑，是当前主流垃圾回收器（如G1、CMS、Go GC）实现并发的技术基础。 --- ### **二、替代方案的可行性分析** #### **1. 传统标记-清除算法** • **问题**：传统标记-清除算法需全程STW（Stop-The-World），无法与程序并发执行。若强行并发，用户线程修改对象引用时会导致对象丢失或误删。 • **局限性**：无状态标记机制，无法跟踪对象引用的动态变化。 #### **2. 引用计数法** • **原理**：通过对象引用计数器管理存活状态，无需显式标记阶段。 • **并发可行性**： • **优点**：引用增减可异步执行，理论上允许并发。 • **缺点**： ◦ **循环引用问题**：需额外机制（如弱引用）打破循环，否则内存无法回收。 ◦ **原子性开销**：计数器增减需原子操作，高频修改时性能损耗大。 #### **3. 分代式回收** • **原理**：将堆划分为新生代和老年代，通过局部回收减少全局扫描范围。 • **并发可行性**： • **部分并发**：如CMS的并发标记阶段仍需三色标记法支持。 • **局限性**：分代本身不解决并发标记问题，仍需依赖状态跟踪机制。 #### **4. 增量式回收** • **原理**：将标记阶段拆分为多个小步骤，交替执行GC与用户线程。 • **并发可行性**： • **依赖屏障技术**：需通过内存屏障（如读/写屏障）记录对象引用变化，但实现复杂度高，且仍需类似三色标记的状态划分。 • **实际案例**：Go语言的早期GC尝试过增量式回收，但因效率问题转向三色标记法。 --- ### **三、替代方案的挑战** #### **1. 对象状态跟踪** • 若不使用三色标记，需设计其他状态标识机制（如位图、时间戳等），但可能增加内存开销或计算复杂度。 #### **2. 并发安全性** • 用户线程修改引用时需同步更新标记状态，否则会导致对象误回收（如漏标）。此场景必须通过**写屏障**或**锁机制**实现，而后者会引入竞争开销。 #### **3. 性能与资源权衡** • 引用计数法需维护全局计数器，分代回收需维护记忆集（Remembered Set），这些额外数据结构可能占用10%~20%的堆内存。 --- ### **四、结论** 1. **三色标记法不可替代**：当前技术下，三色标记法是实现高效并发标记的最优解。其通过颜色状态和屏障技术的结合，平衡了并发安全性与性能开销。 2. **替代方案的局限性**：其他方法（如引用计数、增量式回收）虽理论上支持并发，但需额外机制解决对象状态跟踪问题，实际实现复杂度与资源消耗更高，难以替代三色标记法。 **总结**：若强制不使用三色标记法，需设计全新的对象状态管理机制和屏障策略，但现有研究和工业实践尚未发现更优方案。三色标记法仍是垃圾回收并发标记的“黄金标准”。

215 次点击

加入收藏微博

收入我的专栏

上一篇：数字先锋 | 如何提升工业园区算力服务，天翼云息壤给出答案！

下一篇：SPI JDNI与双亲委派模型

计数法

线程

垃

圾

0 回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

三色标记垃圾回收

用户登录

今日阅读排行

一周阅读排行

三色标记垃圾回收

用户登录

今日阅读排行

一周阅读排行

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏