safety - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Safety Alignment 的拒答率：平衡安全性与有用性的边界各位朋友，大家好。今天我们来探讨一个在大型语言模型（LLM）领域至关重要且极具挑战性的问题：Safety Alignment 的拒答率，以及如何平衡安全性与有用性之间的微妙关系。随着 LLM 性能的飞速提升，它们在各个领域的应用也日益广泛。然而，与此同时，我们也必须正视 LLM 可能带来的安全风险，例如生成有害信息、传播虚假信息、甚至被用于恶意目的。Safety Alignment 的目标就是确保 LLM 在提供强大功能的同时，也能遵守道德规范、尊重社会价值观，并最大程度地降低潜在风险。拒答率，作为 Safety Alignment 的一个重要指标，指的是 LLM 拒绝回答用户请求的比例。一个合理的拒答率能够在一定程度上保护用户和模型本身，但过高的拒答率则会严重损害 LLM 的可用性和实用性。因此，如何在安全性与有用性之间找到最佳平衡点，是当前 LLM 研究人员面临的关键挑战。一、理解 Safety Alignment 与拒答率 Safety Alignment 的核心在于训练 LLM 识别并避免生成有害或不适 …

继续阅读“Safety Alignment的拒答率（Refusal Rate）：平衡安全性与有用性（Helpfulness）的边界”

WebAssembly 安全漫谈：内存安全与沙箱逃逸的那些事儿大家好，我是你们今天的安全漫谈主讲人，咱们今天不搞虚的，直接上干货，聊聊 WebAssembly (Wasm) 的安全问题，特别是内存安全和沙箱逃逸。Wasm 号称安全，但安全不代表绝对安全，只要是代码，就可能存在漏洞。 1. Wasm 安全基石：内存安全模型 Wasm 的核心安全特性之一就是它的内存安全模型。想象一下，Wasm 程序的内存就像一个巨大的数组，Wasm 代码只能通过 load 和 store 指令来访问这个数组中的数据。这种方式避免了像 C/C++ 那样可以直接操作指针带来的风险。 1.1 线性内存（Linear Memory）： Wasm 的线性内存是一块连续的、可增长的内存区域。所有 Wasm 模块共享同一块线性内存，但它们只能通过模块内部定义的 memory 实例来访问。 1.2 内存访问控制：边界检查（Bounds Checking）：每次 load 和 store 指令执行时，Wasm 虚拟机都会检查访问的地址是否超出线性内存的边界。如果超出，就会抛出一个 trap (相当于异常)，阻止非法访 …

继续阅读“分析 `WebAssembly` `Memory Safety` 和 `Sandbox Bypass` 的潜在漏洞。”