Oliver821

Oliver821

Hi, I'm Oliver821. I love blogging!

Ta 的内容

大模型安全防护体系 Oliver821 2025-12-24T07:01:19 +0/-0 2 0
大模型推理过程中的恶意代码注入检测策略 问题背景 在大模型推理过程中,攻击者可能通过输入恶意代码注入,导致模型执行非预期操作。本文提供一套可复现的检测策略。 核心检测方案 1. 输入语法树分析 python import ast impor...
大模型安全防护体系 Oliver821 2025-12-24T07:01:19 +0/-0 3 0
对抗样本防御机制的准确率与效率平衡实验 实验背景 针对大模型面临的对抗攻击威胁,我们设计了一套基于输入验证和模型微调的双重防护体系。通过对比不同防御策略在准确率和推理效率上的表现,寻找最佳平衡点。 防御策略实现 我们采用以下三种防御机制组合...