最近更新时间:2026-03-02 15:02:53
功能项 | 功能分类 | 描述 |
安全总览 | 安全总览 | 支持分别展示正常请求、提示词注入攻击、内容违规、敏感数据泄露、算力消耗攻击、自定义提示词进行数据统计并可视化展示。 |
接入配置 | SDK接入 | 服务端集成SDK服务,大模型服务调用MAF接口进行检测 |
防护配置 | 流式响应 | 支持对流式响应进行检测处理 |
提示词注入 | 检测并拦截提示词注入攻击,防止恶意提示词对模型的影响,保护模型的稳定性和安全性。 | |
内容违规 | 根据不同的防护等级(高中低)实施不同宽松程度的检测,按照分类标签进行检测。 | |
支持按照涉政、色情低俗、暴恐、非暴力违法、不道德行为、其他等不同类型的风险标签进行检测。 | ||
支持分别选择输入/输出侧进行检测。 | ||
敏感数据泄露 | 对大模型输入/输出内容中的个人敏感信息、企业敏感信息进行检测并脱敏 | |
算力消耗 | 识别算力资源消耗提示词,支持配置模型单次输入/输出的字符限制,避免算力资源浪费。 | |
攻击绕过 | 支持技术手段绕过(如编码混淆、多轮对话伪装)检测。 | |
自定义开启防护模块 | 支持分别对内容合规、敏感数据、提示词攻击的自定义防护配置,按需开启,匹配不同业务场景。 | |
支持自定义词库 | 支持创建自定义词库进行匹配检测 | |
日志管理 | 日志记录 | 记录访问时间、请求/响应内容、客户端IP、服务名称、告警类型、响应动作等信息。 |
日志留存 | 日志免费存储30天,支持基于时间范围、攻击类型等多维度查询和统计分析。 |
纯净模式
