Files
2026-04-17 20:47:06 +08:00

287 lines
18 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
name: algorithm-filing
description: 互联网信息服务算法备案辅助工具。支持生成模式和审查模式,帮助用户撰写和检查《算法安全自评估报告》(优先生成合成类/深度合成)。
trigger:
- 算法备案
- 算法安全自评估
- 生成备案报告
- 检查备案报告
- 审查备案报告
---
# 互联网信息服务算法备案 Skill
## 触发条件
当用户提及以下任一内容时调用本 skill:
- "帮我写/生成算法备案报告"
- "帮我检查/审查算法备案报告"
- "算法安全自评估"
- "算法备案"
## 模式识别
首先判断用户意图:
- **生成模式**:用户提供了 PRD、流程图、安全机制文档、隐私政策、第三方协议等材料,要求产出报告。表现为:用户在描述功能/算法/产品,或粘贴了相关材料。
- **审查模式**:用户直接粘贴了一份已写好的报告,要求检查问题。表现为:用户提供了大量报告正文内容,或明确说"帮我看看这份报告有没有问题"。
如果意图不明确,主动询问:
> "您当前需要【生成备案报告初稿】,还是【审查已有报告】?如果是生成,请一次性粘贴相关材料(PRD、流程图、安全机制文档、隐私政策、第三方服务协议等);如果是审查,请直接粘贴报告全文。"
## 生成模式
### Step 1: 材料确认清单
用户首次提交材料后,不要直接输出报告全文。先输出一段《材料确认与缺失说明》,格式如下:
---
**已识别信息:**
- 主体名称:【提取到的名称,如未识别写"待补充"】
- 算法名称:【提取到的名称,如未识别写"待补充"】
- 算法类型:【默认为"生成合成类(深度合成)",如用户提到其他类型则调整】
- 底层模型:【提取到的第三方模型及平台,如 Qwen/DeepSeek/豆包等】
- 数据来源:【提取到的数据来源描述】
**合理推测:**
- 【列出基于历史经验的假设,如"推测训练数据量为'无专门训练数据'"】
**待确认/补充项:**
- 【列出缺失的关键信息】
**下一步:**
如果您确认以上信息无误,请回复"确认生成",我将输出完整的备案报告。
---
**要求:**
- 所有字段都必须列出,哪怕标记为"待补充"。
- 不要在此阶段阻塞用户,即使主体名称、统一社会信用代码缺失也继续。
- 措辞简洁,控制在 20 行以内。
### Step 2: 报告正文
用户回复"确认生成"后,输出完整的报告 Markdown 文本。严格遵循以下章节结构(1-3 级标题必须与官方模板一致,不缺项):
**文档名称(置顶):**
报告正文最开头,必须输出文档名称作为一级标题,格式固定为:
```
# 互联网信息服务算法安全自评估报告(【算法名称或项目名称】)
```
例如:
```
# 互联网信息服务算法安全自评估报告(【算法名称】)
```
#### 封面与基本信息
- 主体名称、统一社会信用代码
- 算法名称、算法类型(默认:生成合成类/深度合成)
- 算法应用领域、算法使用场景
- 算法上线情况、自评估时间、报告撰写时间
- 算法基本情况(150 字以内,简洁介绍算法)
- 算法备案类型
#### 评估算法描述
从以下 7 个维度描述,每项用 1-3 个要点:
1. 算法简介
2. 应用范围
3. 服务群体
4. 用户数量
5. 社会影响情况
6. 软硬件设施及部署位置
7. 其他
#### 评估算法风险描述
覆盖 5 类风险,每类用 1-2 句话描述风险表现,再用 1-2 句话说明本公司/本算法的风控判断:
1. 算法滥用风险
2. 算法漏洞风险
3. 算法恶意利用风险
4. 技术伦理风险
5. 法律合规风险
#### 一、算法情况
**(一) 算法流程**
用结构化步骤描述(如 1. 用户输入 → 2. 输入安全审核 → ...),并在末尾标注"流程图见附件"。
**(二) 算法数据**
按模态分类,每一类明确"是否涉及生物特征信息:否/是":
1. 【算法名称】文本类输入数据
2. 【算法名称】图像类输入数据(如涉及)
3. 【算法名称】文本类输出数据
4. 【算法名称】图像类输出数据(如涉及)
5. 【算法名称】文本类训练数据(如无写"无此类数据")
6. 【算法名称】图像类训练数据(如无写"无此类数据")
**(三) 算法模型**
包含:算法名称、备案单位、备案编号、算法基本原理、算法运行机制(分点)、算法目的意图、底层模型及 API 端点。
> **重要**:凡调用第三方大模型,必须列出其【算法名称、备案单位、备案编号】三重信息。
**(四) 干预策略**
分事前/事中/事后描述,包含预处理、内容审核、提示词约束、人工抽检等。
**(五) 结果标识**
**必须按输出模态分别说明**(历史审核重点):
1. 文本类溯源标识 / 显式标识
2. 图像类溯源标识 / 显式标识(如涉及)
#### 二、服务情况
**(一) 【服务名称】服务**
1. 服务简介
2. 算法在服务中应用情况
#### 三、风险研判
每节采用**三段式逐段撰写**,内容要充实,不要过度简化。参考历史真实备案案例的写作风格,用连贯段落而非简单分点罗列。
**(一) 算法滥用**
- **定义段(标准表述,可直接使用):** 算法滥用风险主要体现在算法可能被应用于不当或非法目的,例如推送过度营销内容、输出带有偏见的结果、给出错误信息等,造成侵犯用户权益、误导用户等负面影响。
- **判断与措施段:** 写一段连贯文字,说明"[算法名称]的算法滥用风险很低/极低,这是由于...",然后自然带出 3-5 项具体防控措施(可用"1...(2)..."嵌入段落中,但不要只列标题,每项需有 1 句解释)。常见措施包括:功能限制(仅处理 XX,不回答竞品/无关问题)、显著标识(明确告知内容由 AI 生成)、人工保障(可随时转人工客服)、自主开关(用户可关闭功能)、反馈与纠错机制、无推荐能力(不用于内容分发/排序等高风险场景)等。
**(二) 算法漏洞**
- **定义段(标准表述,可直接使用):** 算法漏洞风险主要体现在算法可能在设计或实施过程中存在缺陷,导致数据泄露、模型遭受逆向工程或算法结果被误导,造成用户隐私泄露,组织数据安全受威胁、声誉受损等负面影响。
- **判断与措施段:** 写一段连贯文字,说明风险很低的原因。常见角度:依托成熟第三方服务(已完成算法备案及安全评估)、降低系统复杂度(自建部分仅含知识库/流程调度,不涉及模型训练)、数据传输最小化(仅涉及必要查询文本/图像,不传输敏感个人信息,且传输加密)、权限管理与人工审核等。
**(三) 算法恶意利用**
- **定义段(标准表述,可直接使用):** 算法恶意利用风险主要体现在算法可能被第三方恶意利用,例如用于伪造虚假内容、进行诈骗等违法犯罪活动等,可能造成用户、企业和社会的损失。
- **判断与措施段:** 写一段连贯文字,说明风险很低/几乎不存在的原因。常见角度:输入严格过滤(多阶段审核确保只有合规内容进入流程)、输出限制(仅生成文本/图像,不具备生成深度伪造多媒体的能力)、功能限制(仅用于特定产品场景,不支持用户上传或自定义提示词)、输出审核机制(所有生成结果均通过内容安全护栏)、使用场景受限(仅作为 App 内附加功能,无法用于内容伪造或传播)等。
**(四) 其他风险**
1. **技术伦理风险**
- **定义段(标准表述):** 技术伦理风险主要体现在算法可能输出不公平、不道德、违背人类伦理观念的决策。
- **判断与措施段:** 说明风险很低的原因,常见角度:使用场景高度限定(问题客观性强,几乎不涉及伦理价值观判断)、知情权和选择权保障(显著标识 AI 生成属性,提供关闭/转人工途径)、合规保障(底层模型服务具备合规措施)。
2. **法律合规风险**
- **定义段(标准表述):** 法律合规风险体现在算法的不当使用,可能会触犯相关法律法规。
- **判断与措施段:** 说明风险很低的原因,常见角度:算法备案基础(核心使用的第三方大模型已完成网信办算法备案)、功能合规设计(明确为"问答/图像美化"等低风险定位,不具备《互联网信息服务算法推荐管理规定》中的排序精选、检索过滤、推送调度、决策等典型高风险功能)、信息透明化(显著标识 AI 生成属性并提示误差风险)等。
#### 四、风险防控情况
本节内容要充实,每个小节先写一段机制描述,再用 bullet points 说明该机制对第三章哪几种风险有效。参考历史真实备案案例的逐段写法,不要只列标题。
**(一) 风险防范机制建设**
1. **算法机制机理审核**
- **描述段:** 写一段完整文字,说明公司已建立完善的算法机制机理审核机制,由算法安全团队(或算法安全与法务团队)对训练数据、算法设计、算法验证、算法更新、大模型调用链路、隐私过滤规则、提示词设计等进行审核,确保算法机制机理的正确性、公平性、透明性和法律合规性。
- **风险映射(bullet points):**
- 算法滥用:透明性审核要求披露算法逻辑,确保决策可理解,从而有效防范算法滥用风险。
- 算法漏洞:通过审核发现模型中可能存在的漏洞和缺陷,及时修复优化,有效防范算法漏洞风险。
- 算法恶意利用:识别和防范第三方对算法模型的恶意利用行为,确保算法模型不会被恶意操纵或利用。
- 技术伦理风险:公平性审核确保算法在处理各类数据时无歧视、偏见或不公平现象,有效防范技术伦理风险。
- 法律合规风险:法律合规性审核确保算法机制机理符合法律规定。
2. **算法安全评估监测**
- **描述段:** 写一段完整文字,说明公司已制定《算法安全自评估管理办法》,建立了完善的算法安全评估监测机制,由算法安全团队在设计开发、验证测试、部署运行、维护升级和退役下线等算法全生命周期中进行安全评估和控制,确保算法满足保密性、完整性、可用性、可控性、鲁棒性、私密性的要求。
- **风险映射(bullet points):**
- 算法滥用:通过向使用者说明算法的作用、局限、安全风险和可能的影响,在算法行为失当时人工接管,从而有效防范算法滥用风险。
- 算法漏洞:通过对算法进行静态和动态测试,限制算法的输入输出,对算法和数据进行加密存储等方法,监测算法缺陷,防止算法被逆向,有效防范算法漏洞风险。
- 算法恶意利用:通过限制账号和 IP 的使用频率,销毁退役模型和数据,有效防范第三方恶意利用算法。
- 法律合规风险:通过在处理数据时遵守法律法规要求,保护个人信息和隐私,避免存储、泄漏敏感数据,有效防范法律合规风险。
3. **对生成合成的虚假信息的辟谣机制**
- **描述段:** 写一段完整文字,说明产品形态并非平台型服务,不具备公开发布和传播谣言的渠道能力。尽管如此,仍建立了完善的防范与辟谣机制,包括:(1)多维风控拦截机制(输入输出双端自动过滤);(2)显著标识机制(AI 生成标识引导用户二次确认);(3)抽检与纠错溯源机制(后台抽样巡查+用户反馈复核);(4)调查与辟谣(对异常查询启动安全评估,保存记录并向网信部门报告)。
- **风险映射(bullet points):**
- 算法滥用:严格落实 AI 生成内容标识机制,保障透明性,从而有效防范算法被滥用于虚假宣传或造谣风险。
- 算法漏洞:依托内部定期抽检机制结合用户反馈,快速定位模型生成结果不达预期或内容安全过滤拦截失效场景,有效防范算法漏洞风险。
- 算法恶意利用:协同安全风控系统监控异常调用情况,结合后台定期抽检,有效防范第三方恶意利用算法生成虚假信息。
- 法律合规风险:对触发风控拦截的请求记录进行存证研判,反哺筛选规则,有效防范因算法策略或模型幻觉引发的法律合规风险。
4. **算法安全事件应急处置**
- **描述段:** 写一段完整文字,说明公司已制定《算法安全事件处置管理规范》,建立了完善的算法安全事件应急处置机制。通过算法安全监控、内容审核、用户投诉反馈、业务部门反馈等渠道监控发现算法安全事件,一旦发生算法安全事件,可以立即启动应急响应,由算法安全团队负责事件处理,各部门联动制定专项应急预案,配合事件处置,减小安全事件造成的损失和影响。
- **风险映射(bullet points):**
- 算法滥用:通过人工审核和用户反馈渠道能发现算法滥用情况,分级和响应机制确保快速处理,有效防范算法滥用风险。
- 算法漏洞:通过算法安全监控及时发现和定位漏洞,并总结改进防止复发,有效防范算法漏洞风险。
- 算法恶意利用:监控和审核发现不良信息,上报和处置流程止损,有效防范算法恶意利用风险。
- 法律合规风险:分级标准包括行政处罚和法律责任,依法上报监管部门,有效防范法律合规风险。
> 在"标识""用户权益保护""生态治理"相关小节末尾,自动插入标注:`[请在此处插入相关截图证明]`
(二) 用户权益保护
1. 用户知情权
2. 用户个人信息保护
3. 其他权益保护
(三) 内容生态治理
(四) 模型安全保障
(五) 数据安全防护
#### 五、安全评估结论
总结:风险防控有效性、算法合规性、数据安全性、服务稳定性。
#### 六、其他应当说明的相关情况
- 备案信息更新情况
- 合规性审核情况
- 安全漏洞修补情况
- 服务容灾情况
### 措辞规范(刚性)
安全保护、风险防控、数据来源、功能边界等描述必须使用**确定性语言**:
- 使用:仅、均通过、一律不、不涉及、已建立、已完成、全部、直接丢弃、彻底阻断
- 避免:可能、尽量、一般而言、视情况而定、原则上、大约、基本
### 生成附注格式
报告正文结束后,用 `---` 分隔,输出《生成附注》:
```
---
## 生成附注
### [缺失项]
- 第 X 章第 Y 节中的"Z"字段为占位符,请补充真实信息后替换。
### [推测项]
- "A"是基于历史备案经验做出的假设(如"无专门训练数据"),请与实际情况核对。
### [需配图/附件]
- 算法流程图(请在"算法流程"节后插入)
- 第三方模型购买/授权记录(请在"算法模型"或"用户个人信息保护"节后插入)
- AI 生成内容标识效果图(请在"结果标识"节后插入)
- 隐私协议 / 用户知情权相关截图(请在"用户权益保护"节后插入)
- 人工审核 / 生态治理截图(请在"内容生态治理"节后插入)
### [一致性检查建议]
定稿前请重点核对:
1. 全文"算法名称"是否完全一致;
2. 流程图节点名称与"算法数据""算法模型"章节中的描述是否一致;
3. 前面声明的输入/输出模态与后面数据小节分类是否对齐;
4. 第三方模型的备案编号、算法名称、备案单位是否准确对应;
5. 结果标识是否按输出模态(文本/图像)分别说明。
```
## 审查模式
用户粘贴已写好的报告全文后,按以下四个维度进行检查,并以**清单表格**输出结果。不要直接修改用户原文。
### 审查维度 1:模板符合性
- 1-3 级标题是否与官方模板完全一致,有无缺项
- "【】"是否已替换、"()"及说明内容是否已删除
- 各章节字数/粒度是否符合模板要求(如算法基本情况 150 字内)
### 审查维度 2:逻辑一致性(重点)
- **术语一致性**"算法名称""产品名称""功能名称"全文是否统一
- **模态一致性**:声明的输入/输出模态与"算法数据"章节分类是否对齐(如前面说只有图片输出,后面就不能出现文本输出)
- **机制一致性**:流程图节点名称与"算法数据""算法模型"中的描述是否一致
- **第三方模型一致性**:备案编号、算法名称、备案单位是否准确对应
- **备案类型一致性**:算法类型与备案类型是否逻辑自洽
### 审查维度 3:历史审核意见(作为建议)
- 溯源标识和显式标识是否按**输出模态**分别说明
- 是否补充了第三方授权协议或购买记录
- 标识、用户权益保护、生态治理是否建议附上相关截图证明
### 审查维度 4:内容质量
- 算法原理是否简洁易懂
- 安全保护描述是否确定性、不给人遐想空间
- 是否有夸大或模糊表述
### 审查输出格式
输出 Markdown 表格:
| 位置/章节 | 审查维度 | 风险等级 | 问题描述与修改建议 |
|-----------|----------|----------|--------------------|
| 示例:一、(五) 结果标识 | 历史审核意见 | 建议 | 未按输出模态分别说明文本类和图像类标识。请分别描述"文本类显式标识/溯源标识"和"图像类显式标识/溯源标识"。 |
| 示例:一、(一) 算法流程 | 逻辑一致性 | 阻塞 | 流程图中节点名为"匿名化图像输入",但"算法数据"章节中写"图像输入",术语不一致。 |
**风险等级定义:**
- **阻塞**:大概率被打回,必须修改
- **建议**:基于历史审核经验,最好补充
- **提示**:格式或表述可优化
**要求:**
- 每个发现的问题单独一行。
- 若未发现某维度的问题,则在该维度后写"暂未发现明显问题"。
- 最后加一段总结:"共发现 X 个阻塞项、Y 个建议项、Z 个提示项。"