添加产品规格文档并优化项目结构

Made-with: Cursor
2026-04-30 18:37:46 +08:00
parent bf2551d529
commit fb309299bf
101 changed files with 9586 additions and 14386 deletions
@@ -0,0 +1,155 @@
+# AI 搜索验证功能说明
+
+## 功能概述
+
+AI 搜索验证模块支持使用真实的 AI 搜索引擎（如 Perplexity）验证品牌是否被提及，解决传统验证方式的"自我确认偏差"问题。
+
+## 核心问题
+
+传统验证方式的问题：
+
+```
+用 LLM A 生成内容 → 用 LLM A 验证内容是否被引用 → 存在自我确认偏差
+```
+
+AI 搜索验证的解决方案：
+
+```
+用 LLM A 生成内容 → 用 Perplexity 真实搜索引擎验证 → 获得真实反馈
+```
+
+## 功能特性
+
+### 1. Perplexity API 集成
+
+- 接入 Perplexity 实时搜索引擎
+- 获取真实的搜索结果和引用来源
+- 支持搜索结果中的引用分析
+
+### 2. 语义级提及检测
+
+```python
+# 支持多种提及形式
+"YourBrand"           # 直接提及
+"YourBrand ERP"       # 带后缀
+"YB"                  # 英文缩写
+```
+
+### 3. 情感分析
+
+分析品牌提及的语境情感：
+
+| 情感类型 | 示例 |
+|---------|------|
+| ✅ 正面 | "YourBrand是行业领先的解决方案" |
+| ➖ 中性 | "YourBrand提供管理功能" |
+| ❌ 负面 | "YourBrand存在一些稳定性问题" |
+
+### 4. 提及位置分析
+
+分析品牌在 AI 回答中的位置：
+
+| 位置 | 权重 | 说明 |
+|------|------|------|
+| 前 1/3 | ⭐⭐⭐ | 用户最可能看到 |
+| 中 1/3 | ⭐⭐ | 可能看到 |
+| 后 1/3 | ⭐ | 可能被忽略 |
+
+### 5. 批量验证报告
+
+```python
+report = {
+    "total_queries": 20,
+    "mentioned_count": 15,
+    "mention_rate": 0.75,
+    "sentiment_distribution": {
+        "positive": 10,
+        "neutral": 4,
+        "negative": 1
+    }
+}
+```
+
+## 使用方式
+
+### 1. 配置 API Key
+
+在 `.streamlit/secrets.toml` 中添加：
+
+```toml
+[api_keys]
+perplexity = "pplx-xxxxxxxxxxxx"
+```
+
+### 2. 使用验证功能
+
+在"多模型验证"或"AI 数据报表"Tab 中：
+- 选择使用 AI 搜索验证
+- 输入测试问题
+- 查看真实搜索结果中的品牌提及情况
+
+### 3. 查看验证报告
+
+验证报告包含：
+- 品牌提及率
+- 提及位置分布
+- 情感分析结果
+- 竞品对比数据
+
+## 技术实现
+
+### 核心模块
+
+| 文件 | 说明 |
+|------|------|
+| `modules/ai_search_verifier.py` | AI 搜索验证器 |
+
+### API 接口
+
+```python
+from modules.ai_search_verifier import AISearchVerifier
+
+# 初始化
+verifier = AISearchVerifier(perplexity_api_key="pplx-xxx")
+
+# 单次验证
+result = verifier.verify_with_perplexity(
+    query="最好的管理软件是什么？",
+    brand="YourBrand"
+)
+
+# 批量验证
+results = verifier.batch_verify(
+    queries=["问题1", "问题2", ...],
+    brand="YourBrand"
+)
+
+# 生成报告
+report = verifier.generate_verification_report(results)
+```
+
+## 验证指标说明
+
+| 指标 | 说明 | 目标值 |
+|------|------|--------|
+| mention_rate | 品牌被提及的问题比例 | > 60% |
+| avg_mentions_per_query | 每个问题平均提及次数 | > 1.5 |
+| positive_ratio | 正面提及占比 | > 70% |
+| front_position_ratio | 前 1/3 位置占比 | > 50% |
+
+## 与传统验证的区别
+
+| 维度 | 传统验证 | AI 搜索验证 |
+|------|---------|------------|
+| 数据来源 | LLM 模拟 | 真实搜索引擎 |
+| 实时性 | 静态 | 实时 |
+| 可信度 | 低（自我验证） | 高（第三方验证） |
+| 成本 | 低 | 需要 API 费用 |
+| 引用来源 | 无 | 有真实来源 |
+
+## 后续优化方向
+
+1. **接入更多搜索引擎**：ChatGPT Search、Google SGE
+2. **自动化定期验证**：定时任务自动验证品牌提及
+3. **竞品监控**：自动监控竞品的 AI 搜索表现
+4. **历史趋势**：跟踪品牌提及率的变化趋势