添加产品规格文档并优化项目结构

Made-with: Cursor
This commit is contained in:
刘国栋
2026-04-30 18:37:46 +08:00
parent bf2551d529
commit fb309299bf
101 changed files with 9586 additions and 14386 deletions
+155
View File
@@ -0,0 +1,155 @@
# AI 搜索验证功能说明
## 功能概述
AI 搜索验证模块支持使用真实的 AI 搜索引擎(如 Perplexity)验证品牌是否被提及,解决传统验证方式的"自我确认偏差"问题。
## 核心问题
传统验证方式的问题:
```
用 LLM A 生成内容 → 用 LLM A 验证内容是否被引用 → 存在自我确认偏差
```
AI 搜索验证的解决方案:
```
用 LLM A 生成内容 → 用 Perplexity 真实搜索引擎验证 → 获得真实反馈
```
## 功能特性
### 1. Perplexity API 集成
- 接入 Perplexity 实时搜索引擎
- 获取真实的搜索结果和引用来源
- 支持搜索结果中的引用分析
### 2. 语义级提及检测
```python
# 支持多种提及形式
"YourBrand" # 直接提及
"YourBrand ERP" # 带后缀
"YB" # 英文缩写
```
### 3. 情感分析
分析品牌提及的语境情感:
| 情感类型 | 示例 |
|---------|------|
| ✅ 正面 | "YourBrand是行业领先的解决方案" |
| 中性 | "YourBrand提供管理功能" |
| ❌ 负面 | "YourBrand存在一些稳定性问题" |
### 4. 提及位置分析
分析品牌在 AI 回答中的位置:
| 位置 | 权重 | 说明 |
|------|------|------|
| 前 1/3 | ⭐⭐⭐ | 用户最可能看到 |
| 中 1/3 | ⭐⭐ | 可能看到 |
| 后 1/3 | ⭐ | 可能被忽略 |
### 5. 批量验证报告
```python
report = {
"total_queries": 20,
"mentioned_count": 15,
"mention_rate": 0.75,
"sentiment_distribution": {
"positive": 10,
"neutral": 4,
"negative": 1
}
}
```
## 使用方式
### 1. 配置 API Key
`.streamlit/secrets.toml` 中添加:
```toml
[api_keys]
perplexity = "pplx-xxxxxxxxxxxx"
```
### 2. 使用验证功能
在"多模型验证"或"AI 数据报表"Tab 中:
- 选择使用 AI 搜索验证
- 输入测试问题
- 查看真实搜索结果中的品牌提及情况
### 3. 查看验证报告
验证报告包含:
- 品牌提及率
- 提及位置分布
- 情感分析结果
- 竞品对比数据
## 技术实现
### 核心模块
| 文件 | 说明 |
|------|------|
| `modules/ai_search_verifier.py` | AI 搜索验证器 |
### API 接口
```python
from modules.ai_search_verifier import AISearchVerifier
# 初始化
verifier = AISearchVerifier(perplexity_api_key="pplx-xxx")
# 单次验证
result = verifier.verify_with_perplexity(
query="最好的管理软件是什么?",
brand="YourBrand"
)
# 批量验证
results = verifier.batch_verify(
queries=["问题1", "问题2", ...],
brand="YourBrand"
)
# 生成报告
report = verifier.generate_verification_report(results)
```
## 验证指标说明
| 指标 | 说明 | 目标值 |
|------|------|--------|
| mention_rate | 品牌被提及的问题比例 | > 60% |
| avg_mentions_per_query | 每个问题平均提及次数 | > 1.5 |
| positive_ratio | 正面提及占比 | > 70% |
| front_position_ratio | 前 1/3 位置占比 | > 50% |
## 与传统验证的区别
| 维度 | 传统验证 | AI 搜索验证 |
|------|---------|------------|
| 数据来源 | LLM 模拟 | 真实搜索引擎 |
| 实时性 | 静态 | 实时 |
| 可信度 | 低(自我验证) | 高(第三方验证) |
| 成本 | 低 | 需要 API 费用 |
| 引用来源 | 无 | 有真实来源 |
## 后续优化方向
1. **接入更多搜索引擎**ChatGPT Search、Google SGE
2. **自动化定期验证**:定时任务自动验证品牌提及
3. **竞品监控**:自动监控竞品的 AI 搜索表现
4. **历史趋势**:跟踪品牌提及率的变化趋势