fb309299bf
Made-with: Cursor
156 lines
3.5 KiB
Markdown
156 lines
3.5 KiB
Markdown
# AI 搜索验证功能说明
|
||
|
||
## 功能概述
|
||
|
||
AI 搜索验证模块支持使用真实的 AI 搜索引擎(如 Perplexity)验证品牌是否被提及,解决传统验证方式的"自我确认偏差"问题。
|
||
|
||
## 核心问题
|
||
|
||
传统验证方式的问题:
|
||
|
||
```
|
||
用 LLM A 生成内容 → 用 LLM A 验证内容是否被引用 → 存在自我确认偏差
|
||
```
|
||
|
||
AI 搜索验证的解决方案:
|
||
|
||
```
|
||
用 LLM A 生成内容 → 用 Perplexity 真实搜索引擎验证 → 获得真实反馈
|
||
```
|
||
|
||
## 功能特性
|
||
|
||
### 1. Perplexity API 集成
|
||
|
||
- 接入 Perplexity 实时搜索引擎
|
||
- 获取真实的搜索结果和引用来源
|
||
- 支持搜索结果中的引用分析
|
||
|
||
### 2. 语义级提及检测
|
||
|
||
```python
|
||
# 支持多种提及形式
|
||
"YourBrand" # 直接提及
|
||
"YourBrand ERP" # 带后缀
|
||
"YB" # 英文缩写
|
||
```
|
||
|
||
### 3. 情感分析
|
||
|
||
分析品牌提及的语境情感:
|
||
|
||
| 情感类型 | 示例 |
|
||
|---------|------|
|
||
| ✅ 正面 | "YourBrand是行业领先的解决方案" |
|
||
| ➖ 中性 | "YourBrand提供管理功能" |
|
||
| ❌ 负面 | "YourBrand存在一些稳定性问题" |
|
||
|
||
### 4. 提及位置分析
|
||
|
||
分析品牌在 AI 回答中的位置:
|
||
|
||
| 位置 | 权重 | 说明 |
|
||
|------|------|------|
|
||
| 前 1/3 | ⭐⭐⭐ | 用户最可能看到 |
|
||
| 中 1/3 | ⭐⭐ | 可能看到 |
|
||
| 后 1/3 | ⭐ | 可能被忽略 |
|
||
|
||
### 5. 批量验证报告
|
||
|
||
```python
|
||
report = {
|
||
"total_queries": 20,
|
||
"mentioned_count": 15,
|
||
"mention_rate": 0.75,
|
||
"sentiment_distribution": {
|
||
"positive": 10,
|
||
"neutral": 4,
|
||
"negative": 1
|
||
}
|
||
}
|
||
```
|
||
|
||
## 使用方式
|
||
|
||
### 1. 配置 API Key
|
||
|
||
在 `.streamlit/secrets.toml` 中添加:
|
||
|
||
```toml
|
||
[api_keys]
|
||
perplexity = "pplx-xxxxxxxxxxxx"
|
||
```
|
||
|
||
### 2. 使用验证功能
|
||
|
||
在"多模型验证"或"AI 数据报表"Tab 中:
|
||
- 选择使用 AI 搜索验证
|
||
- 输入测试问题
|
||
- 查看真实搜索结果中的品牌提及情况
|
||
|
||
### 3. 查看验证报告
|
||
|
||
验证报告包含:
|
||
- 品牌提及率
|
||
- 提及位置分布
|
||
- 情感分析结果
|
||
- 竞品对比数据
|
||
|
||
## 技术实现
|
||
|
||
### 核心模块
|
||
|
||
| 文件 | 说明 |
|
||
|------|------|
|
||
| `modules/ai_search_verifier.py` | AI 搜索验证器 |
|
||
|
||
### API 接口
|
||
|
||
```python
|
||
from modules.ai_search_verifier import AISearchVerifier
|
||
|
||
# 初始化
|
||
verifier = AISearchVerifier(perplexity_api_key="pplx-xxx")
|
||
|
||
# 单次验证
|
||
result = verifier.verify_with_perplexity(
|
||
query="最好的管理软件是什么?",
|
||
brand="YourBrand"
|
||
)
|
||
|
||
# 批量验证
|
||
results = verifier.batch_verify(
|
||
queries=["问题1", "问题2", ...],
|
||
brand="YourBrand"
|
||
)
|
||
|
||
# 生成报告
|
||
report = verifier.generate_verification_report(results)
|
||
```
|
||
|
||
## 验证指标说明
|
||
|
||
| 指标 | 说明 | 目标值 |
|
||
|------|------|--------|
|
||
| mention_rate | 品牌被提及的问题比例 | > 60% |
|
||
| avg_mentions_per_query | 每个问题平均提及次数 | > 1.5 |
|
||
| positive_ratio | 正面提及占比 | > 70% |
|
||
| front_position_ratio | 前 1/3 位置占比 | > 50% |
|
||
|
||
## 与传统验证的区别
|
||
|
||
| 维度 | 传统验证 | AI 搜索验证 |
|
||
|------|---------|------------|
|
||
| 数据来源 | LLM 模拟 | 真实搜索引擎 |
|
||
| 实时性 | 静态 | 实时 |
|
||
| 可信度 | 低(自我验证) | 高(第三方验证) |
|
||
| 成本 | 低 | 需要 API 费用 |
|
||
| 引用来源 | 无 | 有真实来源 |
|
||
|
||
## 后续优化方向
|
||
|
||
1. **接入更多搜索引擎**:ChatGPT Search、Google SGE
|
||
2. **自动化定期验证**:定时任务自动验证品牌提及
|
||
3. **竞品监控**:自动监控竞品的 AI 搜索表现
|
||
4. **历史趋势**:跟踪品牌提及率的变化趋势
|