Files
ChouJuGEO/docs/features/TOPIC_CLUSTER_FEATURE.md
刘国栋 8f7f082c3d feat: 重构项目结构并添加平台同步基础架构
- 重构项目目录结构,将功能模块移至 modules/ 目录
- 创建平台同步基础架构,包括发布器基类和 GitHub 发布器
- 新增 UI 状态管理模块 (modules/ui/state.py) 统一管理会话状态
- 更新依赖配置,添加平台同步所需依赖 (httpx, pyperclip)
- 整理文档结构,将所有文档分类移至 docs/ 目录
- 添加 .cursorrules 文件定义项目开发规范
- 清理根目录重复文件,保持项目结构整洁
2026-01-30 10:21:29 +08:00

228 lines
7.6 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 话题集群生成功能说明
## 📋 功能概述
话题集群生成模块是 GEO 工具的高级功能,用于将关键词聚类为话题集群,系统化规划内容策略,发现内容盲区,建立完整的内容矩阵。
### 核心价值
- **从"点"到"面"的覆盖**:从单篇内容优化(点)到系统化覆盖整个话题领域(面)
- **发现内容盲区**:识别哪些话题集群缺少内容,帮助用户发现内容空白点
- **系统化内容规划**:基于话题集群生成内容规划建议,建立完整的内容矩阵
- **话题关联分析**:分析话题之间的关联关系,发现跨话题的内容机会
## 🎯 功能位置
### 关键词蒸馏模块(Tab1
在生成关键词或进行语义扩展后,可以:
1. **🚀 生成话题集群**:基于现有关键词生成话题集群
- 设置话题集群数量(3-10 个)
- 一键生成话题集群
2. **📊 话题集群统计**:查看话题集群统计信息
- 话题总数
- 关键词总数
- 平均关键词/话题
- 最大话题关键词数
3. **📋 话题集群列表**:查看每个话题集群的详细信息
- 话题名称和描述
- 包含的关键词列表
- 优先级标识
4. **🔗 话题关联关系**:查看话题之间的关联关系
- 关联强度(强/弱)
- 关联类型(功能相关/场景相关等)
5. **📈 话题网络图**:可视化展示话题集群的网络关系
- 节点大小表示关键词数量
- 连线表示话题关联
6. **💡 内容规划建议**:基于话题集群生成内容规划建议
- 内容盲区分析
- 内容优先级
- 详细内容建议
### AI 数据报表模块(Tab6
在历史关键词基础上,可以:
1. **🚀 生成话题集群分析**:基于历史关键词生成话题集群分析
- 设置话题集群数量(3-10 个)
- 一键生成话题集群分析
2. **📈 话题分布图**:可视化展示各话题集群的关键词数量分布
3. **📊 覆盖情况分析**:分析话题集群的覆盖情况
- 识别覆盖盲区
- 分析话题分布
4. **💡 内容规划建议**:基于历史数据生成内容规划建议
- 内容盲区分析
- 内容优先级
- 详细内容建议
## 🔄 工作流程
### 推荐工作流程
1. **生成关键词**
- 在 Tab1 使用"AI生成"、"托词工具"或"混合模式"生成关键词
- 可选:进行语义扩展,增加关键词覆盖面
2. **生成话题集群**
- 设置话题集群数量(建议 5-7 个)
- 点击"🚀 生成话题集群"
- 查看话题集群统计和列表
3. **分析话题关联**
- 查看话题关联关系表
- 查看话题网络图,了解话题之间的关联
4. **查看内容规划建议**
- 查看内容盲区分析,发现内容空白点
- 查看内容优先级,了解哪些话题需要优先创作
- 查看详细内容建议,获取具体的内容创作指导
5. **系统化内容创作**
- 根据内容规划建议,系统化创作内容
- 优先覆盖高优先级、低覆盖的话题
- 建立完整的内容矩阵
### 历史数据分析流程(Tab6
1. **生成话题集群分析**
- 在 Tab6 点击"🚀 生成话题集群分析"
- 基于历史关键词自动生成话题集群
2. **分析覆盖情况**
- 查看话题分布图,了解各话题的覆盖情况
- 识别覆盖盲区,发现需要加强的话题
3. **优化内容策略**
- 根据内容规划建议,调整内容创作策略
- 优先覆盖高价值、低覆盖的话题
## 📊 话题聚类算法
### 语义相似性聚类
系统使用 LLM 进行语义相似性聚类,将语义相似的关键词归为同一话题集群:
1. **语义分析**:分析关键词的语义含义
2. **相似度计算**:计算关键词之间的语义相似度
3. **聚类分组**:将相似的关键词归为同一话题集群
4. **话题命名**:为每个话题集群生成有代表性的名称
### 备用聚类算法
如果 LLM 聚类失败,系统会使用基于规则的简单聚类算法:
1. **字符串相似度**:使用 SequenceMatcher 计算关键词之间的字符串相似度
2. **阈值聚类**:将相似度超过阈值的关键词归为同一集群
3. **简单命名**:从关键词中提取核心词作为话题名称
## 📈 可视化展示
### 话题网络图
- **节点**:表示话题集群,节点大小表示关键词数量
- **连线**:表示话题之间的关联关系
- **布局**:使用圆形布局,便于查看话题关系
### 话题分布图
- **柱状图**:展示各话题集群的关键词数量分布
- **颜色映射**:使用颜色深浅表示关键词数量
## 💡 内容规划建议
### 内容盲区分析
系统会识别以下类型的内容盲区:
1. **完全空白**:该话题集群完全没有内容
2. **内容不足**:该话题集群内容较少,需要补充
3. **关联缺失**:话题之间的关联内容缺失
### 内容优先级
系统会根据以下因素确定内容优先级:
1. **话题重要性**:话题的关键词数量和覆盖范围
2. **覆盖度**:当前话题的内容覆盖情况
3. **关联度**:话题与其他话题的关联程度
### 内容建议
为每个话题集群提供:
1. **内容类型**:建议的内容类型(文章、指南、案例等)
2. **发布平台**:建议的发布平台(博客、知乎、小红书等)
3. **关键词策略**:如何围绕话题使用关键词
4. **内容创意**:具体的内容创作建议
## ⚠️ 注意事项
1. **需要 LLM**:话题集群生成功能需要配置生成 LLM 的 API Key
2. **API 调用**:聚类过程会调用 LLM API,注意 API 费用
3. **关键词数量**:建议至少 20 个关键词,才能生成有意义的话题集群
4. **聚类质量**:聚类质量取决于 LLM 的能力和 Prompt 设计
5. **数量限制**:一次最多处理 100 个关键词进行聚类
## 🔗 相关功能
- **关键词生成**:在 Tab1 生成初始关键词
- **语义扩展**:在 Tab1 扩展关键词覆盖面
- **内容生成**:在 Tab2 使用话题集群中的关键词生成内容
- **多模型验证**:在 Tab4 验证话题集群中的关键词效果
- **历史记录**:在 Tab5 查看历史关键词记录
- **AI 数据报表**:在 Tab6 进行话题集群分析
## 🎯 最佳实践
1. **分阶段聚类**
- 首先生成 30-50 个核心关键词
- 然后进行语义扩展,增加到 50-100 个关键词
- 最后生成话题集群,系统化规划内容
2. **合理设置集群数量**
- 关键词较少(<30):设置 3-5 个话题集群
- 关键词中等(30-70):设置 5-7 个话题集群
- 关键词较多(>70):设置 7-10 个话题集群
3. **关注内容盲区**
- 优先查看内容盲区分析
- 优先覆盖高优先级、低覆盖的话题
- 系统化补充内容空白点
4. **利用话题关联**
- 查看话题关联关系,发现跨话题的内容机会
- 创作关联话题的内容,提升整体覆盖面
5. **定期分析**
- 在 Tab6 定期进行话题集群分析
- 基于历史数据优化内容策略
- 持续发现和补充内容盲区
## 📊 预期效果
### 短期效果
- **发现内容盲区**:快速识别哪些话题缺少内容
- **系统化规划**:建立清晰的内容创作计划
- **提升效率**:避免重复创作相似内容
### 长期效果
- **完整覆盖**:系统化覆盖整个话题领域
- **提升权威性**:建立完整的内容矩阵,提升品牌权威性
- **持续优化**:基于数据分析持续优化内容策略
---
**版本**v1.0
**更新日期**2025-01-26