feat: 重构项目结构并添加平台同步基础架构

- 重构项目目录结构,将功能模块移至 modules/ 目录
- 创建平台同步基础架构,包括发布器基类和 GitHub 发布器
- 新增 UI 状态管理模块 (modules/ui/state.py) 统一管理会话状态
- 更新依赖配置,添加平台同步所需依赖 (httpx, pyperclip)
- 整理文档结构,将所有文档分类移至 docs/ 目录
- 添加 .cursorrules 文件定义项目开发规范
- 清理根目录重复文件,保持项目结构整洁
This commit is contained in:
刘国栋
2026-01-30 10:21:29 +08:00
parent 77d5ec70f8
commit 8f7f082c3d
102 changed files with 33742 additions and 1526 deletions
+227
View File
@@ -0,0 +1,227 @@
# 话题集群生成功能说明
## 📋 功能概述
话题集群生成模块是 GEO 工具的高级功能,用于将关键词聚类为话题集群,系统化规划内容策略,发现内容盲区,建立完整的内容矩阵。
### 核心价值
- **从"点"到"面"的覆盖**:从单篇内容优化(点)到系统化覆盖整个话题领域(面)
- **发现内容盲区**:识别哪些话题集群缺少内容,帮助用户发现内容空白点
- **系统化内容规划**:基于话题集群生成内容规划建议,建立完整的内容矩阵
- **话题关联分析**:分析话题之间的关联关系,发现跨话题的内容机会
## 🎯 功能位置
### 关键词蒸馏模块(Tab1
在生成关键词或进行语义扩展后,可以:
1. **🚀 生成话题集群**:基于现有关键词生成话题集群
- 设置话题集群数量(3-10 个)
- 一键生成话题集群
2. **📊 话题集群统计**:查看话题集群统计信息
- 话题总数
- 关键词总数
- 平均关键词/话题
- 最大话题关键词数
3. **📋 话题集群列表**:查看每个话题集群的详细信息
- 话题名称和描述
- 包含的关键词列表
- 优先级标识
4. **🔗 话题关联关系**:查看话题之间的关联关系
- 关联强度(强/弱)
- 关联类型(功能相关/场景相关等)
5. **📈 话题网络图**:可视化展示话题集群的网络关系
- 节点大小表示关键词数量
- 连线表示话题关联
6. **💡 内容规划建议**:基于话题集群生成内容规划建议
- 内容盲区分析
- 内容优先级
- 详细内容建议
### AI 数据报表模块(Tab6
在历史关键词基础上,可以:
1. **🚀 生成话题集群分析**:基于历史关键词生成话题集群分析
- 设置话题集群数量(3-10 个)
- 一键生成话题集群分析
2. **📈 话题分布图**:可视化展示各话题集群的关键词数量分布
3. **📊 覆盖情况分析**:分析话题集群的覆盖情况
- 识别覆盖盲区
- 分析话题分布
4. **💡 内容规划建议**:基于历史数据生成内容规划建议
- 内容盲区分析
- 内容优先级
- 详细内容建议
## 🔄 工作流程
### 推荐工作流程
1. **生成关键词**
- 在 Tab1 使用"AI生成"、"托词工具"或"混合模式"生成关键词
- 可选:进行语义扩展,增加关键词覆盖面
2. **生成话题集群**
- 设置话题集群数量(建议 5-7 个)
- 点击"🚀 生成话题集群"
- 查看话题集群统计和列表
3. **分析话题关联**
- 查看话题关联关系表
- 查看话题网络图,了解话题之间的关联
4. **查看内容规划建议**
- 查看内容盲区分析,发现内容空白点
- 查看内容优先级,了解哪些话题需要优先创作
- 查看详细内容建议,获取具体的内容创作指导
5. **系统化内容创作**
- 根据内容规划建议,系统化创作内容
- 优先覆盖高优先级、低覆盖的话题
- 建立完整的内容矩阵
### 历史数据分析流程(Tab6
1. **生成话题集群分析**
- 在 Tab6 点击"🚀 生成话题集群分析"
- 基于历史关键词自动生成话题集群
2. **分析覆盖情况**
- 查看话题分布图,了解各话题的覆盖情况
- 识别覆盖盲区,发现需要加强的话题
3. **优化内容策略**
- 根据内容规划建议,调整内容创作策略
- 优先覆盖高价值、低覆盖的话题
## 📊 话题聚类算法
### 语义相似性聚类
系统使用 LLM 进行语义相似性聚类,将语义相似的关键词归为同一话题集群:
1. **语义分析**:分析关键词的语义含义
2. **相似度计算**:计算关键词之间的语义相似度
3. **聚类分组**:将相似的关键词归为同一话题集群
4. **话题命名**:为每个话题集群生成有代表性的名称
### 备用聚类算法
如果 LLM 聚类失败,系统会使用基于规则的简单聚类算法:
1. **字符串相似度**:使用 SequenceMatcher 计算关键词之间的字符串相似度
2. **阈值聚类**:将相似度超过阈值的关键词归为同一集群
3. **简单命名**:从关键词中提取核心词作为话题名称
## 📈 可视化展示
### 话题网络图
- **节点**:表示话题集群,节点大小表示关键词数量
- **连线**:表示话题之间的关联关系
- **布局**:使用圆形布局,便于查看话题关系
### 话题分布图
- **柱状图**:展示各话题集群的关键词数量分布
- **颜色映射**:使用颜色深浅表示关键词数量
## 💡 内容规划建议
### 内容盲区分析
系统会识别以下类型的内容盲区:
1. **完全空白**:该话题集群完全没有内容
2. **内容不足**:该话题集群内容较少,需要补充
3. **关联缺失**:话题之间的关联内容缺失
### 内容优先级
系统会根据以下因素确定内容优先级:
1. **话题重要性**:话题的关键词数量和覆盖范围
2. **覆盖度**:当前话题的内容覆盖情况
3. **关联度**:话题与其他话题的关联程度
### 内容建议
为每个话题集群提供:
1. **内容类型**:建议的内容类型(文章、指南、案例等)
2. **发布平台**:建议的发布平台(博客、知乎、小红书等)
3. **关键词策略**:如何围绕话题使用关键词
4. **内容创意**:具体的内容创作建议
## ⚠️ 注意事项
1. **需要 LLM**:话题集群生成功能需要配置生成 LLM 的 API Key
2. **API 调用**:聚类过程会调用 LLM API,注意 API 费用
3. **关键词数量**:建议至少 20 个关键词,才能生成有意义的话题集群
4. **聚类质量**:聚类质量取决于 LLM 的能力和 Prompt 设计
5. **数量限制**:一次最多处理 100 个关键词进行聚类
## 🔗 相关功能
- **关键词生成**:在 Tab1 生成初始关键词
- **语义扩展**:在 Tab1 扩展关键词覆盖面
- **内容生成**:在 Tab2 使用话题集群中的关键词生成内容
- **多模型验证**:在 Tab4 验证话题集群中的关键词效果
- **历史记录**:在 Tab5 查看历史关键词记录
- **AI 数据报表**:在 Tab6 进行话题集群分析
## 🎯 最佳实践
1. **分阶段聚类**
- 首先生成 30-50 个核心关键词
- 然后进行语义扩展,增加到 50-100 个关键词
- 最后生成话题集群,系统化规划内容
2. **合理设置集群数量**
- 关键词较少(<30):设置 3-5 个话题集群
- 关键词中等(30-70):设置 5-7 个话题集群
- 关键词较多(>70):设置 7-10 个话题集群
3. **关注内容盲区**
- 优先查看内容盲区分析
- 优先覆盖高优先级、低覆盖的话题
- 系统化补充内容空白点
4. **利用话题关联**
- 查看话题关联关系,发现跨话题的内容机会
- 创作关联话题的内容,提升整体覆盖面
5. **定期分析**
- 在 Tab6 定期进行话题集群分析
- 基于历史数据优化内容策略
- 持续发现和补充内容盲区
## 📊 预期效果
### 短期效果
- **发现内容盲区**:快速识别哪些话题缺少内容
- **系统化规划**:建立清晰的内容创作计划
- **提升效率**:避免重复创作相似内容
### 长期效果
- **完整覆盖**:系统化覆盖整个话题领域
- **提升权威性**:建立完整的内容矩阵,提升品牌权威性
- **持续优化**:基于数据分析持续优化内容策略
---
**版本**v1.0
**更新日期**2025-01-26