feat: 重构项目结构并添加平台同步基础架构

- 重构项目目录结构，将功能模块移至 modules/ 目录 - 创建平台同步基础架构，包括发布器基类和 GitHub 发布器 - 新增 UI 状态管理模块 (modules/ui/state.py) 统一管理会话状态 - 更新依赖配置，添加平台同步所需依赖 (httpx, pyperclip) - 整理文档结构，将所有文档分类移至 docs/ 目录 - 添加 .cursorrules 文件定义项目开发规范 - 清理根目录重复文件，保持项目结构整洁
2026-01-30 10:21:29 +08:00
parent 77d5ec70f8
commit 8f7f082c3d
102 changed files with 33742 additions and 1526 deletions
@@ -0,0 +1,227 @@
+# 话题集群生成功能说明
+
+## 📋 功能概述
+
+话题集群生成模块是 GEO 工具的高级功能，用于将关键词聚类为话题集群，系统化规划内容策略，发现内容盲区，建立完整的内容矩阵。
+
+### 核心价值
+
+- **从"点"到"面"的覆盖**：从单篇内容优化（点）到系统化覆盖整个话题领域（面）
+- **发现内容盲区**：识别哪些话题集群缺少内容，帮助用户发现内容空白点
+- **系统化内容规划**：基于话题集群生成内容规划建议，建立完整的内容矩阵
+- **话题关联分析**：分析话题之间的关联关系，发现跨话题的内容机会
+
+## 🎯 功能位置
+
+### 关键词蒸馏模块（Tab1）
+
+在生成关键词或进行语义扩展后，可以：
+
+1. **🚀 生成话题集群**：基于现有关键词生成话题集群
+   - 设置话题集群数量（3-10 个）
+   - 一键生成话题集群
+
+2. **📊 话题集群统计**：查看话题集群统计信息
+   - 话题总数
+   - 关键词总数
+   - 平均关键词/话题
+   - 最大话题关键词数
+
+3. **📋 话题集群列表**：查看每个话题集群的详细信息
+   - 话题名称和描述
+   - 包含的关键词列表
+   - 优先级标识
+
+4. **🔗 话题关联关系**：查看话题之间的关联关系
+   - 关联强度（强/弱）
+   - 关联类型（功能相关/场景相关等）
+
+5. **📈 话题网络图**：可视化展示话题集群的网络关系
+   - 节点大小表示关键词数量
+   - 连线表示话题关联
+
+6. **💡 内容规划建议**：基于话题集群生成内容规划建议
+   - 内容盲区分析
+   - 内容优先级
+   - 详细内容建议
+
+### AI 数据报表模块（Tab6）
+
+在历史关键词基础上，可以：
+
+1. **🚀 生成话题集群分析**：基于历史关键词生成话题集群分析
+   - 设置话题集群数量（3-10 个）
+   - 一键生成话题集群分析
+
+2. **📈 话题分布图**：可视化展示各话题集群的关键词数量分布
+
+3. **📊 覆盖情况分析**：分析话题集群的覆盖情况
+   - 识别覆盖盲区
+   - 分析话题分布
+
+4. **💡 内容规划建议**：基于历史数据生成内容规划建议
+   - 内容盲区分析
+   - 内容优先级
+   - 详细内容建议
+
+## 🔄 工作流程
+
+### 推荐工作流程
+
+1. **生成关键词**
+   - 在 Tab1 使用"AI生成"、"托词工具"或"混合模式"生成关键词
+   - 可选：进行语义扩展，增加关键词覆盖面
+
+2. **生成话题集群**
+   - 设置话题集群数量（建议 5-7 个）
+   - 点击"🚀 生成话题集群"
+   - 查看话题集群统计和列表
+
+3. **分析话题关联**
+   - 查看话题关联关系表
+   - 查看话题网络图，了解话题之间的关联
+
+4. **查看内容规划建议**
+   - 查看内容盲区分析，发现内容空白点
+   - 查看内容优先级，了解哪些话题需要优先创作
+   - 查看详细内容建议，获取具体的内容创作指导
+
+5. **系统化内容创作**
+   - 根据内容规划建议，系统化创作内容
+   - 优先覆盖高优先级、低覆盖的话题
+   - 建立完整的内容矩阵
+
+### 历史数据分析流程（Tab6）
+
+1. **生成话题集群分析**
+   - 在 Tab6 点击"🚀 生成话题集群分析"
+   - 基于历史关键词自动生成话题集群
+
+2. **分析覆盖情况**
+   - 查看话题分布图，了解各话题的覆盖情况
+   - 识别覆盖盲区，发现需要加强的话题
+
+3. **优化内容策略**
+   - 根据内容规划建议，调整内容创作策略
+   - 优先覆盖高价值、低覆盖的话题
+
+## 📊 话题聚类算法
+
+### 语义相似性聚类
+
+系统使用 LLM 进行语义相似性聚类，将语义相似的关键词归为同一话题集群：
+
+1. **语义分析**：分析关键词的语义含义
+2. **相似度计算**：计算关键词之间的语义相似度
+3. **聚类分组**：将相似的关键词归为同一话题集群
+4. **话题命名**：为每个话题集群生成有代表性的名称
+
+### 备用聚类算法
+
+如果 LLM 聚类失败，系统会使用基于规则的简单聚类算法：
+
+1. **字符串相似度**：使用 SequenceMatcher 计算关键词之间的字符串相似度
+2. **阈值聚类**：将相似度超过阈值的关键词归为同一集群
+3. **简单命名**：从关键词中提取核心词作为话题名称
+
+## 📈 可视化展示
+
+### 话题网络图
+
+- **节点**：表示话题集群，节点大小表示关键词数量
+- **连线**：表示话题之间的关联关系
+- **布局**：使用圆形布局，便于查看话题关系
+
+### 话题分布图
+
+- **柱状图**：展示各话题集群的关键词数量分布
+- **颜色映射**：使用颜色深浅表示关键词数量
+
+## 💡 内容规划建议
+
+### 内容盲区分析
+
+系统会识别以下类型的内容盲区：
+
+1. **完全空白**：该话题集群完全没有内容
+2. **内容不足**：该话题集群内容较少，需要补充
+3. **关联缺失**：话题之间的关联内容缺失
+
+### 内容优先级
+
+系统会根据以下因素确定内容优先级：
+
+1. **话题重要性**：话题的关键词数量和覆盖范围
+2. **覆盖度**：当前话题的内容覆盖情况
+3. **关联度**：话题与其他话题的关联程度
+
+### 内容建议
+
+为每个话题集群提供：
+
+1. **内容类型**：建议的内容类型（文章、指南、案例等）
+2. **发布平台**：建议的发布平台（博客、知乎、小红书等）
+3. **关键词策略**：如何围绕话题使用关键词
+4. **内容创意**：具体的内容创作建议
+
+## ⚠️ 注意事项
+
+1. **需要 LLM**：话题集群生成功能需要配置生成 LLM 的 API Key
+2. **API 调用**：聚类过程会调用 LLM API，注意 API 费用
+3. **关键词数量**：建议至少 20 个关键词，才能生成有意义的话题集群
+4. **聚类质量**：聚类质量取决于 LLM 的能力和 Prompt 设计
+5. **数量限制**：一次最多处理 100 个关键词进行聚类
+
+## 🔗 相关功能
+
+- **关键词生成**：在 Tab1 生成初始关键词
+- **语义扩展**：在 Tab1 扩展关键词覆盖面
+- **内容生成**：在 Tab2 使用话题集群中的关键词生成内容
+- **多模型验证**：在 Tab4 验证话题集群中的关键词效果
+- **历史记录**：在 Tab5 查看历史关键词记录
+- **AI 数据报表**：在 Tab6 进行话题集群分析
+
+## 🎯 最佳实践
+
+1. **分阶段聚类**：
+   - 首先生成 30-50 个核心关键词
+   - 然后进行语义扩展，增加到 50-100 个关键词
+   - 最后生成话题集群，系统化规划内容
+
+2. **合理设置集群数量**：
+   - 关键词较少（<30）：设置 3-5 个话题集群
+   - 关键词中等（30-70）：设置 5-7 个话题集群
+   - 关键词较多（>70）：设置 7-10 个话题集群
+
+3. **关注内容盲区**：
+   - 优先查看内容盲区分析
+   - 优先覆盖高优先级、低覆盖的话题
+   - 系统化补充内容空白点
+
+4. **利用话题关联**：
+   - 查看话题关联关系，发现跨话题的内容机会
+   - 创作关联话题的内容，提升整体覆盖面
+
+5. **定期分析**：
+   - 在 Tab6 定期进行话题集群分析
+   - 基于历史数据优化内容策略
+   - 持续发现和补充内容盲区
+
+## 📊 预期效果
+
+### 短期效果
+
+- **发现内容盲区**：快速识别哪些话题缺少内容
+- **系统化规划**：建立清晰的内容创作计划
+- **提升效率**：避免重复创作相似内容
+
+### 长期效果
+
+- **完整覆盖**：系统化覆盖整个话题领域
+- **提升权威性**：建立完整的内容矩阵，提升品牌权威性
+- **持续优化**：基于数据分析持续优化内容策略
+
+---
+
+**版本**：v1.0  
+**更新日期**：2025-01-26