Files

T

刘国栋 8f7f082c3d feat: 重构项目结构并添加平台同步基础架构

- 重构项目目录结构，将功能模块移至 modules/ 目录
- 创建平台同步基础架构，包括发布器基类和 GitHub 发布器
- 新增 UI 状态管理模块 (modules/ui/state.py) 统一管理会话状态
- 更新依赖配置，添加平台同步所需依赖 (httpx, pyperclip)
- 整理文档结构，将所有文档分类移至 docs/ 目录
- 添加 .cursorrules 文件定义项目开发规范
- 清理根目录重复文件，保持项目结构整洁

2026-01-30 10:21:29 +08:00

7.6 KiB

Raw Permalink Blame History

话题集群生成功能说明

📋 功能概述

话题集群生成模块是 GEO 工具的高级功能，用于将关键词聚类为话题集群，系统化规划内容策略，发现内容盲区，建立完整的内容矩阵。

核心价值

从"点"到"面"的覆盖：从单篇内容优化（点）到系统化覆盖整个话题领域（面）
发现内容盲区：识别哪些话题集群缺少内容，帮助用户发现内容空白点
系统化内容规划：基于话题集群生成内容规划建议，建立完整的内容矩阵
话题关联分析：分析话题之间的关联关系，发现跨话题的内容机会

🎯 功能位置

关键词蒸馏模块（Tab1）

在生成关键词或进行语义扩展后，可以：

🚀 生成话题集群：基于现有关键词生成话题集群
- 设置话题集群数量（3-10 个）
- 一键生成话题集群
📊 话题集群统计：查看话题集群统计信息
- 话题总数
- 关键词总数
- 平均关键词/话题
- 最大话题关键词数
📋 话题集群列表：查看每个话题集群的详细信息
- 话题名称和描述
- 包含的关键词列表
- 优先级标识
🔗 话题关联关系：查看话题之间的关联关系
- 关联强度（强/弱）
- 关联类型（功能相关/场景相关等）
📈 话题网络图：可视化展示话题集群的网络关系
- 节点大小表示关键词数量
- 连线表示话题关联
💡 内容规划建议：基于话题集群生成内容规划建议
- 内容盲区分析
- 内容优先级
- 详细内容建议

AI 数据报表模块（Tab6）

在历史关键词基础上，可以：

🚀 生成话题集群分析：基于历史关键词生成话题集群分析
- 设置话题集群数量（3-10 个）
- 一键生成话题集群分析
📈 话题分布图：可视化展示各话题集群的关键词数量分布
📊 覆盖情况分析：分析话题集群的覆盖情况
- 识别覆盖盲区
- 分析话题分布
💡 内容规划建议：基于历史数据生成内容规划建议
- 内容盲区分析
- 内容优先级
- 详细内容建议

🔄 工作流程

历史数据分析流程（Tab6）

生成话题集群分析
- 在 Tab6 点击"🚀 生成话题集群分析"
- 基于历史关键词自动生成话题集群
分析覆盖情况
- 查看话题分布图，了解各话题的覆盖情况
- 识别覆盖盲区，发现需要加强的话题
优化内容策略
- 根据内容规划建议，调整内容创作策略
- 优先覆盖高价值、低覆盖的话题

📊 话题聚类算法

语义相似性聚类

系统使用 LLM 进行语义相似性聚类，将语义相似的关键词归为同一话题集群：

语义分析：分析关键词的语义含义
相似度计算：计算关键词之间的语义相似度
聚类分组：将相似的关键词归为同一话题集群
话题命名：为每个话题集群生成有代表性的名称

备用聚类算法

如果 LLM 聚类失败，系统会使用基于规则的简单聚类算法：

字符串相似度：使用 SequenceMatcher 计算关键词之间的字符串相似度
阈值聚类：将相似度超过阈值的关键词归为同一集群
简单命名：从关键词中提取核心词作为话题名称

📈 可视化展示

话题网络图

节点：表示话题集群，节点大小表示关键词数量
连线：表示话题之间的关联关系
布局：使用圆形布局，便于查看话题关系

话题分布图

柱状图：展示各话题集群的关键词数量分布
颜色映射：使用颜色深浅表示关键词数量

💡 内容规划建议

内容盲区分析

系统会识别以下类型的内容盲区：

完全空白：该话题集群完全没有内容
内容不足：该话题集群内容较少，需要补充
关联缺失：话题之间的关联内容缺失

内容优先级

系统会根据以下因素确定内容优先级：

话题重要性：话题的关键词数量和覆盖范围
覆盖度：当前话题的内容覆盖情况
关联度：话题与其他话题的关联程度

内容建议

为每个话题集群提供：

内容类型：建议的内容类型（文章、指南、案例等）
发布平台：建议的发布平台（博客、知乎、小红书等）
关键词策略：如何围绕话题使用关键词
内容创意：具体的内容创作建议

⚠️ 注意事项

需要 LLM：话题集群生成功能需要配置生成 LLM 的 API Key
API 调用：聚类过程会调用 LLM API，注意 API 费用
关键词数量：建议至少 20 个关键词，才能生成有意义的话题集群
聚类质量：聚类质量取决于 LLM 的能力和 Prompt 设计
数量限制：一次最多处理 100 个关键词进行聚类

🔗 相关功能

关键词生成：在 Tab1 生成初始关键词
语义扩展：在 Tab1 扩展关键词覆盖面
内容生成：在 Tab2 使用话题集群中的关键词生成内容
多模型验证：在 Tab4 验证话题集群中的关键词效果
历史记录：在 Tab5 查看历史关键词记录
AI 数据报表：在 Tab6 进行话题集群分析

🎯 最佳实践

分阶段聚类：
- 首先生成 30-50 个核心关键词
- 然后进行语义扩展，增加到 50-100 个关键词
- 最后生成话题集群，系统化规划内容
合理设置集群数量：
- 关键词较少（<30）：设置 3-5 个话题集群
- 关键词中等（30-70）：设置 5-7 个话题集群
- 关键词较多（>70）：设置 7-10 个话题集群
关注内容盲区：
- 优先查看内容盲区分析
- 优先覆盖高优先级、低覆盖的话题
- 系统化补充内容空白点
利用话题关联：
- 查看话题关联关系，发现跨话题的内容机会
- 创作关联话题的内容，提升整体覆盖面
定期分析：
- 在 Tab6 定期进行话题集群分析
- 基于历史数据优化内容策略
- 持续发现和补充内容盲区

📊 预期效果

短期效果

发现内容盲区：快速识别哪些话题缺少内容
系统化规划：建立清晰的内容创作计划
提升效率：避免重复创作相似内容

长期效果

完整覆盖：系统化覆盖整个话题领域
提升权威性：建立完整的内容矩阵，提升品牌权威性
持续优化：基于数据分析持续优化内容策略

版本：v1.0
更新日期：2025-01-26

7.6 KiB Raw Permalink Blame History Unescape Escape