Files
ChouJuGEO/docs/features/TOPIC_CLUSTER_FEATURE.md
刘国栋 8f7f082c3d feat: 重构项目结构并添加平台同步基础架构
- 重构项目目录结构,将功能模块移至 modules/ 目录
- 创建平台同步基础架构,包括发布器基类和 GitHub 发布器
- 新增 UI 状态管理模块 (modules/ui/state.py) 统一管理会话状态
- 更新依赖配置,添加平台同步所需依赖 (httpx, pyperclip)
- 整理文档结构,将所有文档分类移至 docs/ 目录
- 添加 .cursorrules 文件定义项目开发规范
- 清理根目录重复文件,保持项目结构整洁
2026-01-30 10:21:29 +08:00

7.6 KiB
Raw Permalink Blame History

话题集群生成功能说明

📋 功能概述

话题集群生成模块是 GEO 工具的高级功能,用于将关键词聚类为话题集群,系统化规划内容策略,发现内容盲区,建立完整的内容矩阵。

核心价值

  • 从"点"到"面"的覆盖:从单篇内容优化(点)到系统化覆盖整个话题领域(面)
  • 发现内容盲区:识别哪些话题集群缺少内容,帮助用户发现内容空白点
  • 系统化内容规划:基于话题集群生成内容规划建议,建立完整的内容矩阵
  • 话题关联分析:分析话题之间的关联关系,发现跨话题的内容机会

🎯 功能位置

关键词蒸馏模块(Tab1

在生成关键词或进行语义扩展后,可以:

  1. 🚀 生成话题集群:基于现有关键词生成话题集群

    • 设置话题集群数量(3-10 个)
    • 一键生成话题集群
  2. 📊 话题集群统计:查看话题集群统计信息

    • 话题总数
    • 关键词总数
    • 平均关键词/话题
    • 最大话题关键词数
  3. 📋 话题集群列表:查看每个话题集群的详细信息

    • 话题名称和描述
    • 包含的关键词列表
    • 优先级标识
  4. 🔗 话题关联关系:查看话题之间的关联关系

    • 关联强度(强/弱)
    • 关联类型(功能相关/场景相关等)
  5. 📈 话题网络图:可视化展示话题集群的网络关系

    • 节点大小表示关键词数量
    • 连线表示话题关联
  6. 💡 内容规划建议:基于话题集群生成内容规划建议

    • 内容盲区分析
    • 内容优先级
    • 详细内容建议

AI 数据报表模块(Tab6

在历史关键词基础上,可以:

  1. 🚀 生成话题集群分析:基于历史关键词生成话题集群分析

    • 设置话题集群数量(3-10 个)
    • 一键生成话题集群分析
  2. 📈 话题分布图:可视化展示各话题集群的关键词数量分布

  3. 📊 覆盖情况分析:分析话题集群的覆盖情况

    • 识别覆盖盲区
    • 分析话题分布
  4. 💡 内容规划建议:基于历史数据生成内容规划建议

    • 内容盲区分析
    • 内容优先级
    • 详细内容建议

🔄 工作流程

推荐工作流程

  1. 生成关键词

    • 在 Tab1 使用"AI生成"、"托词工具"或"混合模式"生成关键词
    • 可选:进行语义扩展,增加关键词覆盖面
  2. 生成话题集群

    • 设置话题集群数量(建议 5-7 个)
    • 点击"🚀 生成话题集群"
    • 查看话题集群统计和列表
  3. 分析话题关联

    • 查看话题关联关系表
    • 查看话题网络图,了解话题之间的关联
  4. 查看内容规划建议

    • 查看内容盲区分析,发现内容空白点
    • 查看内容优先级,了解哪些话题需要优先创作
    • 查看详细内容建议,获取具体的内容创作指导
  5. 系统化内容创作

    • 根据内容规划建议,系统化创作内容
    • 优先覆盖高优先级、低覆盖的话题
    • 建立完整的内容矩阵

历史数据分析流程(Tab6

  1. 生成话题集群分析

    • 在 Tab6 点击"🚀 生成话题集群分析"
    • 基于历史关键词自动生成话题集群
  2. 分析覆盖情况

    • 查看话题分布图,了解各话题的覆盖情况
    • 识别覆盖盲区,发现需要加强的话题
  3. 优化内容策略

    • 根据内容规划建议,调整内容创作策略
    • 优先覆盖高价值、低覆盖的话题

📊 话题聚类算法

语义相似性聚类

系统使用 LLM 进行语义相似性聚类,将语义相似的关键词归为同一话题集群:

  1. 语义分析:分析关键词的语义含义
  2. 相似度计算:计算关键词之间的语义相似度
  3. 聚类分组:将相似的关键词归为同一话题集群
  4. 话题命名:为每个话题集群生成有代表性的名称

备用聚类算法

如果 LLM 聚类失败,系统会使用基于规则的简单聚类算法:

  1. 字符串相似度:使用 SequenceMatcher 计算关键词之间的字符串相似度
  2. 阈值聚类:将相似度超过阈值的关键词归为同一集群
  3. 简单命名:从关键词中提取核心词作为话题名称

📈 可视化展示

话题网络图

  • 节点:表示话题集群,节点大小表示关键词数量
  • 连线:表示话题之间的关联关系
  • 布局:使用圆形布局,便于查看话题关系

话题分布图

  • 柱状图:展示各话题集群的关键词数量分布
  • 颜色映射:使用颜色深浅表示关键词数量

💡 内容规划建议

内容盲区分析

系统会识别以下类型的内容盲区:

  1. 完全空白:该话题集群完全没有内容
  2. 内容不足:该话题集群内容较少,需要补充
  3. 关联缺失:话题之间的关联内容缺失

内容优先级

系统会根据以下因素确定内容优先级:

  1. 话题重要性:话题的关键词数量和覆盖范围
  2. 覆盖度:当前话题的内容覆盖情况
  3. 关联度:话题与其他话题的关联程度

内容建议

为每个话题集群提供:

  1. 内容类型:建议的内容类型(文章、指南、案例等)
  2. 发布平台:建议的发布平台(博客、知乎、小红书等)
  3. 关键词策略:如何围绕话题使用关键词
  4. 内容创意:具体的内容创作建议

⚠️ 注意事项

  1. 需要 LLM:话题集群生成功能需要配置生成 LLM 的 API Key
  2. API 调用:聚类过程会调用 LLM API,注意 API 费用
  3. 关键词数量:建议至少 20 个关键词,才能生成有意义的话题集群
  4. 聚类质量:聚类质量取决于 LLM 的能力和 Prompt 设计
  5. 数量限制:一次最多处理 100 个关键词进行聚类

🔗 相关功能

  • 关键词生成:在 Tab1 生成初始关键词
  • 语义扩展:在 Tab1 扩展关键词覆盖面
  • 内容生成:在 Tab2 使用话题集群中的关键词生成内容
  • 多模型验证:在 Tab4 验证话题集群中的关键词效果
  • 历史记录:在 Tab5 查看历史关键词记录
  • AI 数据报表:在 Tab6 进行话题集群分析

🎯 最佳实践

  1. 分阶段聚类

    • 首先生成 30-50 个核心关键词
    • 然后进行语义扩展,增加到 50-100 个关键词
    • 最后生成话题集群,系统化规划内容
  2. 合理设置集群数量

    • 关键词较少(<30):设置 3-5 个话题集群
    • 关键词中等(30-70):设置 5-7 个话题集群
    • 关键词较多(>70):设置 7-10 个话题集群
  3. 关注内容盲区

    • 优先查看内容盲区分析
    • 优先覆盖高优先级、低覆盖的话题
    • 系统化补充内容空白点
  4. 利用话题关联

    • 查看话题关联关系,发现跨话题的内容机会
    • 创作关联话题的内容,提升整体覆盖面
  5. 定期分析

    • 在 Tab6 定期进行话题集群分析
    • 基于历史数据优化内容策略
    • 持续发现和补充内容盲区

📊 预期效果

短期效果

  • 发现内容盲区:快速识别哪些话题缺少内容
  • 系统化规划:建立清晰的内容创作计划
  • 提升效率:避免重复创作相似内容

长期效果

  • 完整覆盖:系统化覆盖整个话题领域
  • 提升权威性:建立完整的内容矩阵,提升品牌权威性
  • 持续优化:基于数据分析持续优化内容策略

版本v1.0
更新日期2025-01-26