fb309299bf
Made-with: Cursor
6.6 KiB
6.6 KiB
Tab 拆分模式说明(基于 Tab1 / Tab2 实践)
本文档描述当前项目中「关键词蒸馏」Tab 与「自动创作」Tab 的拆分方式,供后续 Tab3–Tab10 迁移时复用同一模式。
一、项目与目录结构概览
geo_tool/
├── geo_tool.py # Streamlit 主入口(唯一入口,streamlit run geo_tool.py)
├── modules/
│ ├── *.py # 业务模块(data_storage, keyword_tool, content_scorer, schema_generator 等)
│ └── ui/
│ ├── __init__.py # 导出 tab_keywords, tab_autowrite(后续增加 tab_optimize 等)
│ ├── state.py # ss_init(), init_session_state()
│ ├── theme.py # inject_global_theme()
│ ├── tab_keywords.py # Tab1:关键词蒸馏
│ └── tab_autowrite.py # Tab2:自动创作
├── platform_sync/ # 平台同步(GitHub 发布、一键复制等)
├── docs/
└── scripts/
- 主入口:只做页面配置、侧栏、全局变量(cfg, brand, advantages, gen_llm, verify_llms, storage)、Tabs 创建与路由(每个
with tabN:内只调用对应render_tab_*)。 - 各 Tab 逻辑:全部放在
modules/ui/tab_*.py的render_tab_*中,通过参数从主入口拿到依赖,不反向引用geo_tool,避免循环依赖。
二、Tab 模块结构(统一模式)
每个 tab_xxx.py 大致分为三块:
1. 顶部:导入 + 本 Tab 用到的工具函数
- 只导入本 Tab 用到的:
streamlit、LangChain、以及modules下用到的业务类(如ContentScorer,SchemaGenerator)。 - 不导入
geo_tool或modules.ui里会间接依赖主入口的模块,避免循环依赖。 - 若该 Tab 用到了主入口里的工具函数(如
sanitize_filename、safe_decode_uploaded),在 Tab 模块里复制一份实现,并注释说明「从 geo_tool 复制,避免循环依赖」。
示例(tab_autowrite.py):
import io, json, re, time, zipfile
from datetime import datetime
import streamlit as st
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate
from modules.content_scorer import ContentScorer
from modules.schema_generator import SchemaGenerator
# ...
INVALID_FS_CHARS = r'<>:"/\\|?*\n\r\t'
def sanitize_filename(name: str, max_len: int = 80) -> str:
"""Copy of utility from geo_tool, kept local to avoid circular imports."""
# ...
2. 入口函数签名:render_tab_*(...) -> None
- 函数名:
render_tab_keywords/render_tab_autowrite/ 后续render_tab_optimize等。 - 参数:由主入口「按需传入」该 Tab 用到的所有依赖,常见包括:
storage:数据存储ss_init:会话状态初始化gen_llm:生成用 LLM(若该 Tab 有调用)brand,advantages:品牌与优势文案cfg:当前配置(若该 Tab 需要读 gen_provider、tongyi_wanxiang_api_key 等)record_api_cost,model_defaults:若该 Tab 需要记录 API 成本- 其他 Tab 特有依赖(如 Tab4 可能需
verify_llms)
- 返回值:
None,仅负责渲染和写st.session_state。
Tab1(关键词蒸馏) 不需要记录成本,参数较少:
def render_tab_keywords(storage, ss_init, gen_llm, brand: str, advantages: str) -> None:
Tab2(自动创作) 需要记录成本与 cfg,参数更多:
def render_tab_autowrite(
storage, ss_init, gen_llm, brand: str, advantages: str,
cfg: dict, record_api_cost, model_defaults,
) -> None:
3. 函数体:原样迁移「该 Tab 内部」的 UI + 逻辑
- 原主入口里是:
with tab1:/with tab2:下面的整块代码(标题、表单、结果区、子 Tabs 等)。 - 迁移时:把这块代码整体挪到
render_tab_*里,作为函数体;缩进保持与原先在with tabN:下一致(相当于原 4 空格变成函数体第一层缩进)。 - 不要在 Tab 模块里改业务逻辑或变量命名,只做「剪切 + 粘贴 + 补参数」,保证行为一致。
表单提交后的变量:若在 if run_opt: / if run_content: 等分支里用到了表单里选的(如「优化技巧」),提交后下一轮 rerun 时表单控件可能还未再执行,需要在分支开头从 st.session_state 取一次(例如 opt_selected_technique_names = st.session_state.get("opt_techniques", [])),与 tab_autowrite 里对 content_techniques 的处理一致。
三、主入口中的调用方式(geo_tool.py)
- 主导航:
tab1, tab2, ..., tab10 = st.tabs([...])不变。 - 每个 Tab 只做两件事:进入上下文 + 调用对应
render_*:
# =======================
# Tab1:关键词蒸馏
# =======================
with tab1:
tab_keywords.render_tab_keywords(storage, ss_init, gen_llm, brand, advantages)
# =======================
# Tab2:自动创作内容(含批量 ZIP / GitHub 模板)
# =======================
with tab2:
tab_autowrite.render_tab_autowrite(
storage, ss_init, gen_llm, brand, advantages,
cfg, record_api_cost, model_defaults
)
# Tab3 及以后:同样模式,with tab3: tab_optimize.render_tab_optimize(...)
- 主入口保留:侧栏、cfg、brand/advantages、gen_llm/verify_llms、storage、
record_api_cost/model_defaults等跨 Tab 共享的构造与配置;Tab 内部不创建这些,只通过参数使用。
四、state 与 theme(已集中)
- state.py:
ss_init(key, default)+init_session_state()。主入口在启动时调用init_session_state();各 Tab 在需要时调用ss_init("xxx", default)。 - theme.py:
inject_global_theme()。主入口在页面配置后调用一次即可。
Tab 模块只接收并调用 ss_init,不直接依赖 state/theme 的实现细节。
五、新增 Tab 时的检查清单
- 在
modules/ui/下新建tab_<name>.py。 - 按上面「结构」写好:导入、本 Tab 用到的工具函数(必要时从 geo_tool 复制)、
render_tab_<name>(...)及完整函数体。 - 在
modules/ui/__init__.py中增加from . import tab_<name>(并对外暴露)。 - 在
geo_tool.py中:删除该 Tab 对应的整块内联代码,改为with tabN: tab_<name>.render_tab_<name>(...),并传入该 Tab 所需的全部参数。 - 确认:无对
geo_tool或会反向依赖主入口的模块的 import;表单提交后若用到表单值,从st.session_state按 key 读取。
按此模式,Tab3(文章优化)及后续 Tab 可与 Tab1/Tab2 保持一致、可维护的拆分方式。