# 通义万相图片生成功能说明 ## 📋 功能概述 通义万相图片生成功能是 GEO 工具的高级功能,用于为文章内容自动生成高质量配图,并智能嵌入到 Markdown 格式的文章中,实现"图文结合"的完整内容输出。 ### 核心价值 - **2026 年 AI 搜索多模态化趋势**:图文结合内容更容易被优先抽取和展示 - **通义万相中文理解极强**:直接用中文 Prompt 效果最佳,人物/文字渲染优秀,合规性高 - **一键完成全流程**:文本 → 配图 Prompt → 生成图片 → 嵌入文章 - **智能插入位置**:自动推荐最佳图片插入位置,避免生硬插入 ## 🎯 功能位置 ### Tab2(自动创作)- 内容生成后 在生成内容后,可以: 1. **🎨 生成配图/视频描述**:一键生成详细的配图描述 2. **🖼️ 生成配图(通义万相)**:基于配图描述生成实际图片 3. **📄 图文结合版本**:查看并下载包含图片的完整 Markdown 文章 ## ⚙️ 配置要求 ### 1. 获取通义万相 API Key 1. 访问 [阿里云 DashScope](https://dashscope.console.aliyun.com/) 2. 开通通义万相服务 3. 获取 API Key(免费额度每天 100-300 张) ### 2. 在工具中配置 1. 打开侧边栏 **⚙️ 全局配置** 2. 找到 **🖼️ 通义万相(图片生成)** 部分 3. 输入你的 API Key 4. 点击 **应用配置** ## 🔄 使用流程 ### 方式一:基于配图占位符生成 1. **生成内容** - 在 Tab2 生成内容(小红书、抖音、微信公众号等支持配图的平台) - 内容中应包含配图占位符(【配图:xxx】) 2. **生成配图描述** - 点击"🎨 生成配图/视频描述"按钮 - 系统自动识别内容中的配图占位符 - 为每个配图位置生成详细的配图描述 3. **生成图片** - 点击"🎨 生成配图(通义万相)"按钮 - 系统为每个配图描述生成对应的图片(每张约需 5-15 秒) - 自动将图片嵌入到 Markdown 文章中 4. **查看和下载** - 查看生成的图片预览 - 查看完整的图文结合版本(Markdown 格式) - 下载 .md 文件或直接复制发布 ### 方式二:直接生成配图(无需占位符) 1. **生成内容** - 在 Tab2 生成任意内容 2. **直接生成配图** - 即使没有配图占位符,也可以直接生成配图 - 选择生成数量(1-2 张) - 点击"🎨 直接生成配图"按钮 - 系统会基于文章内容自动生成合适的配图 3. **查看和下载** - 查看生成的图片预览 - 查看完整的图文结合版本 - 下载或复制发布 ## 📊 功能特性 ### 1. 高质量中文 Prompt 生成 - 自动分析文章主题、核心观点和品牌元素 - 生成 60-120 字的详细中文 Prompt - 根据文章调性自动判断风格(科技感/写实/插画/未来主义) - 自然融入品牌元素,确保合规 ### 2. 智能图片插入位置 - 自动推荐最佳插入点(标题后、关键段落后、结尾总结图等) - 避免生硬插入,提升阅读体验 - 支持手动调整插入位置 ### 3. 图片嵌入 Markdown - 自动将图片 URL 嵌入到 Markdown 格式中 - 格式:`![alt_text](image_url)` - 支持多张图片智能分布 - 保持文章原有结构和格式 ### 4. 图片预览和管理 - 实时预览生成的图片 - 显示每张图片的 Prompt 和 URL - 支持下载图片或上传到图床 - 一键替换原内容为图文版本 ## 💡 使用建议 ### 配图数量建议 - **小红书**:3-5 张配图,生活化、美观 - **知乎**:2-3 张配图,专业、清晰 - **微信公众号**:2-4 张配图,符合文章风格 - **CSDN**:1-3 张配图,技术图表、流程图 - **B站**:1-2 张配图,适合视频封面 ### Prompt 优化建议 - 系统会自动生成高质量的 Prompt,但也可以手动修改 - 建议在生成前先查看配图描述,确认是否符合预期 - 如需重新生成,可以修改 Prompt 后手动调用 ### 图片保存建议 - 图片 URL 为阿里云临时链接,建议: - 及时下载保存 - 上传到图床(如七牛云、又拍云等) - 避免链接失效导致图片丢失 ### 平台适配建议 系统会根据平台自动选择最合适的图片比例: - **文章类平台(16:9 横图)**: - 知乎、微信公众号、CSDN、头条号、百家号、网易号、企鹅号、新浪新闻、搜狐号、一点号、东方财富、原创力文档、邦阅网、新浪博客、简书、GitHub - 尺寸:1344*768(16:9比例,适合文章配图) - **社交类平台(1:1 方图)**: - 小红书、QQ空间 - 尺寸:1024*1024(1:1比例,适合社交分享) - **短视频平台(9:16 竖图)**: - 抖音图文 - 尺寸:768*1344(9:16比例,适合竖屏展示) - **视频类平台(16:9 横图)**: - B站 - 尺寸:1344*768(16:9比例,适合视频封面) **注意**:系统会自动根据选择的平台设置合适的图片比例,无需手动配置。 ## ⚠️ 注意事项 1. **API Key 安全** - API Key 存储在本地 `config.json` 文件中(已在 .gitignore 中) - 不要将 API Key 提交到代码仓库 2. **生成时间** - 每张图片生成约需 5-15 秒 - 批量生成时请耐心等待 - 建议显示加载提示,避免重复点击 3. **免费额度** - 通义万相免费额度每天 100-300 张 - 超出后需要付费使用 - 建议合理控制生成数量 4. **图片链接** - 图片 URL 为临时链接,可能有时效性 - 建议及时下载或上传到图床 - 避免依赖临时链接长期使用 5. **合规性** - 系统会自动过滤敏感词 - 如生成失败,可能是内容不合规 - 建议修改 Prompt 后重新生成 ## 🔧 技术实现 ### API 调用 使用阿里云 DashScope SDK: ```python from dashscope import ImageSynthesis dashscope.api_key = api_key response = ImageSynthesis.call( model="wanx-v1", prompt=prompt, n=1, size="1024*1024" ) ``` ### Prompt 生成 使用 LLM 生成高质量中文 Prompt: ```python prompt = multimodal_gen.generate_tongyi_image_prompt( content=content, brand=brand, llm_chain=llm_chain ) ``` ### 图片嵌入 自动将图片嵌入到 Markdown 中: ```python final_content = multimodal_gen.embed_images_in_markdown( content=original_content, image_data=generated_images ) ``` ## 📚 相关文档 - [多模态提示生成功能](./MULTIMODAL_FEATURE.md) - [平台同步功能](../implementation/PLATFORM_SYNC_IMPLEMENTATION.md) - [快速开始指南](../guides/QUICK_START_GUIDE.md) ## 🆘 常见问题 ### Q: 为什么生成失败? A: 可能的原因: - API Key 未配置或配置错误 - 免费额度已用完 - Prompt 内容不合规 - 网络连接问题 ### Q: 图片链接失效怎么办? A: 建议: - 及时下载图片保存 - 上传到图床服务 - 使用永久链接替换临时链接 ### Q: 可以生成多少张图片? A: - 免费额度每天 100-300 张 - 建议单篇文章生成 1-5 张 - 超出额度需要付费 ### Q: 如何修改图片 Prompt? A: - 在生成配图描述后,可以查看和修改 Prompt - 修改后可以重新生成图片 - 建议保持 Prompt 与文章内容相关