255 lines
7.2 KiB
Markdown
255 lines
7.2 KiB
Markdown
|
|
# 通义万相图片生成功能说明
|
|||
|
|
|
|||
|
|
## 📋 功能概述
|
|||
|
|
|
|||
|
|
通义万相图片生成功能是 GEO 工具的高级功能,用于为文章内容自动生成高质量配图,并智能嵌入到 Markdown 格式的文章中,实现"图文结合"的完整内容输出。
|
|||
|
|
|
|||
|
|
### 核心价值
|
|||
|
|
|
|||
|
|
- **2026 年 AI 搜索多模态化趋势**:图文结合内容更容易被优先抽取和展示
|
|||
|
|
- **通义万相中文理解极强**:直接用中文 Prompt 效果最佳,人物/文字渲染优秀,合规性高
|
|||
|
|
- **一键完成全流程**:文本 → 配图 Prompt → 生成图片 → 嵌入文章
|
|||
|
|
- **智能插入位置**:自动推荐最佳图片插入位置,避免生硬插入
|
|||
|
|
|
|||
|
|
## 🎯 功能位置
|
|||
|
|
|
|||
|
|
### Tab2(自动创作)- 内容生成后
|
|||
|
|
|
|||
|
|
在生成内容后,可以:
|
|||
|
|
|
|||
|
|
1. **🎨 生成配图/视频描述**:一键生成详细的配图描述
|
|||
|
|
2. **🖼️ 生成配图(通义万相)**:基于配图描述生成实际图片
|
|||
|
|
3. **📄 图文结合版本**:查看并下载包含图片的完整 Markdown 文章
|
|||
|
|
|
|||
|
|
## ⚙️ 配置要求
|
|||
|
|
|
|||
|
|
### 1. 获取通义万相 API Key
|
|||
|
|
|
|||
|
|
1. 访问 [阿里云 DashScope](https://dashscope.console.aliyun.com/)
|
|||
|
|
2. 开通通义万相服务
|
|||
|
|
3. 获取 API Key(免费额度每天 100-300 张)
|
|||
|
|
|
|||
|
|
### 2. 在工具中配置
|
|||
|
|
|
|||
|
|
1. 打开侧边栏 **⚙️ 全局配置**
|
|||
|
|
2. 找到 **🖼️ 通义万相(图片生成)** 部分
|
|||
|
|
3. 输入你的 API Key
|
|||
|
|
4. 点击 **应用配置**
|
|||
|
|
|
|||
|
|
## 🔄 使用流程
|
|||
|
|
|
|||
|
|
### 方式一:基于配图占位符生成
|
|||
|
|
|
|||
|
|
1. **生成内容**
|
|||
|
|
- 在 Tab2 生成内容(小红书、抖音、微信公众号等支持配图的平台)
|
|||
|
|
- 内容中应包含配图占位符(【配图:xxx】)
|
|||
|
|
|
|||
|
|
2. **生成配图描述**
|
|||
|
|
- 点击"🎨 生成配图/视频描述"按钮
|
|||
|
|
- 系统自动识别内容中的配图占位符
|
|||
|
|
- 为每个配图位置生成详细的配图描述
|
|||
|
|
|
|||
|
|
3. **生成图片**
|
|||
|
|
- 点击"🎨 生成配图(通义万相)"按钮
|
|||
|
|
- 系统为每个配图描述生成对应的图片(每张约需 5-15 秒)
|
|||
|
|
- 自动将图片嵌入到 Markdown 文章中
|
|||
|
|
|
|||
|
|
4. **查看和下载**
|
|||
|
|
- 查看生成的图片预览
|
|||
|
|
- 查看完整的图文结合版本(Markdown 格式)
|
|||
|
|
- 下载 .md 文件或直接复制发布
|
|||
|
|
|
|||
|
|
### 方式二:直接生成配图(无需占位符)
|
|||
|
|
|
|||
|
|
1. **生成内容**
|
|||
|
|
- 在 Tab2 生成任意内容
|
|||
|
|
|
|||
|
|
2. **直接生成配图**
|
|||
|
|
- 即使没有配图占位符,也可以直接生成配图
|
|||
|
|
- 选择生成数量(1-2 张)
|
|||
|
|
- 点击"🎨 直接生成配图"按钮
|
|||
|
|
- 系统会基于文章内容自动生成合适的配图
|
|||
|
|
|
|||
|
|
3. **查看和下载**
|
|||
|
|
- 查看生成的图片预览
|
|||
|
|
- 查看完整的图文结合版本
|
|||
|
|
- 下载或复制发布
|
|||
|
|
|
|||
|
|
## 📊 功能特性
|
|||
|
|
|
|||
|
|
### 1. 高质量中文 Prompt 生成
|
|||
|
|
|
|||
|
|
- 自动分析文章主题、核心观点和品牌元素
|
|||
|
|
- 生成 60-120 字的详细中文 Prompt
|
|||
|
|
- 根据文章调性自动判断风格(科技感/写实/插画/未来主义)
|
|||
|
|
- 自然融入品牌元素,确保合规
|
|||
|
|
|
|||
|
|
### 2. 智能图片插入位置
|
|||
|
|
|
|||
|
|
- 自动推荐最佳插入点(标题后、关键段落后、结尾总结图等)
|
|||
|
|
- 避免生硬插入,提升阅读体验
|
|||
|
|
- 支持手动调整插入位置
|
|||
|
|
|
|||
|
|
### 3. 图片嵌入 Markdown
|
|||
|
|
|
|||
|
|
- 自动将图片 URL 嵌入到 Markdown 格式中
|
|||
|
|
- 格式:``
|
|||
|
|
- 支持多张图片智能分布
|
|||
|
|
- 保持文章原有结构和格式
|
|||
|
|
|
|||
|
|
### 4. 图片预览和管理
|
|||
|
|
|
|||
|
|
- 实时预览生成的图片
|
|||
|
|
- 显示每张图片的 Prompt 和 URL
|
|||
|
|
- 支持下载图片或上传到图床
|
|||
|
|
- 一键替换原内容为图文版本
|
|||
|
|
|
|||
|
|
## 💡 使用建议
|
|||
|
|
|
|||
|
|
### 配图数量建议
|
|||
|
|
|
|||
|
|
- **小红书**:3-5 张配图,生活化、美观
|
|||
|
|
- **知乎**:2-3 张配图,专业、清晰
|
|||
|
|
- **微信公众号**:2-4 张配图,符合文章风格
|
|||
|
|
- **CSDN**:1-3 张配图,技术图表、流程图
|
|||
|
|
- **B站**:1-2 张配图,适合视频封面
|
|||
|
|
|
|||
|
|
### Prompt 优化建议
|
|||
|
|
|
|||
|
|
- 系统会自动生成高质量的 Prompt,但也可以手动修改
|
|||
|
|
- 建议在生成前先查看配图描述,确认是否符合预期
|
|||
|
|
- 如需重新生成,可以修改 Prompt 后手动调用
|
|||
|
|
|
|||
|
|
### 图片保存建议
|
|||
|
|
|
|||
|
|
- 图片 URL 为阿里云临时链接,建议:
|
|||
|
|
- 及时下载保存
|
|||
|
|
- 上传到图床(如七牛云、又拍云等)
|
|||
|
|
- 避免链接失效导致图片丢失
|
|||
|
|
|
|||
|
|
### 平台适配建议
|
|||
|
|
|
|||
|
|
系统会根据平台自动选择最合适的图片比例:
|
|||
|
|
|
|||
|
|
- **文章类平台(16:9 横图)**:
|
|||
|
|
- 知乎、微信公众号、CSDN、头条号、百家号、网易号、企鹅号、新浪新闻、搜狐号、一点号、东方财富、原创力文档、邦阅网、新浪博客、简书、GitHub
|
|||
|
|
- 尺寸:1344*768(16:9比例,适合文章配图)
|
|||
|
|
|
|||
|
|
- **社交类平台(1:1 方图)**:
|
|||
|
|
- 小红书、QQ空间
|
|||
|
|
- 尺寸:1024*1024(1:1比例,适合社交分享)
|
|||
|
|
|
|||
|
|
- **短视频平台(9:16 竖图)**:
|
|||
|
|
- 抖音图文
|
|||
|
|
- 尺寸:768*1344(9:16比例,适合竖屏展示)
|
|||
|
|
|
|||
|
|
- **视频类平台(16:9 横图)**:
|
|||
|
|
- B站
|
|||
|
|
- 尺寸:1344*768(16:9比例,适合视频封面)
|
|||
|
|
|
|||
|
|
**注意**:系统会自动根据选择的平台设置合适的图片比例,无需手动配置。
|
|||
|
|
|
|||
|
|
## ⚠️ 注意事项
|
|||
|
|
|
|||
|
|
1. **API Key 安全**
|
|||
|
|
- API Key 存储在本地 `config.json` 文件中(已在 .gitignore 中)
|
|||
|
|
- 不要将 API Key 提交到代码仓库
|
|||
|
|
|
|||
|
|
2. **生成时间**
|
|||
|
|
- 每张图片生成约需 5-15 秒
|
|||
|
|
- 批量生成时请耐心等待
|
|||
|
|
- 建议显示加载提示,避免重复点击
|
|||
|
|
|
|||
|
|
3. **免费额度**
|
|||
|
|
- 通义万相免费额度每天 100-300 张
|
|||
|
|
- 超出后需要付费使用
|
|||
|
|
- 建议合理控制生成数量
|
|||
|
|
|
|||
|
|
4. **图片链接**
|
|||
|
|
- 图片 URL 为临时链接,可能有时效性
|
|||
|
|
- 建议及时下载或上传到图床
|
|||
|
|
- 避免依赖临时链接长期使用
|
|||
|
|
|
|||
|
|
5. **合规性**
|
|||
|
|
- 系统会自动过滤敏感词
|
|||
|
|
- 如生成失败,可能是内容不合规
|
|||
|
|
- 建议修改 Prompt 后重新生成
|
|||
|
|
|
|||
|
|
## 🔧 技术实现
|
|||
|
|
|
|||
|
|
### API 调用
|
|||
|
|
|
|||
|
|
使用阿里云 DashScope SDK:
|
|||
|
|
|
|||
|
|
```python
|
|||
|
|
from dashscope import ImageSynthesis
|
|||
|
|
|
|||
|
|
dashscope.api_key = api_key
|
|||
|
|
response = ImageSynthesis.call(
|
|||
|
|
model="wanx-v1",
|
|||
|
|
prompt=prompt,
|
|||
|
|
n=1,
|
|||
|
|
size="1024*1024"
|
|||
|
|
)
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
### Prompt 生成
|
|||
|
|
|
|||
|
|
使用 LLM 生成高质量中文 Prompt:
|
|||
|
|
|
|||
|
|
```python
|
|||
|
|
prompt = multimodal_gen.generate_tongyi_image_prompt(
|
|||
|
|
content=content,
|
|||
|
|
brand=brand,
|
|||
|
|
llm_chain=llm_chain
|
|||
|
|
)
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
### 图片嵌入
|
|||
|
|
|
|||
|
|
自动将图片嵌入到 Markdown 中:
|
|||
|
|
|
|||
|
|
```python
|
|||
|
|
final_content = multimodal_gen.embed_images_in_markdown(
|
|||
|
|
content=original_content,
|
|||
|
|
image_data=generated_images
|
|||
|
|
)
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
## 📚 相关文档
|
|||
|
|
|
|||
|
|
- [多模态提示生成功能](./MULTIMODAL_FEATURE.md)
|
|||
|
|
- [平台同步功能](../implementation/PLATFORM_SYNC_IMPLEMENTATION.md)
|
|||
|
|
- [快速开始指南](../guides/QUICK_START_GUIDE.md)
|
|||
|
|
|
|||
|
|
## 🆘 常见问题
|
|||
|
|
|
|||
|
|
### Q: 为什么生成失败?
|
|||
|
|
|
|||
|
|
A: 可能的原因:
|
|||
|
|
- API Key 未配置或配置错误
|
|||
|
|
- 免费额度已用完
|
|||
|
|
- Prompt 内容不合规
|
|||
|
|
- 网络连接问题
|
|||
|
|
|
|||
|
|
### Q: 图片链接失效怎么办?
|
|||
|
|
|
|||
|
|
A: 建议:
|
|||
|
|
- 及时下载图片保存
|
|||
|
|
- 上传到图床服务
|
|||
|
|
- 使用永久链接替换临时链接
|
|||
|
|
|
|||
|
|
### Q: 可以生成多少张图片?
|
|||
|
|
|
|||
|
|
A:
|
|||
|
|
- 免费额度每天 100-300 张
|
|||
|
|
- 建议单篇文章生成 1-5 张
|
|||
|
|
- 超出额度需要付费
|
|||
|
|
|
|||
|
|
### Q: 如何修改图片 Prompt?
|
|||
|
|
|
|||
|
|
A:
|
|||
|
|
- 在生成配图描述后,可以查看和修改 Prompt
|
|||
|
|
- 修改后可以重新生成图片
|
|||
|
|
- 建议保持 Prompt 与文章内容相关
|