生图功能介绍

MJ-Studio 支持多种主流 AI 绘图模型，提供统一的创作界面和强大的参数定制能力。

功能概述

生图功能允许你通过文字描述生成图片，支持参考图垫图、模型专属参数调节、AI 提示词优化等高级功能。所有任务支持实时状态跟踪、历史记录查看和一键复用。

核心能力

多模型支持：Midjourney、DALL-E、Flux、Gemini、豆包等主流模型
参考图垫图：上传参考图引导生成（部分模型）
参数定制：根据模型类型提供专属参数控件
AI 优化：一键优化提示词，自动生成负面提示词
任务管理：实时状态同步、历史任务复用、回收站恢复

支持的模型

Midjourney

特点：

艺术风格丰富，擅长超现实和艺术化效果
支持 U/V 按钮操作（放大单图、生成变体）
支持 MJ 和 NIJI 两种机器人类型

支持的参数：

负面提示词

使用场景：概念设计、艺术创作、风格化插图

DALL-E 3

特点：

OpenAI 官方模型，生成质量稳定
擅长理解复杂提示词
支持高清模式

支持的参数：

尺寸：1024x1024（方形）、1792x1024（横版）、1024x1792（竖版）
质量：标准、高清
风格：生动（超现实）、自然

使用场景：营销素材、社交媒体配图、通用图像生成

Flux

特点：

开源模型，生成速度快
支持灵活的宽高比配置
支持负面提示词精细控制

支持的参数：

宽高比：1:1、16:9、9:16、4:3、3:4、3:2、2:3、21:9
负面提示词

使用场景：快速原型、批量生成、自定义尺寸需求

豆包绘图

特点：

字节跳动模型，支持中文提示词
丰富的尺寸选项和参数控制
支持水印开关

支持的参数：

尺寸：1024x1024、1152x864、864x1152、1280x720、720x1280、1248x832、832x1248
提示词相关度：1-10（值越大与提示词相关性越强）
随机种子：固定种子可复现结果（-1 为自动）
负面提示词
水印：右下角"AI生成"水印开关

使用场景：中文创作、精细参数调节、可控的随机性

GPT-4o 图像生成

特点：

基于 GPT-4o 的图像生成能力
支持背景透明度控制
质量分级细致

支持的参数：

尺寸：自动、1024x1024、1536x1024、1024x1536
质量：高、中、低
背景：自动、透明、不透明

使用场景：需要透明背景的 Logo/图标、UI 素材

Gemini 绘图

特点：

Google 的多模态模型
响应速度快
理解能力强

支持的参数：无额外参数

使用场景：快速生成、概念验证

其他模型

GPT Image：OpenAI 图像系列模型
Sora 图像：Sora 的图像生成能力
Grok 图像：xAI 的图像生成模型
通义万相：阿里巴巴的图像生成服务
Z-Image：Gitee AI 图像生成
抠抠图：智能背景移除服务

使用方式

基础流程

选择模型
- 在"选择模型"下拉框中选择上游配置和 AI 模型
- 点击右侧信息图标可查看模型详情（API 格式、模型名称）
上传参考图（可选）
- 支持 JPG、PNG 格式，单张最大 10MB
- 最多上传 3 张参考图
- 点击图片可预览，悬停显示删除按钮
- 注意：部分模型不支持参考图（如 DALL-E）
输入提示词
- 在文本框中描述你想要的图片
- 支持多行输入，建议详细描述（风格、元素、场景等）
- 可使用"AI 优化"按钮自动优化提示词（需在设置中配置优化模型）
配置高级选项（可选）
- 点击"高级选项"展开参数面板
- 根据选择的模型，系统会自动显示支持的参数
- 参数数量会显示在"高级选项"旁边（如 +5）
开始生成
- 点击"开始生成"按钮提交任务
- 任务会添加到任务列表，实时显示状态和进度

AI 提示词优化

点击提示词输入框旁的"AI 优化"按钮，系统会：

自动优化提示词结构和用词
根据目标模型特性调整表达方式
为支持负面提示词的模型生成负面提示词（如 Flux、豆包）

配置优化模型：

前往"设置 > 绘图 > AI 优化"
选择用于优化的上游配置和模型
建议使用 GPT-4o 或 Claude 等理解能力强的模型

高级选项说明

高级选项根据选择的模型动态显示，常见参数包括：

尺寸（Size）

适用模型：DALL-E、豆包、GPT-4o 图像

预设常用尺寸（如 1024x1024、1792x1024）
不同模型支持的尺寸选项不同

宽高比（Aspect Ratio）

适用模型：Flux

支持 1:1、16:9、9:16、4:3、3:4、3:2、2:3、21:9
适合创作不同场景的图片（社交媒体、海报、封面等）

质量（Quality）

适用模型：DALL-E、GPT-4o 图像

DALL-E：标准、高清
GPT-4o：高、中、低

风格（Style）

适用模型：DALL-E 3

生动：更加超现实和戏剧化
自然：更加写实和自然

负面提示词（Negative Prompt）

适用模型：Flux、豆包、Z-Image

描述不希望出现的内容（如"模糊、低质量、变形、水印"）
可通过 AI 优化自动生成

随机种子（Seed）

适用模型：豆包

固定种子可复现相同结果（相同提示词 + 种子 = 相同图片）
设为 -1 则每次随机生成
取值范围：-1 到 2147483647

提示词相关度（Guidance Scale）

适用模型：豆包

控制生成结果与提示词的贴合程度
取值范围：1-10
值越大，越严格遵循提示词

水印（Watermark）

适用模型：豆包

开启后在图片右下角添加"AI生成"水印
默认开启

背景（Background）

适用模型：GPT-4o 图像

自动：模型自动决定
透明：生成透明背景（适合 Logo/图标）
不透明：强制不透明背景

任务管理

任务状态

等待提交（pending）：任务已创建，等待系统处理
提交中（submitting）：正在提交到上游 API
处理中（processing）：上游正在生成图片
成功（success）：生成完成
失败（failed）：生成失败，可查看错误日志
已取消（cancelled）：用户主动取消

任务操作

查看详情

点击任务卡片可查看：

完整提示词
模型参数
上游配置信息
生成时间
图片预览（成功时）

查看日志

点击"查看日志"按钮可查看：

请求参数（URL、Headers、Body）
响应内容（状态码、响应体、错误信息）
敏感信息已自动脱敏（API Key、Base64 图片）

重试任务

失败的任务可点击"重试"按钮重新提交（使用相同参数）

取消任务

处理中的任务可点击"取消"按钮中止（同步模型支持，异步模型需等待上游完成）

复用参数

点击任务卡片的"复用"按钮，可将该任务的提示词、参考图和模型参数填充到创作面板，快速创作变体

Midjourney 按钮操作

Midjourney 生成的图片会显示 U1-U4、V1-V4、🔄 等按钮：

U（Upscale）：放大单张图片
V（Variation）：生成变体
🔄（Reroll）：重新生成

筛选和搜索

来源筛选：

工作台：从创作工作台创建的任务
对话：从对话窗口创建的任务（嵌入式绘图）
全部：显示所有任务

任务类型筛选：

图片：图片生成任务
视频：视频生成任务
全部：显示所有类型

关键词搜索：

搜索提示词内容
搜索任务唯一标识符（uniqueId）

回收站

删除的任务会进入回收站，支持：

恢复：将任务恢复到任务列表
永久删除：物理删除单个任务
清空回收站：物理删除所有回收站任务

模型选择建议

需求场景	推荐模型	理由
艺术创作、概念设计	Midjourney	风格化强、支持 U/V 操作
营销素材、通用配图	DALL-E 3	质量稳定、理解能力强
快速原型、批量生成	Flux	速度快、宽高比灵活
中文创作、精细调节	豆包	参数丰富、支持中文
透明背景素材	GPT-4o 图像	支持背景透明度控制
快速验证	Gemini	响应快、成本低

注意事项

参考图兼容性：
- DALL-E、Z-Image 不支持参考图
- 其他模型支持 1-3 张参考图
尺寸限制：
- 参考图单张最大 10MB
- 不同模型支持的输出尺寸不同
提示词建议：
- 英文提示词通常效果更好（除豆包等国产模型）
- 详细描述风格、场景、元素、构图等要素
- 避免过于抽象或矛盾的描述
成本优化：
- 使用预计时间长的模型时，建议先小规模测试
- 利用 AI 优化功能提高成功率，减少重试次数
任务同步：
- 所有任务支持多端同步（同一账号的不同浏览器标签页/设备）
- 任务状态通过 SSE 实时推送，无需手动刷新

生图功能介绍 ​

功能概述 ​

核心能力 ​

支持的模型 ​

Midjourney ​

DALL-E 3 ​

Flux ​

豆包绘图 ​

GPT-4o 图像生成 ​

Gemini 绘图 ​

其他模型 ​

使用方式 ​

基础流程 ​

AI 提示词优化 ​

高级选项说明 ​

尺寸（Size） ​

宽高比（Aspect Ratio） ​

质量（Quality） ​

风格（Style） ​

负面提示词（Negative Prompt） ​

随机种子（Seed） ​

提示词相关度（Guidance Scale） ​

水印（Watermark） ​

背景（Background） ​

任务管理 ​

任务状态 ​

任务操作 ​

查看详情 ​

查看日志 ​

重试任务 ​

取消任务 ​

复用参数 ​

Midjourney 按钮操作 ​

筛选和搜索 ​

回收站 ​

模型选择建议 ​

注意事项 ​

生图功能介绍

功能概述

核心能力

支持的模型

Midjourney

DALL-E 3

Flux

豆包绘图

GPT-4o 图像生成

Gemini 绘图

其他模型

使用方式

基础流程

AI 提示词优化

高级选项说明

尺寸（Size）

宽高比（Aspect Ratio）

质量（Quality）

风格（Style）

负面提示词（Negative Prompt）

随机种子（Seed）

提示词相关度（Guidance Scale）

水印（Watermark）

背景（Background）

任务管理

任务状态

任务操作

查看详情

查看日志

重试任务

取消任务

复用参数

Midjourney 按钮操作

筛选和搜索

回收站

模型选择建议

注意事项