Skip to content

MJ-Studio 文档中心

欢迎使用 MJ-Studio 多模型 AI 工作台文档中心。

项目简介

MJ-Studio 是一个多模型 AI 工作台,支持 AI 绘图、AI 视频生成和 AI 对话功能。数据完全本地化,支持 Docker 一键部署。

核心功能

  • AI 绘图:支持 Midjourney、DALL-E、Gemini、Flux、豆包等多种图像生成模型
  • AI 视频:支持即梦、Veo、Sora、Grok Video 等视频生成模型
  • AI 对话:支持 GPT、Claude、DeepSeek 等大语言模型,流式输出
  • 多助手系统:创建多个专业助手,自定义系统提示词和角色设定
  • 自托管:数据完全本地化,支持 Docker 一键部署

常见问题

支持哪些图片生成模型?

模型特点
Midjourney支持 U/V 操作、图片混合、垫图,参数在提示词中提供(如 --v 6--ar 16:9
Gemini支持多轮对话式图像编辑,垫图效果好
Flux支持负面提示词,flux-kontext 系列支持垫图
DALL-E不支持垫图
豆包中文理解能力强,支持负面提示词
GPT-4o / GPT Image质量高,指令跟随能力强,支持透明背景
Grok风格多样,响应快速
通义万相中文提示词效果好
抠抠图专用抠图工具,自动移除背景,不改变图像内容

支持哪些视频生成模型?

模型特点
即梦支持文生视频和图生视频,可调宽高比、分辨率
Veo支持首帧/尾帧参考图,支持提示词增强和超分辨率
Sora审查严格,不支持人像内容,可调方向、分辨率、时长
Grok Video响应快速,可调宽高比

如何获得透明背景图片?

  • GPT-4o 绘图:在参数中选择透明背景,可直接生成
  • 抠抠图:上传任意图片即可获得透明背景版本,不改变图像内容

哪些模型支持在对话中生图?

GPT-4o 绘图、GPT Image、Sora 绘图、Grok 绘图、通义万相、Gemini 绘图均支持在对话页面中生成图片。

如何配置 API?

在「设置」页面添加上游配置,填写 API 地址和密钥即可。API 地址无需添加 /v1 后缀,系统会自动拼接。

支持任意兼容 OpenAI、Gemini 等格式的 API 服务商。

MJ-Studio - 多模型 AI 工作台