+关注

手机看

微信扫一扫，随时随地看

实测GPT-4o吉卜力漫画风

浮之静

2025-03-27 23:52发布于美国科技领域创作者

+关注

AI划重点 · 全文约3568字，阅读需11分钟

1.实测GPT-4o吉卜力漫画风，为使用者提供无限创作可能，包括填色、扩充或裁剪原图尺寸、细节补充等。

2.吉卜力工作室成立于1985年，以高品质和细腻风格享誉全球，曾推出《千与千寻》等经典作品。

3.除此之外，吉卜力还涉足广告动画、真人影片拍摄、电子游戏美术设计等领域，以及影视、音乐、出版等相关产业。

4.目前，OpenAI已推出新版本gpt-4o，具有更强一致性、广泛世界知识、以及多模态等特点。

5.然而，AI仍无法创造出新的“宫崎骏”，动漫的内核、故事线只有靠人来完成时，才更有温度。

以上内容由腾讯混元大模型生成，仅供参考

最近朋友圈、X 上到处刷屏吉卜力（Studio Ghibli Anime）风格写真，让 ChatGPT 再次出圈（准确来说是新版本 gpt-4o）。它让漫画创作不再是高成本艺术品，普通人也触手可及。当然，生成吉卜力风格只是 gpt-4o 能力很小的一部分，因 GPT 模型拥有更强一致性、广泛世界知识、以及多模态等特点，可为使用者们提供无限的创作可能...

宫崎骏“我已经受够了”名场面，他老人家或许做梦也没想到网友居然可以用 AI 生成他自己画风的自画像（彻底循环了）。

📌 吉卜力工作室

吉卜力工作室（日语：スタジオジブリ，英语：Studio Ghibli, Inc.）是一家位于日本东京都小金井市的动画制作公司，隶属于日本电视台，是日本动画协会成员。工作室成立于 1985 年 6 月，由动画导演宫崎骏、高畑勋与德间书店编辑铃木敏夫、社长德间康快共同创办，最初目的是方便宫崎骏与高畑勋制作动画。起初位于东京都吉祥寺地区，1992 年迁至现址，2005 年成为独立公司。

吉卜力的动画电影以高品质和细腻风格享誉全球。在日本动画电影票房前十名中，其作品占据六席。其中，2001 年推出的《千与千寻》曾长期位居日本电影票房冠军，并成为日本首部获得奥斯卡最佳动画片奖的作品，直至 2020 年底才被《鬼灭之刃剧场版无限列车篇》超越。

除动画电影外，吉卜力还涉足广告动画、真人影片拍摄、电子游戏美术设计，以及影视、音乐、出版等相关产业。1996 年，吉卜力与迪士尼日本分公司合作，推动其影音产品在国际市场的发行。

作为日本流行文化的重要象征，以吉卜力为主题的设施包括 2001 年在三鹰市开馆的三鹰之森吉卜力美术馆，以及 2022 年在爱知县开幕的吉卜力公园。

工作室名称“吉卜力”由宫崎骏所命名，灵感来自二战时期意大利飞机制造商卡普罗尼开发的侦察机 “Ghibli”，意为在撒哈拉沙漠上吹着的热风。当时将意大利语罗马拼音"Gi·bu·ri"（ギブリ）误写成"Ji·bu·ri"（ジブリ），后来便未再更正，沿用至今。

以龙猫为造型的吉卜力工作室标志

图像处理

图像处理的场景挺多，主要有填色、扩充或裁剪原图尺寸、细节补充、改变风格、多图合并、抠图或删除背景为透明色等。所以它其实是一项复杂工作，专业人士常使用 Photoshop^[1]（PS）来处理图片。但 PS 操作复杂，安装包大，对普通用户来说有点大材小用，所以市面上还出现了很多简化版工具（如美图秀秀）。虽然简化了许多，但仍有一定的学习使用成本，而且普通修图软件很难对图片风格进行深度修改。

除了闭源的 Midjourney、Gemini 2.0 Flash (Image Generation) Experimental（目前免费，探索 Gemini 2.0 Flash 图文混合生成）、新版 gpt-4o 外，可能还有喜欢折腾的朋友尝试过 Stable Diffusion 之类的开源方案（Stable Diffusion web UI^[2]、ComfyUI^[3] 等），它们往往需要下载各种插件或配置复杂的工作流才能进行工作，这对普通用户来说学习成本过高（调各种参数、记各种正反向 prompt）。

以下是使用 gpt-4o 进行的部分尝试，效果惊人！

填色

💡 Prompt

请为老照片上色

改变风格

上传图片后直接发以下三种提示词之一即可，但有些朋友可能会遇到模型拒绝生成。网上有评论说必须严格使用下面的提示词格式，但我自己测试过长提示描述包含“吉卜力风格”也可以触发。根据实测，我自己总结了两个影响因素：

你的 ChatGPT 账号还没推送新版本 gpt-4o
OpenAI 误判，你可以尝试新开对话或者换种方式提问（我也偶尔触发拒绝生成）。

💡 Prompt

改为吉卜力风格
convert to studio ghibli anime
turn into ghibli cartoon style

我测试了一些真人图片和动漫角色，效果都不错。如果生成的动漫线条过于简单，也可以要求补充更多细节（如背景、服饰等）。

四格漫画

💡 Prompt

小猫咪将餐桌上的酒瓶打翻在地上，碎了一地，之后被主人训斥。根据以上场景生成吉卜力风格的 4 格漫画。

当使用简单的一句话式 prompt 让其生成四格漫画时，gpt-4o 可能会产生两种行为模式：

直接生成图像
先输出 4 张分镜描述，询问你是否需要补充其他细节

直接生成漫画可能会不连贯，这时你就需要强制要求 gpt-4o 先生成分镜，再生成漫画图片。

💬 gpt-4o 默认生成分镜

好的，来点吉卜力那味儿的温情幽默。以下是一个符合场景的 4 格漫画分镜设计，画面色调温暖、细节丰富，小猫表情生动、有灵性：

第一格：

画面内容：
黄昏时分，餐桌上摆着晚餐和一瓶半满的酒，夕阳透过窗户洒在木质地板上。小猫咪（毛茸茸的橘白相间）悄悄跳上桌子，好奇地盯着酒瓶。

旁白或对话：
（无文字，仅靠画面表达“猫咪好奇”）

第二格：

画面内容：
猫咪用爪子轻轻拨了一下酒瓶，酒瓶摇晃几下后，“啪”地一声掉落，红酒四溅，瓶子摔得粉碎，地上红得像一滩鲜血。

旁白或对话：
“啪——！！！”

第三格：

画面内容：
主人（温柔但略带无奈的青年或老太太）冲进来，满脸震惊，猫咪低头坐在地上，耳朵耷拉，像做错事的孩子。

对话：
主人：“你在干什么啊？！这可是我存了三年的酒！”

第四格：

画面内容：
主人一边叹气打扫，一边偷看猫咪，小猫蜷在角落里，两只大眼睛湿漉漉的，可怜巴巴地望着他。下一秒，主人露出一丝笑容，把猫咪抱起来。

对话：
主人：“唉……算了，下次别调皮了。”
猫咪：“喵～”（尾巴悄悄晃了一下）

如果你需要我根据这个分镜生成图像，我也可以直接画出四格漫画风格图，要不要来一张？

如果对默认生成的分镜不满意，我们也可以自己手写提示词。

💡 Prompt

生成吉卜力风格的 4 格漫画：

小猫咪爬上餐桌看到餐桌边上有一个酒瓶
它十分好奇，用爪子挠了一下酒瓶，瓶子开始倾倒
酒瓶在地上碎了，酒水到处都是
主人拎起小猫咪，严厉训斥

虽然上面的四格漫画完成度很高，但酒瓶掉落在地上没碎，旁边还多了一些碎片，这些违反物理规则的东西，就证明 AI 生成漫画仍然有很长的路要走。

人物插画

以下是连续提示词，借助大模型的上下文理解，可以实现风格的轻松同步。当频繁修改风格，且上下文过长时，可能会相互影响，很难保持稳定输出效果。为了保持更好的一致性，可以新开对话来保证上下文的简洁。ChatGPT 在生成英文方面没有太大问题，中文则可能出现乱码字符（也不是绝对的，偶尔也可以调试出完美的中文，有点随机了）。

💡 Prompt

改成吉卜力风格
调整画面为 16:9, 在侧面添加一段关于“爱因斯坦”的中英文对照介绍（英文为主，简体中文为辅），最佳排版效果
继续生成，这张图是牛顿
继续，这是特斯拉

LOGO 生成

这个没啥可说的，直接描述特征即可，如“毛绒材质”、“渐变色毛玻璃”等。

单词卡片

这是比较有意思的尝试，可以让学习变得轻松起来，很适合小朋友。虽然目前音标和中文还有一些问题，但此场景潜力巨大，感兴趣的朋友可以自行尝试。

💡 Prompt

你是英语单词闪卡制作大师，可根据输入的主题词生成“吉卜力风格”图片并以此拓展。当我输入“电脑”时，你会生成一张与电脑相关的物品，并用箭头分步介绍键盘/鼠标/显示器等。包含英文/音标/中文。

💬 gpt-4o 默认生成的提示（可作为参考）

太棒了，这个点子有创意！我来扮演你的“吉卜力风格”英语单词闪卡制作大师——既有梦幻画风，又有实用词汇教学。你输入的词是 “电脑”，那我会：

生成一张吉卜力风格的图：温馨房间里的一台老旧却有灵魂的电脑，阳光洒在键盘上，小猫趴在显示器旁，画风清新又富有细节。
用箭头标注电脑的主要组成部分：keyboard、mouse、monitor 等，并附上英文、音标和中文翻译。

🎨 下面是闪卡内容设计稿：

🔤 中心词：
Computer /kəmˈpjuːtər/ —— 电脑 🖥️

📌 标注内容（图片中箭头指向对应部件）：

Monitor
/ˈmɒnɪtər/ —— 显示器
Keyboard
/ˈkiːbɔːrd/ —— 键盘
Mouse
/maʊs/ —— 鼠标
CPU
/ˌsiːpiːˈjuː/ —— 中央处理器
USB Port
/ˌjuːˌesˈbiː pɔːrt/ —— USB 接口
Headphones
/ˈhedfəʊnz/ —— 耳机
Desk
/desk/ —— 书桌
Screen
/skriːn/ —— 屏幕（显示器的表面）

我现在来生成图像，请稍等片刻 🎨

其他

还有很多案例这里就不一一演示了，大家可自行尝试（prompt 在我看来没啥技巧，知道专业术语，直接怼描述就可以了）。这里再放几张我多次调试 prompt 生成的图片，图中的中文“唐”字也近乎完美。

当然，还可以用来学技术，还记得之前讲的 MCP 吗？这里也有一张别人生成好的图（不记得了看这里：浅谈 Agent、MCP、OpenAI Responses API）。

📌 OpenAI 支持 MCP

MCP 正在成为标准，sam 最近发帖明确提到：大家都喜欢 MCP，我们也很高兴将其集成到我们的产品中。目前，Agents SDK 已率先支持 MCP，你现在就可以将 Model Context Protocol（MCP）服务器连接到 Agents（OpenAI Agents SDK - MCP^[4]）。我们也正在为 OpenAI API 和 ChatGPT 桌面应用添加 MCP 支持，相关更新将在未来几个月内发布，敬请期待。