1.实测GPT-4o吉卜力漫画风,为使用者提供无限创作可能,包括填色、扩充或裁剪原图尺寸、细节补充等。
2.吉卜力工作室成立于1985年,以高品质和细腻风格享誉全球,曾推出《千与千寻》等经典作品。
3.除此之外,吉卜力还涉足广告动画、真人影片拍摄、电子游戏美术设计等领域,以及影视、音乐、出版等相关产业。
4.目前,OpenAI已推出新版本gpt-4o,具有更强一致性、广泛世界知识、以及多模态等特点。
5.然而,AI仍无法创造出新的“宫崎骏”,动漫的内核、故事线只有靠人来完成时,才更有温度。
以上内容由腾讯混元大模型生成,仅供参考
最近朋友圈、X 上到处刷屏吉卜力(Studio Ghibli Anime)风格写真,让 ChatGPT 再次出圈(准确来说是新版本 gpt-4o)。它让漫画创作不再是高成本艺术品,普通人也触手可及。当然,生成吉卜力风格只是 gpt-4o 能力很小的一部分,因 GPT 模型拥有更强一致性、广泛世界知识、以及多模态等特点,可为使用者们提供无限的创作可能...
宫崎骏“我已经受够了”名场面,他老人家或许做梦也没想到网友居然可以用 AI 生成他自己画风的自画像(彻底循环了)。
吉卜力工作室(日语:スタジオジブリ,英语:Studio Ghibli, Inc.)是一家位于日本东京都小金井市的动画制作公司,隶属于日本电视台,是日本动画协会成员。工作室成立于 1985 年 6 月,由动画导演宫崎骏、高畑勋与德间书店编辑铃木敏夫、社长德间康快共同创办,最初目的是方便宫崎骏与高畑勋制作动画。起初位于东京都吉祥寺地区,1992 年迁至现址,2005 年成为独立公司。
吉卜力的动画电影以高品质和细腻风格享誉全球。在日本动画电影票房前十名中,其作品占据六席。其中,2001 年推出的《千与千寻》曾长期位居日本电影票房冠军,并成为日本首部获得奥斯卡最佳动画片奖的作品,直至 2020 年底才被《鬼灭之刃剧场版 无限列车篇》超越。
除动画电影外,吉卜力还涉足广告动画、真人影片拍摄、电子游戏美术设计,以及影视、音乐、出版等相关产业。1996 年,吉卜力与迪士尼日本分公司合作,推动其影音产品在国际市场的发行。
作为日本流行文化的重要象征,以吉卜力为主题的设施包括 2001 年在三鹰市开馆的三鹰之森吉卜力美术馆,以及 2022 年在爱知县开幕的吉卜力公园。
工作室名称“吉卜力”由宫崎骏所命名,灵感来自二战时期意大利飞机制造商卡普罗尼开发的侦察机 “Ghibli”,意为在撒哈拉沙漠上吹着的热风。当时将意大利语罗马拼音"Gi·bu·ri"(ギブリ)误写成"Ji·bu·ri"(ジブリ),后来便未再更正,沿用至今。
以龙猫为造型的吉卜力工作室标志
图像处理
图像处理的场景挺多,主要有填色、扩充或裁剪原图尺寸、细节补充、改变风格、多图合并、抠图或删除背景为透明色等。所以它其实是一项复杂工作,专业人士常使用 Photoshop[1](PS)来处理图片。但 PS 操作复杂,安装包大,对普通用户来说有点大材小用,所以市面上还出现了很多简化版工具(如美图秀秀)。虽然简化了许多,但仍有一定的学习使用成本,而且普通修图软件很难对图片风格进行深度修改。
除了闭源的 Midjourney、Gemini 2.0 Flash (Image Generation) Experimental(目前免费,探索 Gemini 2.0 Flash 图文混合生成)、新版 gpt-4o 外,可能还有喜欢折腾的朋友尝试过 Stable Diffusion 之类的开源方案(Stable Diffusion web UI[2]、ComfyUI[3] 等),它们往往需要下载各种插件或配置复杂的工作流才能进行工作,这对普通用户来说学习成本过高(调各种参数、记各种正反向 prompt)。
以下是使用 gpt-4o 进行的部分尝试,效果惊人!
填色
请为老照片上色
改变风格
上传图片后直接发以下三种提示词之一即可,但有些朋友可能会遇到模型拒绝生成。网上有评论说必须严格使用下面的提示词格式,但我自己测试过长提示描述包含“吉卜力风格”也可以触发。根据实测,我自己总结了两个影响因素:
你的 ChatGPT 账号还没推送新版本 gpt-4o OpenAI 误判,你可以尝试新开对话或者换种方式提问(我也偶尔触发拒绝生成)。
改为吉卜力风格 convert to studio ghibli anime turn into ghibli cartoon style
我测试了一些真人图片和动漫角色,效果都不错。如果生成的动漫线条过于简单,也可以要求补充更多细节(如背景、服饰等)。
四格漫画
小猫咪将餐桌上的酒瓶打翻在地上,碎了一地,之后被主人训斥。根据以上场景生成吉卜力风格的 4 格漫画。
当使用简单的一句话式 prompt 让其生成四格漫画时,gpt-4o 可能会产生两种行为模式:
直接生成图像 先输出 4 张分镜描述,询问你是否需要补充其他细节
直接生成漫画可能会不连贯,这时你就需要强制要求 gpt-4o 先生成分镜,再生成漫画图片。
好的,来点吉卜力那味儿的温情幽默。以下是一个符合场景的 4 格漫画分镜设计,画面色调温暖、细节丰富,小猫表情生动、有灵性:
第一格:
画面内容:
黄昏时分,餐桌上摆着晚餐和一瓶半满的酒,夕阳透过窗户洒在木质地板上。小猫咪(毛茸茸的橘白相间)悄悄跳上桌子,好奇地盯着酒瓶。
旁白或对话:
(无文字,仅靠画面表达“猫咪好奇”)
第二格:
画面内容:
猫咪用爪子轻轻拨了一下酒瓶,酒瓶摇晃几下后,“啪”地一声掉落,红酒四溅,瓶子摔得粉碎,地上红得像一滩鲜血。
旁白或对话:
“啪——!!!”
第三格:
画面内容:
主人(温柔但略带无奈的青年或老太太)冲进来,满脸震惊,猫咪低头坐在地上,耳朵耷拉,像做错事的孩子。
对话:
主人:“你在干什么啊?!这可是我存了三年的酒!”
第四格:
画面内容:
主人一边叹气打扫,一边偷看猫咪,小猫蜷在角落里,两只大眼睛湿漉漉的,可怜巴巴地望着他。下一秒,主人露出一丝笑容,把猫咪抱起来。
对话:
主人:“唉……算了,下次别调皮了。”
猫咪:“喵~”(尾巴悄悄晃了一下)
如果你需要我根据这个分镜生成图像,我也可以直接画出四格漫画风格图,要不要来一张?
如果对默认生成的分镜不满意,我们也可以自己手写提示词。
生成吉卜力风格的 4 格漫画:
小猫咪爬上餐桌看到餐桌边上有一个酒瓶 它十分好奇,用爪子挠了一下酒瓶,瓶子开始倾倒 酒瓶在地上碎了,酒水到处都是 主人拎起小猫咪,严厉训斥
虽然上面的四格漫画完成度很高,但酒瓶掉落在地上没碎,旁边还多了一些碎片,这些违反物理规则的东西,就证明 AI 生成漫画仍然有很长的路要走。
人物插画
以下是连续提示词,借助大模型的上下文理解,可以实现风格的轻松同步。当频繁修改风格,且上下文过长时,可能会相互影响,很难保持稳定输出效果。为了保持更好的一致性,可以新开对话来保证上下文的简洁。ChatGPT 在生成英文方面没有太大问题,中文则可能出现乱码字符(也不是绝对的,偶尔也可以调试出完美的中文,有点随机了)。
改成吉卜力风格 调整画面为 16:9, 在侧面添加一段关于“爱因斯坦”的中英文对照介绍(英文为主,简体中文为辅),最佳排版效果 继续生成,这张图是牛顿 继续,这是特斯拉
LOGO 生成
这个没啥可说的,直接描述特征即可,如“毛绒材质”、“渐变色毛玻璃”等。
单词卡片
这是比较有意思的尝试,可以让学习变得轻松起来,很适合小朋友。虽然目前音标和中文还有一些问题,但此场景潜力巨大,感兴趣的朋友可以自行尝试。
你是英语单词闪卡制作大师,可根据输入的主题词生成“吉卜力风格”图片并以此拓展。当我输入“电脑”时,你会生成一张与电脑相关的物品,并用箭头分步介绍键盘/鼠标/显示器等。包含英文/音标/中文。
太棒了,这个点子有创意!我来扮演你的“吉卜力风格”英语单词闪卡制作大师——既有梦幻画风,又有实用词汇教学。你输入的词是 “电脑”,那我会:
生成一张吉卜力风格的图:温馨房间里的一台老旧却有灵魂的电脑,阳光洒在键盘上,小猫趴在显示器旁,画风清新又富有细节。 用箭头标注电脑的主要组成部分:keyboard、mouse、monitor 等,并附上英文、音标和中文翻译。
🎨 下面是闪卡内容设计稿:
🔤 中心词:
Computer /kəmˈpjuːtər/ —— 电脑 🖥️
📌 标注内容(图片中箭头指向对应部件):
- Monitor
/ˈmɒnɪtər/ —— 显示器 - Keyboard
/ˈkiːbɔːrd/ —— 键盘 - Mouse
/maʊs/ —— 鼠标 - CPU
/ˌsiːpiːˈjuː/ —— 中央处理器 - USB Port
/ˌjuːˌesˈbiː pɔːrt/ —— USB 接口 - Headphones
/ˈhedfəʊnz/ —— 耳机 - Desk
/desk/ —— 书桌 - Screen
/skriːn/ —— 屏幕(显示器的表面)
我现在来生成图像,请稍等片刻 🎨
其他
还有很多案例这里就不一一演示了,大家可自行尝试(prompt 在我看来没啥技巧,知道专业术语,直接怼描述就可以了)。这里再放几张我多次调试 prompt 生成的图片,图中的中文“唐”字也近乎完美。
当然,还可以用来学技术,还记得之前讲的 MCP 吗?这里也有一张别人生成好的图(不记得了看这里:浅谈 Agent、MCP、OpenAI Responses API)。
MCP 正在成为标准,sam 最近发帖明确提到:大家都喜欢 MCP,我们也很高兴将其集成到我们的产品中。目前,Agents SDK 已率先支持 MCP,你现在就可以将 Model Context Protocol(MCP)服务器连接到 Agents(OpenAI Agents SDK - MCP[4])。我们也正在为 OpenAI API 和 ChatGPT 桌面应用添加 MCP 支持,相关更新将在未来几个月内发布,敬请期待。
结语
AI 正在让创作变得简单,我们在批量化制造“垃圾”的同时,如何守住人类所特有的东西似乎变得愈加珍贵。AI 可以取代宫崎骏,但在很长的时间里都无法创造出新的“宫崎骏”。动漫的内核、故事线也只有靠人来完成时,才更有温度!
References
Photoshop: https://www.adobe.com/products/photoshop.html
[2]Stable Diffusion web UI: https://github.com/AUTOMATIC1111/stable-diffusion-webui
[3]ComfyUI: https://github.com/comfyanonymous/ComfyUI
[4]OpenAI Agents SDK - MCP: https://openai.github.io/openai-agents-python/mcp