客户端
游戏
无障碍

15

评论

33

52

手机看

微信扫一扫,随时随地看

实测GPT-4o吉卜力漫画风

AI划重点 · 全文约3568字,阅读需11分钟

1.实测GPT-4o吉卜力漫画风,为使用者提供无限创作可能,包括填色、扩充或裁剪原图尺寸、细节补充等。

2.吉卜力工作室成立于1985年,以高品质和细腻风格享誉全球,曾推出《千与千寻》等经典作品。

3.除此之外,吉卜力还涉足广告动画、真人影片拍摄、电子游戏美术设计等领域,以及影视、音乐、出版等相关产业。

4.目前,OpenAI已推出新版本gpt-4o,具有更强一致性、广泛世界知识、以及多模态等特点。

5.然而,AI仍无法创造出新的“宫崎骏”,动漫的内核、故事线只有靠人来完成时,才更有温度。

以上内容由腾讯混元大模型生成,仅供参考

最近朋友圈、X 上到处刷屏吉卜力(Studio Ghibli Anime)风格写真,让 ChatGPT 再次出圈(准确来说是新版本 gpt-4o)。它让漫画创作不再是高成本艺术品,普通人也触手可及。当然,生成吉卜力风格只是 gpt-4o 能力很小的一部分,因 GPT 模型拥有更强一致性、广泛世界知识、以及多模态等特点,可为使用者们提供无限的创作可能...

宫崎骏“我已经受够了”名场面,他老人家或许做梦也没想到网友居然可以用 AI 生成他自己画风的自画像(彻底循环了)。

图片
📌 吉卜力工作室

吉卜力工作室(日语:スタジオジブリ,英语:Studio Ghibli, Inc.)是一家位于日本东京都小金井市的动画制作公司,隶属于日本电视台,是日本动画协会成员。工作室成立于 1985 年 6 月,由动画导演宫崎骏、高畑勋与德间书店编辑铃木敏夫、社长德间康快共同创办,最初目的是方便宫崎骏与高畑勋制作动画。起初位于东京都吉祥寺地区,1992 年迁至现址,2005 年成为独立公司。

吉卜力的动画电影以高品质和细腻风格享誉全球。在日本动画电影票房前十名中,其作品占据六席。其中,2001 年推出的《千与千寻》曾长期位居日本电影票房冠军,并成为日本首部获得奥斯卡最佳动画片奖的作品,直至 2020 年底才被《鬼灭之刃剧场版 无限列车篇》超越。

除动画电影外,吉卜力还涉足广告动画、真人影片拍摄、电子游戏美术设计,以及影视、音乐、出版等相关产业。1996 年,吉卜力与迪士尼日本分公司合作,推动其影音产品在国际市场的发行。

作为日本流行文化的重要象征,以吉卜力为主题的设施包括 2001 年在三鹰市开馆的三鹰之森吉卜力美术馆,以及 2022 年在爱知县开幕的吉卜力公园。

工作室名称“吉卜力”由宫崎骏所命名,灵感来自二战时期意大利飞机制造商卡普罗尼开发的侦察机 “Ghibli”,意为在撒哈拉沙漠上吹着的热风。当时将意大利语罗马拼音"Gi·bu·ri"(ギブリ)误写成"Ji·bu·ri"(ジブリ),后来便未再更正,沿用至今。

图片

以龙猫为造型的吉卜力工作室标志

图像处理

图像处理的场景挺多,主要有填色、扩充或裁剪原图尺寸、细节补充、改变风格、多图合并、抠图或删除背景为透明色等。所以它其实是一项复杂工作,专业人士常使用 Photoshop[1](PS)来处理图片。但 PS 操作复杂,安装包大,对普通用户来说有点大材小用,所以市面上还出现了很多简化版工具(如美图秀秀)。虽然简化了许多,但仍有一定的学习使用成本,而且普通修图软件很难对图片风格进行深度修改。

除了闭源的 Midjourney、Gemini 2.0 Flash (Image Generation) Experimental(目前免费,探索 Gemini 2.0 Flash 图文混合生成)、新版 gpt-4o 外,可能还有喜欢折腾的朋友尝试过 Stable Diffusion 之类的开源方案(Stable Diffusion web UI[2]ComfyUI[3] 等),它们往往需要下载各种插件或配置复杂的工作流才能进行工作,这对普通用户来说学习成本过高(调各种参数、记各种正反向 prompt)。

图片

以下是使用 gpt-4o 进行的部分尝试,效果惊人!

填色

💡 Prompt

请为老照片上色

图片

改变风格

上传图片后直接发以下三种提示词之一即可,但有些朋友可能会遇到模型拒绝生成。网上有评论说必须严格使用下面的提示词格式,但我自己测试过长提示描述包含“吉卜力风格”也可以触发。根据实测,我自己总结了两个影响因素:

  • 你的 ChatGPT 账号还没推送新版本 gpt-4o
  • OpenAI 误判,你可以尝试新开对话或者换种方式提问(我也偶尔触发拒绝生成)。
💡 Prompt
  • 改为吉卜力风格
  • convert to studio ghibli anime
  • turn into ghibli cartoon style

我测试了一些真人图片和动漫角色,效果都不错。如果生成的动漫线条过于简单,也可以要求补充更多细节(如背景、服饰等)。

图片
图片
图片
图片
图片
图片

四格漫画

💡 Prompt

小猫咪将餐桌上的酒瓶打翻在地上,碎了一地,之后被主人训斥。根据以上场景生成吉卜力风格的 4 格漫画。

当使用简单的一句话式 prompt 让其生成四格漫画时,gpt-4o 可能会产生两种行为模式:

  • 直接生成图像
  • 先输出 4 张分镜描述,询问你是否需要补充其他细节

直接生成漫画可能会不连贯,这时你就需要强制要求 gpt-4o 先生成分镜,再生成漫画图片。

💬 gpt-4o 默认生成分镜

好的,来点吉卜力那味儿的温情幽默。以下是一个符合场景的 4 格漫画分镜设计,画面色调温暖、细节丰富,小猫表情生动、有灵性:


第一格:

画面内容
黄昏时分,餐桌上摆着晚餐和一瓶半满的酒,夕阳透过窗户洒在木质地板上。小猫咪(毛茸茸的橘白相间)悄悄跳上桌子,好奇地盯着酒瓶。

旁白或对话
(无文字,仅靠画面表达“猫咪好奇”)


第二格:

画面内容
猫咪用爪子轻轻拨了一下酒瓶,酒瓶摇晃几下后,“啪”地一声掉落,红酒四溅,瓶子摔得粉碎,地上红得像一滩鲜血。

旁白或对话
“啪——!!!”


第三格:

画面内容
主人(温柔但略带无奈的青年或老太太)冲进来,满脸震惊,猫咪低头坐在地上,耳朵耷拉,像做错事的孩子。

对话
主人:“你在干什么啊?!这可是我存了三年的酒!”


第四格:

画面内容
主人一边叹气打扫,一边偷看猫咪,小猫蜷在角落里,两只大眼睛湿漉漉的,可怜巴巴地望着他。下一秒,主人露出一丝笑容,把猫咪抱起来。

对话
主人:“唉……算了,下次别调皮了。”
猫咪:“喵~”(尾巴悄悄晃了一下)


如果你需要我根据这个分镜生成图像,我也可以直接画出四格漫画风格图,要不要来一张?

图片

如果对默认生成的分镜不满意,我们也可以自己手写提示词。

💡 Prompt

生成吉卜力风格的 4 格漫画:

  1. 小猫咪爬上餐桌看到餐桌边上有一个酒瓶
  2. 它十分好奇,用爪子挠了一下酒瓶,瓶子开始倾倒
  3. 酒瓶在地上碎了,酒水到处都是
  4. 主人拎起小猫咪,严厉训斥
图片

虽然上面的四格漫画完成度很高,但酒瓶掉落在地上没碎,旁边还多了一些碎片,这些违反物理规则的东西,就证明 AI 生成漫画仍然有很长的路要走。

人物插画

以下是连续提示词,借助大模型的上下文理解,可以实现风格的轻松同步。当频繁修改风格,且上下文过长时,可能会相互影响,很难保持稳定输出效果。为了保持更好的一致性,可以新开对话来保证上下文的简洁。ChatGPT 在生成英文方面没有太大问题,中文则可能出现乱码字符(也不是绝对的,偶尔也可以调试出完美的中文,有点随机了)。

💡 Prompt
  • 改成吉卜力风格
  • 调整画面为 16:9, 在侧面添加一段关于“爱因斯坦”的中英文对照介绍(英文为主,简体中文为辅),最佳排版效果
  • 继续生成,这张图是牛顿
  • 继续,这是特斯拉
图片
图片
图片

LOGO 生成

这个没啥可说的,直接描述特征即可,如“毛绒材质”、“渐变色毛玻璃”等。

图片

单词卡片

这是比较有意思的尝试,可以让学习变得轻松起来,很适合小朋友。虽然目前音标和中文还有一些问题,但此场景潜力巨大,感兴趣的朋友可以自行尝试。

💡 Prompt

你是英语单词闪卡制作大师,可根据输入的主题词生成“吉卜力风格”图片并以此拓展。当我输入“电脑”时,你会生成一张与电脑相关的物品,并用箭头分步介绍键盘/鼠标/显示器等。包含英文/音标/中文。

💬 gpt-4o 默认生成的提示(可作为参考)

太棒了,这个点子有创意!我来扮演你的“吉卜力风格”英语单词闪卡制作大师——既有梦幻画风,又有实用词汇教学。你输入的词是 “电脑”,那我会:

  1. 生成一张吉卜力风格的图:温馨房间里的一台老旧却有灵魂的电脑,阳光洒在键盘上,小猫趴在显示器旁,画风清新又富有细节。
  2. 用箭头标注电脑的主要组成部分:keyboard、mouse、monitor 等,并附上英文、音标和中文翻译。

🎨 下面是闪卡内容设计稿:


🔤 中心词:
Computer /kəmˈpjuːtər/ —— 电脑 🖥️


📌 标注内容(图片中箭头指向对应部件):

  • Monitor
     /ˈmɒnɪtər/ —— 显示器
  • Keyboard
     /ˈkiːbɔːrd/ —— 键盘
  • Mouse
     /maʊs/ —— 鼠标
  • CPU
     /ˌsiːpiːˈjuː/ —— 中央处理器
  • USB Port
     /ˌjuːˌesˈbiː pɔːrt/ —— USB 接口
  • Headphones
     /ˈhedfəʊnz/ —— 耳机
  • Desk
     /desk/ —— 书桌
  • Screen
     /skriːn/ —— 屏幕(显示器的表面)

我现在来生成图像,请稍等片刻 🎨

图片

其他

还有很多案例这里就不一一演示了,大家可自行尝试(prompt 在我看来没啥技巧,知道专业术语,直接怼描述就可以了)。这里再放几张我多次调试 prompt 生成的图片,图中的中文“唐”字也近乎完美。

图片
图片
图片

当然,还可以用来学技术,还记得之前讲的 MCP 吗?这里也有一张别人生成好的图(不记得了看这里:浅谈 Agent、MCP、OpenAI Responses API)。

图片
📌 OpenAI 支持 MCP

MCP 正在成为标准,sam 最近发帖明确提到:大家都喜欢 MCP,我们也很高兴将其集成到我们的产品中。目前,Agents SDK 已率先支持 MCP,你现在就可以将 Model Context Protocol(MCP)服务器连接到 Agents(OpenAI Agents SDK - MCP[4])。我们也正在为 OpenAI API 和 ChatGPT 桌面应用添加 MCP 支持,相关更新将在未来几个月内发布,敬请期待。

图片

结语

AI 正在让创作变得简单,我们在批量化制造“垃圾”的同时,如何守住人类所特有的东西似乎变得愈加珍贵。AI 可以取代宫崎骏,但在很长的时间里都无法创造出新的“宫崎骏”。动漫的内核、故事线也只有靠人来完成时,才更有温度!

References

[1]

Photoshop: https://www.adobe.com/products/photoshop.html

[2]

Stable Diffusion web UI: https://github.com/AUTOMATIC1111/stable-diffusion-webui

[3]

ComfyUI: https://github.com/comfyanonymous/ComfyUI

[4]

OpenAI Agents SDK - MCP: https://openai.github.io/openai-agents-python/mcp

免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
00:34
8090后泪目!奇迹MU端游复刻,3月31日登录送卓越套装
广告奇迹MU怀旧版
了解详情
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部