很遗憾地告诉您,目前有些事情AI还无法做到。在某些任务中,即使您做得再好,结果仍然不甚理想。这并非您的过错——这项技术仍处于初级阶段。请将生成式AI视为一个五岁的孩子。
🤌 扩散模型的当前局限性
生成式AI目前还无法完成某些任务。
当您初次了解扩散模型的能力时,很容易被AI的热潮所吸引。然而,这些模型并非完美无缺,还存在技术上的局限性,导致某些事物尚无法实现。
在 AI 绘画中,我们发现扩散模型最擅长生成以下内容:
- 艺术(绘画、背景、抽象事物、纯艺术图像)
- 灵感(建筑、人物、整体氛围和美学)
- 有趣的(人工智能化身热潮就是一个很好的例子)
人工智能在创意阶段表现出色,但是在细节至关重要的图像生成方面,这项技术尚未完全准备好。
这意味着,在需要高质量为首要任务的专业输出中,AI的表现可能不尽如人意(比如营销图像、图库照片、产品图像、可直接用于生产的素材、渲染作品等等)
在生成图片时,AI确实能实现一定程度的真实感。然而,若想用AI完全替代现有的艺术品或生产素材创作流程,目前技术还达不到。生成的作品可能会有错误,外观上可能达不到预期效果,真实感的幻觉会消失,导致这些素材无法用于实际生产。请注意:如今,AI在创意阶段的表现尤为出色
只要手头的任务不注重细节,而且可以容忍一些错误和不精确的地方(例如异常的房屋结构、扭曲的手势、错位的肢体等),那么AI生成的结果就能满足需求。
🙅♂️ 人工智能无法完成更多具体任务
透明度:如果您的需求是生成带有透明背景的.PNG图像,那么目前AI还无法完全满足。虽然您可以先生成图像,接着移除背景,但这样得到的结果并非天然透明,而且可能会出现图像残留或瑕疵。
多个对象,每个对象都有不同的属性: AI 很难将正确的属性与每个相应的对象联系起来。
a bumblebee wearing a wizard’s hat fencing against a greyhound
空间意识和构图:扩散模型通常缺乏空间视觉。Red cube on top of a blue cube
尽量避免使用空间介词,如under(在…下面)、on the side(在…旁边)等,并简化提示:a red sphere on a blue cube
连贯的文本:扩散模型在渲染文本方面表现不佳,它们通常只会生成一些无意义的内容。Image of a sign with "Deep learning" text on it
发布者:AIGC博客派,未经授权,禁止转载,经授权后转载需请注明出处:https://blog.yredu.xyz/archives/4213