知乎,中文互联网高质量的问答社区和创作者聚集的原创内容平台,于 2011 年 1 月正式上线,以「让人们更好的分享知识、经验和见解,找到自己的解答」为品牌使命。知乎凭借认真、专业、友善的社区氛围、独特的产品机制以及结构化和易获得的优质内容,聚集了中文互联网科技、商业、 …
这件事对我的打击真的是太大了,认识我的人知道我其实最近一年都在做text-to-image的任务,去年我做cogview1的时候就跟dalle撞了,然后不得不再继续优化了一个月搞到效果效果比dalle稍微好一点再发布。
一大清早起来惊呆了,就在昨晚。Openai宣布即将发布 dalle3,然后 SD的重要插件controlnet又迭代出了 XS 版本,然后凌晨的MJ的周会上MJ预告了V6的功能规划。
看了DALLE博客和CLIP的论文,感觉有几个点可以关注一下: DALLE的结果,博客里说是do not use any manual cherry-picking,害怕。 gpt做图片做大的难点在于,图片patch信息都是连续的,不是很好像nlp一样做成离散的token。 DALLE生成的是256×256的图片。
在使用体验上,OpenAI是了解用户的痛点的,因此Dalle官方给了出图的介绍,这看起来真的非常易用~ 官方介绍: 当提出想法时,ChatGPT 将自动为 DALL·E 3 生成定制的详细提示,将您的
OpenAIが発表したDALLE3の評価について議論するページです。
概要无意义的词语可以欺骗像DALLE-2和Stable Diffusion等流行的文本到图像生成AI,使其产生色情、暴力和其他有问题的图像。 一个新算法生成这些命令来绕过这些AI的安全过滤器,努力为未来加强这些保障找到方法。
知乎,让每一次点击都充满意义 —— 欢迎来到知乎,发现问题背后的世界。
之前都是没问题的,前两天提问就提示我无法阅读文件了,连续几天尝试都一样的提示。
通过这段时间的摸索,我将和你探讨,对普通人来说,Stable diffusion 和 Midjourney 怎么选?