AI照骗恐怖如斯!美女刷屏真假难辨,网友:AI网恋诈骗时代开启

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

什麽?这些不是真人照片,都是AI画出来的?!

最近这样一组美女图片刷屏了,许多人看到第一反应都是「AI逼真到这个份上了?」。

直到看到手部露出了破绽,才敢确定确实是AI画的。

原来在ChatGPT的光芒掩盖一切的这段时间,图像生成AI已经从从画画悄悄进化到了「画照片」。

这种风格和质量的AI照片,还有很多在各大网路社区流传,国内贴吧、微博、NGA,国外推特、油管,到处都是。

有网友表示:AI聊天 AI照片,快进到AI网恋诈骗。

而Cosplay风格的AI照片也让一些人感叹「商业Coser和摄影师可能双双下岗」。

根据各帖子发布者透露,这些AI照片都出自同一个模型,Chilloutmix。

多个模型融合进化,照片级AI诞生

ChilloutMix,二月初出现在模型分享社区CivitAI(不少爱好者称之为c站)。

不到两周时间,下载数量超过5万。

简单来说,这个模型还是基於大家熟悉的Stable Diffusion,1.5版本,但是由许多衍生模型合并(Merge)而来。

主要组件包括两大模型,首先是Basilmix,专攻逼真的纹理和亚洲脸型。

但这个模型主要还是擅长半写实的「2.5D风格」。

接下来合并了用照片集数据优化的Dreamlike的衍生模型,让最终生成结果更接近3D写实风格。

除了两个主要模型之外,作者还添加了一些小的Embeddings(相当於给AI模型打补丁)。

比如第一个Pure Eros Face,提供的.pt文件只有3.92KB,可以合并到任何基於SD1.5的模型,专门负责生成「纯欲系面孔」。

所有这些模型和Embeddings,各自擅长不同的地方,如一种画风、一种纹理、人物脸型甚至姿势。

Merge在一起後,可通过不同提示词调用它们的能力,一般原作者都会附上使用指南。

如果还是不太会用,CivitAI社区里还会有很多网友晒使用相应模型生成的作品,其中还有很多标记了「NSFW」或「18 」,懂得都懂。

除了ChilloutMix之外,文章开头的那组图片之所以能固定生成同一张面孔,还使用了另一项技术LoRA。

LoRA本来是微软研究团队早在2021年提出的一项大语言模型微调的技术,可以大大提高微调训练速度。

去年底,韩国科学技术院KAIST一位研究员@cloneofsimo与HuggingFace合作,将此方法扩展到Stable Diffusion上。

不仅实现了单块11GB显存的RTX2080Ti实现模型完整微调,同时原始模型权重冻结,新训练出来的权重可以保存为3MB大小的单个文件发布。

这项技术被AI绘画爱好者用来让模型固定生成一个物体,最流行的就是固定一个人物形象。

现在,在CivitAI社区里,每个微调好的权重就叫做一个Lora,就相当於一个人物模版,所有人都可以方便下载使用。

如开头的那组图片就是来自叫「Korean …

AR「战术目镜」来了,能和手机搭配进行无线编程,售价2370元

Pine 发自 凹非寺

量子位 | 公众号 QbitAI

一个镜片就搞定AR功能,夹在眼镜上就能直接用!

戴上它後,你眼里的世界是这样的:

还可以拍摄照片或者视频:

必要的时候,还能够即时回放视频:

此外,这款AR设备还拥有超级变焦,能够将视野放大至16倍:

这是Brilliant Labs推出的一款新AR设备,名为Monocle,它只有15g重,夹在眼镜上是酱紫的:

并且,随AR镜片配备的还有一个类似蓝牙耳机一样的充电仓,能够实现6次充电,合算下来,续航时间长达12小时。

更更重要的是,它的设计和所有软体都已经开源,并且还配备有MicroPython固件,能够直接和手机搭配,实现无线编程 。

不过话说回来,这次新出的AR设备,到底能卖多少钱,它又是如何在小小的一个饼乾状的镜片上实现AR功能的呢?

一起来看看~

定价2370元

目前,这款AR设备已经开始在官网发售,定价349美元,约合人民币2370元。

(和目前市场上AR眼镜2000~3000元的定价相比,还算合理)

并且Brilliant Labs发布在Discord上的最新更新表明:

生产已接近完成,第一批产品应该很快就会开始发货。

至於这样一个「镜片状」的东西是如何实现AR功能的,得从它的构造说起。

Monocle的主要零件都集中在镜片的上半部分,下图是它的拆解图。

在这些零件中,蓝牙单片机(Bluetooth MCU)是Monocle的主处理器,快闪记忆体为512KB,RAM为64KB,并且支持蓝牙5.2,最高可达2Mb/s。

并且,默认情况下,蓝牙单片机上会装有MicroPython固件,也就是说这使无线更新固件成为可能,能够通过特定的软体在桌面或移动设备(iOS/Android)上进行更新。

至於对AR设备来说非常重要的图像处理部分,Monocle交给了FPGA来做,它可以直接使用相机和麦克风作为输入。

此外,FPGA还预装了图形和相机加速器IP,这能够使用MicroPython命令访问。

换句话说,就是用户可以藉此创建自己的FPGA应用程序。

接下来就是Monocle成像部分的零件介绍了,它的前置摄像头是Omnivision OV5640,拥有500万像素的彩色感测器,并且还可以自动曝光控制,自动白平衡。

显示器这边,Monocle使用的是索尼ECX336CN微型OLED,像素是640x400RGB,与主机壳光学连接,这样一来,便能将图像导向用户的眼镜(光路图如下)。

不过,它的视场角只有20°(大约一张桌子的长度),而此前就已经有AR眼镜做到了40°、50°的视场角,相较之下,Monocle还是逊色不少。

当然,除了这些零件之外,Monocle还有麦克风、触摸界面等零件,麦克风就不过多赘述。

而触摸界面呢,则是通过识别「双击」、「长按」等手势,来触发不同类型的功能。

目前这款AR设备的上半部分是透明的设计,里面的零件都清晰可见。Brilliant …

老黄:ChatGPT是AI届iPhone;马斯克半夜在推特修Bug…

日报君 发自 凹非寺

量子位 | 公众号 QbitAI

新的一周开始啦。

最近正值开学季,日报君在此温馨提示:大家上班(上学)尽量早点儿出门哟~

话说回来,咱们的科技新鲜事可不会堵车还是会照常奉上,不妨一起看看吧!

黄仁勋谈ChatGPT:对AI行业影响不亚於当年的iPhone

最近,英伟达CEO黄仁勋参加了Berkeley Haas商学院的系列谈话,期间大赞ChatGPT:

ChatGPT的出现对於AI行业来说,相当於(当年在)手机领域(出现)的iPhone,是计算机行业最伟大的事情之一,具有里程碑意义。

他表示,现在大家能把所有关於移动计算的构想,汇集到一个产品中。比如,通过API介面,可以把ChatGPT连接到数据表、Powerpoint、绘图程序,照片编辑程序等。

此外,老黄还提到,ChatGPT将实现计算的民主化。

其实,英伟达和ChatGPT联系密切,前者的晶元技术等为後者的训练提供了支持。有网友指出,大部分AI的底层代码都来自英伟达的CUDA架构。

而随着ChatGPT爆火,老黄也成了最大赢家之一:

据彭博亿万富翁指数,其今年的财富攀升33%,增加46亿美元(约合人民币311亿元),自人总净资产达到184亿美元(约合人民1242亿元)。

马斯克凌晨在Twitter加班:与工程师一起修bug

依然关於马斯克——

前两天,这位狠人又在Twitter总部熬大夜,和工程师们一起修Bug,主要解决了两大问题:

其一,是之前伺服器超载,用马斯克的话说,他有95%的推文都没有被推送出去;现在相关服务已经基本修好了。

其二,是之前推荐演算法使用的计数方式不合理,导致有很多粉丝的账户都被系统删号,现在计数方式已经调整过来了。

此外,马斯克还表示,团队半夜加班加点修好了以下Bug:

值得一提的是,就在上周,马斯克炒掉了推特仅剩2名首席工程师的其中一位。当时老马质疑自己的转评赞怎麽只有几千,然後这哥们儿解释称:

演算法没问题,只是公众对你的兴趣下降,大家看你不断的出格举动看腻了。

国内C刊:隐瞒ChatGPT使用情况将被退稿或撤稿

近日,《暨南学报(哲学社会科学版)》发布一条《说明》称:

暂时不接受任何大型语言模型工具(如ChatGPT)单独或者联合署名的文章;如果在创作过程中使用过相关工具,需单独提出,并详细解释如何使用以及论证作者自身的创作性。

如有隐瞒使用情况,将对文章直接采取退稿或删稿处理。

此外,《天津师范大学学报(基础教育版)》也发布类似《说明》,建议作者在参考文献、致谢等部分,写清楚AI工具的使用情况。

谷歌高管:ChatGPT会产生「幻觉」

据路透社援引德媒消息,谷歌高级副总裁、谷歌搜索负责人Prabhakar Raghavan谈到了聊天机器人,并警告称:

AI有时会以一种看着令人信服、实则完全虚构的方式来表达自己。

他指出,不要指望聊天机器人总能给出准确的信息。

值得一提的是,上周「谷歌版ChatGPT」Bard迎来首秀,结果却翻车严重,遭到群嘲,随後谷歌股价大跌——市值一夜蒸发了1000亿美元(约合人民币6828亿元)。

连一些谷歌自家员工都看不下去了,他们在内部论坛吐槽Bard,称其为的发布 「仓促」、「失败」和 …