来源:新智元
【导读】 强大P图工具DragGAN一作正式成为南洋理工大学助理教授。
还记得前一阵子爆火的DragGAN吗?
(资料图片仅供参考)
没错,就是那个拖一拖,拽一拽,就能实现完美P图的模型。
因为其「傻瓜式」的操作,和强大的性能,直接炸翻了作图圈。
人们直言,现在终于能实现甲方「让大象转过来」的需求了!
而现在,论文的第一作者Xingang Pan也正式成为了南洋理工助理教授。
第一作者——Xingang Pan
消息一出来,业内人士也是第一时间送上了祝贺。
在Pan教授的GitHub主页上,他的个人职务已经更新完毕。
在成为南洋理工大学的助理教授之前,他是马克斯·普朗克计算机科学研究所的博士后研究员,由Christian Theobalt教授指导。
在此之前,他于2016年在清华大学获得学士学位,并2021年在香港中文大学多媒体实验室获得博士学位,导师是汤晓鸥教授。
他的研究兴趣在计算机视觉、机器学习和计算机图形学的交叉领域。
目前,他的研究方向主要集中在生成式AI模型、AI与人类协同内容生成、3D/视频编辑和生成、神经场景表示和渲染,以及物理感知内容生成。
目前,Pan教授开始在推特上进行「招生」宣传,表示任何对生成式AI感兴趣,想继续跟进DragGAN的研究者都可以来。
一月学期申请的DDL是7月31日,而七月学期申请的DDL是1月31日。
南洋理工大学的官网上也是给出了申请指南。
包含具体的要求、学制,以及申请费。
要知道,南洋理工大学(新加坡)是很多人心中的科研圣地。
作为一所科研密集型大学,在2023年的QS排名中,全球排名第19,亚洲排名第4。
2022年的U.S.News世界大学排名中,全球排名第33,亚洲排名第3。
DragGAN?拽完就干完了!
DragGAN之所以厉害,是因为研究团队应用了一种强大但还未被充分探索的控制GAN的方法——以交互的方式将图像中任意一点精确「拖动」至目标点。
DragGAN主要包括以下两个主要组成部分:
基于特征的运动监控,驱动操作点向目标位置移动
一个新的点跟踪方法,利用区分性的GAN特征持续定位操作点的位置
通过DragGAN,任何人都可以对像素进行精确的控制,进而编辑如动物、汽车、人类、风景等多种类别的姿态、形状、表情和布局。
由于这些操作在GAN的学习生成图像流形上进行,因此它们倾向于生成逼真的输出,即使在富有挑战性的场景下也是如此,例如被遮挡的内容和变形的图像。
定性和定量的对比表明,DragGAN在图像操作和点跟踪任务中,都明显优于先前的方法。
在DragGAN的加持下,用户只需要设置几个操作点(红点),目标点(蓝点),以及可选的表示可移动区域的mask(亮区)。然后,模型就会自动完成后续的图像生成,
其中,动态监控步骤会让操作点(红点)向目标点(蓝点)移动,点追踪步骤则通过更新操作点来追踪图像中的对象。此过程会一直持续,直到操作点达到其相应的目标点。
具体来说,团队通过在生成器的特征图上的位移修补损失来实现动态监控,并在相同的特征空间中通过最近邻搜索进行点追踪。
值得注意的是,用户可以通过添加mask的方式,来控制需要编辑的区域。
可以看到,当狗的头部被mask时,在编辑后的图像中,只有头部发生了移动,而其他区域则并未发生变化。但如果没有mask的话,整个狗的身体也会跟着移动。
这也显示出,基于点的操作通常有多种可能的解决方案,而GAN会倾向于在其从训练数据中学习的图像流形中找到最近的解决方案。
因此,mask功能可以帮助减少歧义并保持某些区域固定。
在真实图像的编辑中,团队应用GAN反转将其映射到StyleGAN的潜在空间,然后分别编辑姿势、头发、形状和表情。
到目前为止,团队展示的都是基于「分布内」的编辑,也就是使用训练数据集内的图像来实现编辑。
但DragGAN实际上具有强大的泛化能力,可以创建出超出训练图像分布的图像。比如,一个张得巨大的嘴,以及一个被极限放大的车轮。
在某些情况下,用户可能希望始终保持图像在训练分布中,并防止这种超出分布的情况发生。实现这一目标的方法可以是对潜在代码?添加额外的正则化,但这并不是本文讨论的重点。
首先,与UserControllableLT相比,DragGAN能够编辑从输入图像中检测到的特征点,并使其与从目标图像中检测到的特征点相匹配,而且误差很小。
从下图中可以看出,DragGAN正确地张开了照片中人物的嘴,并调整了下巴的形状来匹配目标的脸型,而UserControllableLT未能做到这一点。
在DragGAN与RAFT、PIPs和无追踪的定性比较中,可以看得,DragGAN可以比基线更准确地跟踪操作点,进而能够产生更精确的编辑。
而在移动操作点(红点)到目标点(蓝点)的任务上,定性比较的结果显示,DragGAN在各种数据集上都取得了比UserControllableLT更加自然和优秀的效果。
如表1所示,在不同的点数下,DragGAN都明显优于UserControllableLT。而且根据FID的得分,DragGAN还保留了更好的图像质量。
由于具有更强的跟踪能力,DragGAN还实现了比RAFT和PIPs更精确的操纵。正如FID分数所显示的,如果跟踪不准确的话,很可能会造成编辑过度,从而降低图像质量。
虽然UserControllableLT的速度更快,但DragGAN在很大程度上提升了这项任务的上限,在保持相对较快的运行时间的同时,实现了更靠谱的编辑。
-
DragGAN第一作者Xingang Pan,正式加入南洋理工,出任助理教授!|天天时快讯强大P图工具DragGAN一作正式成为南洋理工大学助理教授。
-
当前视点!北森CEO纪伟国:生成式AI可担当员工领导力“教练”角色国内AI大模型领域激战正酣,就此北森(09669 HK)从人力资源服务视角给出
-
全球即时:吴健雄学院学什么_吴健雄学院什么档次东南大学吴健雄学院东南大学二级学院东南大学吴健雄学院(Chien-Shiung
-
6月14日生意社OX基准价为8100.00元/吨6月14日,生意社OX基准价为8100 00元 吨,与本月初持平。OX年度统计(20
-
股权比例计算公式表_股权比例计算公式 环球今亮点1、持股比例=出资额 注册资本金。2、只出技术而不出资金,需经过技术评
-
千金归来剧情介绍_千金归来剧情简述-当前观点欢迎观看本篇文章,小升来为大家解答以上问题。千金归来剧情介绍,千金
-
服务营销系统(关于服务营销系统介绍)-世界时讯1、服务营销系统是顾客可能接触和了解服务组织的所有不同因素。2、如广
-
【世界报资讯】cf黄金加特林哪一年出来的(cf黄金加特林)导读1、现在没有卖的,只有抽奖才能抽到,还有就是在淘宝网上能买到,
-
创业板可燃冰板块股票排名(创业板可燃冰市值榜单)创业板可燃冰板块股票排名(创业板可燃冰市值榜单),创业板可燃冰板块股
-
天天实时:里字的笔画顺序_里的笔画1、一、里的正确笔顺是竖,横折,横,横,竖,横,横。2、二、基本释义
-
天天精选!最高奖100万元!海南公布“新上规”奖励名单,19家企业上榜近日,省工业和信息化厅公布了2022年度信息产业企业营业收入首次上规模
-
报道:世界女排联赛中国香港站:中国3-0加拿大6月13日,世界女排联赛中国香港站,中国女排3-0击败加拿大女排,取得了
-
尤溪县检察院召开新闻发布会介绍司法救助工作开展司法救助是中国特色社会主义司法制度的内在要求,为了进一步深化检
-
北斗信息拟设立北京北斗兴业信息技术股份有限公司深圳分公司 焦点热门挖贝网6月13日,北斗信息(837126)近日发布公告,北京北斗兴业信息技
-
果拉村_关于果拉村概略1、果拉村是皮山县一个行政村、紧挨阿亚格村、兰干村,地处要塞,风景宜
-
环球热头条丨72小时获2.5万单!小鹏靠新车翻身了?“爆款”新车能否挽救小鹏汽车于水火?6月12日,小鹏官方发文称,新车
-
政策频出,钢市波动或加剧金十期货6月13日讯,从目前市场运行状况来看,钢价在利好政策预期刺激下,做多资金和情绪升温,螺纹钢大量资金进入,推涨盘面行情,带动现货价格跟涨政策频出,钢市波动或加剧金十期货6月13日讯,从目前市场运行状况来看
-
汛期来临,这份防汛安全知识请收好-今日热搜国家防总办公室、应急管理部近日组织防汛专题视频会商调度,与中国
-
首届河西人才节启动 十大活动服务人才直通车:600至800间人才公寓将亮相天津信创及数字产业人才与产业融合发展高峰论坛暨首届河西人才节启动仪
-
太阳能上水管坏了修要多少钱(太阳能上水管修补方法有哪些) 全球热推荐相信大家对太阳能上水管坏了修要多少钱,太阳能上水管修补方法有哪些的
-
掷骰子游戏规则图片_掷骰子游戏 当前热讯1、骰游戏基本规则简单明般2、3、4、6局46局二组峙二竞技始每(每组)手
-
当前简讯:谷歌图片识别神器(谷歌图片识别)来为大家解答以上问题,谷歌图片识别神器,谷歌图片识别很多人还不知道
-
天天热资讯!说个杀猪的技巧,用一堆人太费劲了,两个人妥妥就给办了早些做过端菜,前些日子到回礼了。顺便说一个杀猪技巧,每次在网上看杀
-
全球今日讯!basso电力电子_basso1、低音提琴2、低音提琴是乐队中音响的支柱,基本节奏的基础。低音提琴
-
骨头汤里白色的主要是什么东西(骨头汤里白色的主要是什么)1、直接在支付宝里搜索蚂蚁庄园,点击获取饲料,如下图。2、在游戏feed
-
热点评!“最美妈妈”拒绝资助,自食其力供儿子,媒体家访一看:难怪如此爷爷是著名画家奶奶是医生,外公外婆是商人,妈妈是著名主持人,爸爸央
-
机动车排放阶段查询下载_机动车排放标准查询网站 世界快消息1、一、最简单直接的就是看车辆的环保标志,标志的后面都有明显的标记
-
速看:【建设平安云梦】女子刷单被骗四万五,民警千里奔袭抓获嫌疑人【建设平安云梦】女子刷单被骗四万五,民警千里奔袭抓获嫌疑人“非常感
-
世界热文:5750门课程获第二批国家级一流本科课程认定记者6月12日从教育部获悉,教育部近日公布第二批国家级一流本科课程名
-
声明_天天即时看甘肃翔源工程建设有限公司承建的G109线八冶沟桥等8座危旧桥梁改造工程