学院新闻
智能学术沙龙第二十二期:对视觉任务统一建模的探索
2024年4月19日上午10:00,365BET体育投注官网智能学术沙龙第二十二期在海淀校园成功举行。本次沙龙特邀微软亚洲研究院视觉计算组研究员古纾旸老师,为我们分享了“对视觉任务统一建模的探索”的主题报告。本次沙龙由张婷老师主持,现场座无虚席,大家积极参与,同老师认真讨论,收获良多,深受启发。
古老师从视觉模型在AI任务中的应用与挑战引出报告主题,主要探讨了模型构建、任务分配和训练数据收集三个方面的内容。同时,古老师也提到了如何将视觉任务转换为图像编辑任务,以及如何让模型更好地适应不同任务。
古老师随后讨论了视频任务中的几个典型问题。首先讨论如何将视频任务中的各个元素整合成一个明确的图像编辑,以便于后续的处理。其次,古老师就如何在数据收集、数据清洗和获取高质量数据方面进行优化展开论述。最后,老师强调了在构建数据时,要理解视觉信号和其他信号的关系,以及如何对对象进行替换和去除。
古老师还就图像替换与物体生成、模型优化与数据处理等进行技术探索,为同学们讲述了如何获取视觉数据,通过举例提取门的位置并将其替换成其他物体的例子,更加生动地让同学们明白了相关技术是如何工作的。
最后,古老师与学生们就学生提出的问题展开探索,对于视觉模型的选择与应用问题展开激烈讨论,主要讨论了视觉模型的切入点、训练方式、模型优缺点以及以及模型的分析方法。
本次学术沙龙使师生深度了解了视觉模型的应用与挑战,探索了视频任务建模与数据收集、图像替换与物体生成的相关技术,同时也激发了大家在计算机视觉方面的思考,为相关领域的研究和实践提供了参考和启示。
网址 www.bufancm.com
邮编:100875
地址:北京市海淀区新外大街19号电子楼
京师智能E家
学院官方微信
© 版权所有 365BET体育投注官网 - bet356体育APP【手机版下载】