三项国际人工智能顶会大奖!拿下!

Tianyiyun · · 790 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

近日,国际人工智能顶会CVPR 2024举办的第6届自然场景情感行为分析挑战赛(6th Workshop and Competition on Affective Behavior Analysis in-the-wild,简称ABAW)公布比赛结果,天翼云AI团队(CtyunAI)在情感识别任务中表现出色,斩获双赛道亚军、单个赛道季军,并受邀在CVPR ABAW研讨会上作论文分享。这是继天翼云在CVPR中荣获多次佳绩后再一次斩获殊荣。

CVPR会议是由IEEE主办的关于计算机视觉和模式识别的国际学术会议,收录了该领域最新的研究成果和技术发展,是全球计算机视觉三大顶/级会议之一。

ABAW竞赛是由国际顶/级计算机视觉研究者和科学家们共同发起的竞赛,致力于解决自然情境下计算机对人的情感行为进行分析的问题,并以此提升人机交互系统的场景应用能力,目标是创造出能够理解人的感觉、情绪和行为的机器和机器人,从而让机器能够与人类互动并有效地成为人类的数字助手。

本届竞赛共吸引了来自世界各地的100多支团队参加,其中不乏国内外知名大学和研究机构,如中国科学院、中国科学技术大学等。参赛队伍需要对来源于现实场景的594个视频共300万帧图像进行分析,通过视频中的图像、人物、声音来预测指定人物在连续时间下的情感。

天翼云AI团队在本次竞赛中尝试简化问题,仅使用纯视觉特征进行任务建模。首先,通过使用可扩展的vision表征学习的掩码式自动编码器(Masked Autoencoder)在大量人脸表情相关的数据集上进行预训练,以学习鲁棒的图像表征;其次,在比赛提供的aff-wild2数据集上使用Expr标签进行微调,以更好地适合该数据集的分布;最后,利用时域卷积网络(Temporal Convolutional Network)和Transformer对数据在时间维度上进行建模,从而使模型能够通过视频的上下文对结果进行预测,大大提升了模型的任务表现。

当前,以大模型为代表的AI技术的发展及应用已步入爆发期,并成为驱动产业数字化与智能化的重要引擎。天翼云将继续在图像、音频及多模态领域持续深耕,不断夯实国云智算底座,推动AI技术变革升级,为数字经济发展注入新的活力。

 

790 次点击  
加入收藏 微博
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传