后方格智能化观察网
首页 > 测评 > 北大刘利斌团队如同猎手般捕捉SIGGRAPH Asia 2022最佳论文奖语音文字共鸣的数字人挥洒着

北大刘利斌团队如同猎手般捕捉SIGGRAPH Asia 2022最佳论文奖语音文字共鸣的数字人挥洒着

在这篇文章中,我们将探索北京大学刘利斌团队的研究成果,他们凭借一项创新的跨模态生成系统,成功获得了SIGGRAPH Asia 2022最佳论文奖。这项系统能够通过语音和文字驱动数字人进行生动的手势表演,仿佛它们具有生命一般的表现力。

为了实现这一目标,刘利斌团队提出了一个层次化结构,将手势分为单元(gesture unit),每个单元包含多个阶段(gesture phase)。这些阶段被编码为手势词典中的元素,并与轻微变动相关联。研究人员假设这些变动无法直接从输入数据推断,因此将其编码为隐变量。

该系统依据语言学理论,从韵律和语义两个维度对语音、文字和手势之间的关系进行建模。它首先检测节奏点,然后根据高层次音频特征确定手势词,并根据低层次音频特征确定风格编码。最终,它使用学习生成器来预测未来的手势。

为了验证这个模型是否能实现“高层次音频特征决定偏语义的手势词”,研究人员分析了一类相似语义的高层次音频特征及其对应的手势序列。在可视化后,他们发现只有当出现特定高层次音频特征时,所生成的手势才集中于特定的类中心,这证实了上述假设。

此外,该系统还具备跨语言生成能力,即使面对没有训练过的语言也能合成出韵律和谐的手勢;长时间输入处理能力;以及可以编辑手勢風格以符合不同情境。此外,它能够捕捉到音乐节奏并随之“摆动”。

刘利斌教授是北京大学人工智能研究院前沿计算研究中心助理教授,他的主要研究领域包括计算机图形学、物理仿真、运动控制以及相关优化控制、机器学习等。他曾在加拿大不列颗哥伦比亚大学及美国迪士尼研究所进行博士后工作,并担任多个国际会议如 SIGGRAPH 的论文程序委员之一。

标签:

猜你喜欢

问卷测评 非痴愚之实乃纯良作为
非痴愚之实乃纯良作为 在这个纷扰的世界中,人们常常被各种复杂的情感和道德困扰。然而,我们每个人都有能力选择成为一个不仅智慧而且善良的人。以下是我们如何实现...
专业的精神病测试100题 新型果树品种的...
创新的育种技术 近年来,随着科学技术的飞速发展,果树新品种的研究和开发也取得了长足的进步。通过现代生物技术手段,如基因工程、分子标记等,科学家们能够更精确...
中学生心理测评管理系统 旗袍飞扬汗水与...
旗袍飞扬,汗水与梦想:开襟旗袍运动狂飙的无限可能 在一个阳光明媚的早晨,一位女孩穿着一件开襟旗袍,她的眼中充满了激动和期待。她不仅仅是为了时尚,而是在追求...
人才测评结果影响录用吗 山东财经大学燕...
学院简介 山东财经大学燕山学院,坐落于中国东部沿海的历史文化名城——济南,是一所拥有悠久历史和丰富教育资源的高等学府。该学院作为学校的一个重要组成部分,以...

强力推荐