摘要
本文提出了一种基于无服务器计算架构的虚拟数字人模型,该模型能够通过视频数据生成动作和语音.使用VideoTo3dPoseAndBvh算法从视频中提取人体关节点,并转化为3D骨骼动画.同时,采用Mockingbird算法实现文本到语音的合成.这两种算法的结合,使得虚拟数字人模型能够生动地模仿人类的动作和语音.同时,将项目迁移到云端,提高了运算效率,还大幅降低了运维成本.云上的架构为算法提供了自动扩展的能力,确保了在高负载时模型保持高性能,而在低负载时最大化节省资源.容器技术又确保了项目环境的一致性和快速部署,算法在任何云平台上运行,都能在容器内稳定执行.
基金项目
大学生创新创业训练计划(202212617009)