虎鲸文娱与我国知名科技企业通义万相携手打造的AI影视大模型系列,已实现了从“前期创意策划”到“中期拍摄制作”再到“后期剪辑合成”的全流程覆盖。这一创新技术不仅极大地提升了影视制作的效率,更为主创团队提供了强大的技术支持,助力他们打造出更加精良、高质量的内容作品。在9月25日于杭州举办的云栖大会AIGC创新发展论坛上,虎鲸文娱集团AI影视工业化算法领域的负责人镜一先生,首次向公众揭开了虎鲸文娱在AI影视大模型领域的技术成果和应用进展。
据悉,虎鲸文娱推出的AI影视大模型,集成了多项前沿技术,如运镜模型CameraWeaver、无穿戴AI面部动捕技术以及AI表情增强等。这些技术突破为影视主创团队提供了强大的支持,在创意阶段能够迅速将分镜构想转化为实际画面;在拍摄过程中,高效生成3D场景,极大地提升了工作效率;而在动漫后期制作阶段,自动模拟优化微表情,使得作品更加生动逼真。
在影视行业的内容创意阶段,主创团队通常需要用语言描述结合手绘的方式将预想中的场景画面呈现出来,往往耗费较多时间。“尽管目前市面上已有多个文生图模型能够相对精细地生成图片,但在主创更关注的景别、构图视角等方面仍无法达到要求。”镜一说,针对这一难题,虎鲸文娱研发的“影视级文生图”大模型,区别于市面通用模型追求“视觉发散”,在影视级要求的精准控制上做了针对性调试,精准解决了主创“创意画面难落地”的行业痛点。“我们希望模型能够精准执行主创团队的文字指令,所以对模型在景别、构图、视角、空间关系等维度设置了严苛的标准,从而精准还原创作意图,形成帮助主创的可视化参考,大幅提升前期沟通与分镜效率。“镜一表示。
镜一介绍,在中期拍摄阶段,虎鲸文娱研发了图生3D场景技术模型,可支持快速生成多机位分镜参考图。主创若想查看其他视角的分镜效果,无需重新绘制2D分镜或搭建3D场景,模型能基于单张图片重构3D空间,同步生成多视角画面,还支持任意角度推拉摇移运镜,帮助主创快速确认空间布局。
相较传统方法需数周搭建的UE虚拟场景,该技术模型2分钟内即可生成高精度3D空间场景,实现数百倍效率跃升,且空间透视零误差,满足影视工业严苛标准,目前已应用于内部项目的分镜与虚拟拍摄预演协同。镜一透露,此前在内部测试时,该模型在WorldScore的分数已经成为榜单第一。
在后期制作领域,虎鲸文娱公司为动漫制作推出了创新的“无穿戴面捕+AI精雕”解决方案,有效解决了传统面部捕捉设备难以捕捉细微表情的难题。该方案依托公司自主研发的表情生成模型,实现了对演员微表情和口型细节的精准还原与补充。镜一介绍道:“我们成功将过去需要动画师耗时数周进行手动调整关键帧的工作,转化为通过表情生成模型自动生成微表情,其质量已达到影视级标准。”自从引入这一模型,手K修帧的效率得到了显著提升,并在今年上半年成功应用于多个项目中,成为提高微表情精度和制作效率的关键技术手段。
AI并非仅仅是创作者的替代品,它更像是创作者的得力助手,旨在为创作者们带来解放。正如镜一所说:“我们的愿景,是帮助创作者摆脱那些繁杂的技术束缚,让他们能够全身心投入到故事创作的核心——这就像计算器虽不能取代会计的工作,但却是会计的得力工具。同样,AI也不会取代导演的位置,它将和创作者们携手合作,共同为观众呈现更加精良、丰富的内容。”