4月3日消息,科技媒体9to5Mac于昨日(4月2日)发布博文称,苹果研究团队与香港大学合作发表了一篇最新论文,提出了名为LGTM的全新渲染框架。
IT之家引用相关博文的内容介绍,这个框架的全称是“Less Gaussians, Texture More”,其核心创新点在于把3D场景的几何结构和表面纹理分离开来,使得系统在维持几何形状简洁性的基础上,借助叠加纹理层的方式达成4K级别的超高清画质。
当前主流的“前馈3D高斯泼溅”(Feed-forward 3D Gaussian Splatting)技术,借助AI可将2D图片快速转换为能从多角度观看的3D场景,不过在处理高分辨率画面时,像素数量的增加会使算力需求呈指数级攀升,进而造成设备难以承受。
LGTM 正是为解决这一痛点而诞生的。研究团队采取了两步走的策略:第一步是让模型从低分辨率图像里学习场景结构,保证几何框架在 2K 或者 4K 渲染时不会出现问题;第二步则引入第二个网络,专门用来处理外观细节,把高分辨率纹理精准地映射到几何结构上。这样的分工方式避免了全链路高算力的消耗。
对于普通用户来说,这项技术主要可以提升苹果Vision Pro的使用体验。这款头显双眼屏幕加起来大约有2300万像素,单眼的像素数量甚至超过了4K电视。
当前的渲染技术在面对超高分辨率时,很容易出现性能受限的情况,进而造成画面卡顿或者模糊。LGTM 有希望攻克这一算力方面的难题,为用户带来更为流畅的沉浸式体验。
实际演示表明,在接入LGTM框架后,生成的3D场景在纹理细节与文字清晰度方面都有明显提升,画面效果已十分接近真实原图。这就意味着,未来用户在使用头显查看虚拟环境或者进行透视体验时,能够获得更为逼真、清晰的视觉效果。