Un equipo de investigación conjunto del Instituto de Ciencia y Tecnología de China, la Universidad Tongji y la Universidad de Ningbo ha logrado un gran avance con el desarrollo de una innovadora técnica de compresión de nubes de puntos (TSC-PCAC). Esta tecnología no solo mejora significativamente la eficiencia de la compresión de datos de nubes de puntos, sino que también reduce considerablemente el tiempo de procesamiento, eliminando obstáculos técnicos para el desarrollo de aplicaciones 3D como AR/VR.
En el contexto del rápido desarrollo de la tecnología de visión 3D actual, las nubes de puntos, como forma de datos clave para la realidad virtual y la realidad aumentada, enfrentan enormes desafíos de transmisión y almacenamiento. Una nube de puntos de alta calidad puede contener millones de puntos de datos, cada uno con información multidimensional como posición, color y transparencia. La eficiencia del procesamiento de estos datos masivos afecta directamente la velocidad de popularización de las aplicaciones 3D.
Para abordar este problema, el equipo de investigación desarrolló una técnica de compresión de atributos de nubes de puntos basada en transformadores de vóxeles de extremo a extremo y convoluciones dispersas (TSC-PCAC). El núcleo de esta tecnología radica en su arquitectura de compresión de dos etapas única: la primera etapa se centra en la extracción y el modelado de características locales de la nube de puntos, mientras que la segunda etapa captura características globales mediante un campo receptivo más amplio, reduciendo eficazmente la redundancia de datos.
El equipo de investigación también diseñó innovadoramente un módulo de contexto de canal basado en TSCM, que optimiza la correlación entre canales y mejora significativamente la eficiencia de la compresión de datos. Los datos experimentales muestran que, en comparación con las tecnologías principales existentes, TSC-PCAC ha logrado una mejora significativa en la tasa de compresión de datos: un 38,53% más que Sparse-PCAC, un 21,30% más que NF-PCAC y un 11,19% más que G-PCC v23. Lo que es aún más notable es que la velocidad de procesamiento también ha experimentado un salto cualitativo, con una reducción del 97,68% y el 98,78% en el tiempo de codificación y decodificación, respectivamente.
Este logro innovador no solo resuelve los puntos débiles clave en el procesamiento de datos de nubes de puntos, sino que también sienta una base importante para el desarrollo futuro de aplicaciones 3D como AR/VR. El equipo de investigación ha indicado que continuará explorando tecnologías de redes profundas con mayor relación de compresión y se dedicará a soluciones de procesamiento unificado para la codificación geométrica y de atributos.
Enlace del artículo: https://arxiv.org/html/2407.04284v1