Uma equipe de pesquisa conjunta do Instituto de Ciência da China, da Universidade Tongji e da Universidade de Ningbo alcançou um avanço significativo no desenvolvimento de uma inovadora tecnologia de compressão de nuvem de pontos (TSC-PCAC). Esta tecnologia não apenas aumenta significativamente a eficiência de compressão de dados de nuvem de pontos, mas também reduz drasticamente o tempo de processamento, removendo obstáculos tecnológicos para aplicações 3D como AR/VR.
No contexto do rápido desenvolvimento atual da tecnologia de visão 3D, nuvens de pontos, como forma de dados crucial para realidade virtual e realidade aumentada, enfrentam enormes desafios de transmissão e armazenamento. Uma nuvem de pontos de alta qualidade pode conter milhões de pontos de dados, cada um carregando informações multidimensionais como posição, cor e transparência. A eficiência no processamento desses dados massivos afeta diretamente a velocidade de popularização de aplicativos 3D.
Para enfrentar esse desafio, a equipe de pesquisa desenvolveu uma tecnologia de compressão de atributos de nuvem de pontos baseada em Transformer de voxels de ponta a ponta e convolução esparsa (TSC-PCAC). O cerne desta tecnologia reside em sua arquitetura de compressão de duas etapas única: a primeira etapa concentra-se na extração e modelagem de características locais da nuvem de pontos, enquanto a segunda etapa captura características globais por meio de um campo receptivo maior, reduzindo efetivamente a redundância de dados.
A equipe de pesquisa também projetou inovadoramente um módulo de contexto de canal baseado em TSCM, que otimiza a correlação entre canais, melhorando significativamente a eficiência de compressão de dados. Dados experimentais mostram que, em comparação com as principais tecnologias existentes, o TSC-PCAC apresenta uma melhoria significativa na taxa de compressão de dados: 38,53% a mais que o Sparse-PCAC, 21,30% a mais que o NF-PCAC e 11,19% a mais que o G-PCC v23. Ainda mais impressionante é o salto qualitativo na velocidade de processamento, com redução de 97,68% e 98,78% no tempo de codificação e decodificação, respectivamente.
Este resultado inovador não apenas resolveu um ponto crítico no processamento de dados de nuvem de pontos, mas também lançou uma base importante para o desenvolvimento futuro de aplicativos 3D como AR/VR. A equipe de pesquisa afirma que continuará explorando tecnologias de redes profundas com taxas de compressão ainda maiores e se dedicará a soluções de processamento unificado para codificação geométrica e de atributos.
Endereço do artigo: https://arxiv.org/html/2407.04284v1