Em 30 de dezembro, o Alipay lançou seu produto de busca visual de IA de nova geração, "探一下" (Tàn yīxià - aproximadamente, "Explorar um pouco"), baseado em sua própria tecnologia de modelo multimodal, que permite "explorar todas as coisas com os olhos da IA", oferecendo um serviço de busca generativa mais rápido, útil e divertido.
Quando os usuários encontram algo interessante, eles podem usar a IA através da câmera para identificar plantas, animais de estimação e brinquedos colecionáveis, fazer um guia turístico pessoal, consultar detalhes de produtos e medicamentos, além de fazer interpretações divertidas de fotos de animais de estimação e bebês, sem se preocupar com legendas para as fotos. Atualmente, o produto já está disponível no Alipay, podendo ser encontrado deslizando para a esquerda após clicar em "Escanear" na página inicial. Também é possível acessá-lo rapidamente no aplicativo Zhixiao Bao.
Desde 2024, o Alipay lançou consecutivamente aplicativos independentes de IA como o "Zhixiao Bao" e uma plataforma de desenvolvimento de entidades inteligentes. O lançamento do "探一下", focado no setor multimodal de visão de IA, marca a contínua aceleração da estratégia de IA da Ant, com o Alipay como núcleo.
Dando olhos à IA: explorando o mundo ao nosso redor
Nos últimos anos, a inteligência artificial generativa tem se desenvolvido rapidamente, e a tecnologia multimodal está tornando a visão uma nova entrada para serviços digitais. Segundo informações, o Alipay lançou o "探一下" com o objetivo de tornar a IA o "olho da curiosidade" das pessoas comuns, ajudando-as a explorar tudo ao seu redor, permitindo que a identificação de imagens pela IA realize buscas, criações e interações.
Diferentemente dos produtos tradicionais de busca visual de IA, o "探一下" pode fornecer informações úteis de forma mais rápida por meio da identificação de imagens pela IA e, com base em uma compreensão profunda dos interesses e cenários do usuário, oferece interpretações visuais mais divertidas e serviços inteligentes mais diversificados.
Após a experiência, descobriu-se que o "探一下" oferece atualmente três serviços principais: Explorar Conhecimento, Explorar Inspiração e Explorar Texto.
Quando você encontra algo que não sabe como descrever com palavras, pode usar "Explorar Conhecimento" para que a IA identifique a imagem instantaneamente e obtenha novos conhecimentos a qualquer momento.
Por exemplo, pessoas que amam atividades ao ar livre e viagens podem obter facilmente informações sobre plantas, insetos, comidas, edifícios, itens de exibição desconhecidos etc., tendo um "guia turístico inteligente" à disposição.
Jovens que encontram figuras de ação ou brinquedos colecionáveis que gostam podem consultar guias de compras; pais também podem usá-lo para identificar 68 tipos de Ultraman, sem mais preocupações com perguntas dos filhos.
Usuário identificando Ultraman com o "探一下"
Ao encontrar produtos estrangeiros com descrições em idiomas desconhecidos, o "探一下" pode obter detalhes, facilitando a compra online de itens semelhantes; em casa, com a caixa de remédios sem o manual de instruções, não só é possível consultar a descrição detalhada, como também o "Assistente de Saúde IA" do Alipay pode ser usado para obter mais informações sobre o uso do medicamento.
Com base nas características da IA generativa, "Explorar Inspiração" pode acionar filtros visuais inteligentes de acordo com o cenário, realizando interpretações divertidas da IA e facilitando a criação de legendas para as fotos.
Por exemplo, donos de animais de estimação podem tirar fotos de seus bichinhos e personalizar "mensagens telepáticas", fazendo com que seus animais de estimação falem e tornem tudo mais aconchegante; pais que gostam de postar fotos de seus filhos no círculo de amigos também podem usar a IA para interpretar seu amor pelos filhos.
Além disso, ao viajar para o exterior ou aprender idiomas estrangeiros, você pode usar "Explorar Texto" para identificar e traduzir facilmente menus, placas etc. em idiomas estrangeiros que não entende.
Renovando a busca visual de IA: a IA do Alipay continua a acelerar
No passado, a busca utilizava principalmente a correspondência de palavras-chave para retornar resultados relevantes. Como um produto de busca visual de IA generativa de nova geração, o "探一下" não fornece apenas links de busca simples, mas sim, com base na capacidade de compreensão e criação visual do modelo multimodal, oferece uma experiência de serviço mais inteligente, rica e interativa.
Dados relevantes mostram que os humanos obtêm mais de 80% das informações por meio da visão. Produtos de inteligência artificial centrados na visão podem reduzir significativamente a barreira de interação entre humanos e IA e desbloquear mais cenários de aplicação de IA, realizando "o que se vê é o que se busca, o que se vê é o serviço". No exterior, o Google Lens, lançado pelo Google, tem mais de 20 bilhões de chamadas de busca visual por mês; a Apple também lançou este ano um novo recurso chamado "Inteligência Visual", que usa a câmera do celular para ajudar os usuários a "entender instantaneamente tudo o que veem".
Como uma plataforma aberta de vida digital que atende a centenas de milhões de usuários, o Alipay lançou o produto de busca visual de IA "探一下" e o integrou na entrada principal "Escanear", com o objetivo de renovar continuamente os produtos e tornar a IA tão conveniente para a vida de todos quanto o pagamento por código QR - não apenas com um cérebro capaz de conversar e mãos e pés capazes de trabalhar, mas também com olhos capazes de explorar o mundo ao nosso redor.
Por trás do lançamento intenso de produtos de IA do Alipay está a aceleração completa da estratégia de IA First do Grupo Ant. Em novembro de 2023, a Ant lançou seu próprio modelo de linguagem grande, o modelo Bailing. Desde setembro deste ano, também lançou sucessivamente três aplicativos de IA, Zhixiao Bao, Maxiaochai e o Assistente de Saúde IA, e a plataforma de desenvolvimento de entidades inteligentes "Caixa de Ferramentas", acelerando a construção de um ecossistema de serviços de IA aberto.