Recientemente, el CEO de Reddit, Steve Huffman, declaró en una entrevista que la compañía está buscando acuerdos de uso de datos con grandes empresas tecnológicas, exigiendo que las compañías que deseen continuar extrayendo datos de Reddit paguen por ello. Esta medida se basa en los acuerdos ya alcanzados con Google y OpenAI, y Huffman espera que otras compañías sigan su ejemplo.

Huffman mencionó específicamente a Microsoft, Anthropic y Perplexity por negarse a negociar el uso de datos, afirmando que "bloquear a estas compañías es una verdadera molestia". Señaló que sin estos acuerdos, Reddit no puede controlar ni comprender cómo se utilizan sus datos, lo que obliga a la compañía a bloquear a las empresas que no aceptan sus términos.

reddit, captura de pantalla del logo oficial

Para hacer frente a esta situación, Reddit ha intensificado las restricciones a los rastreadores web en los últimos meses. A principios de julio, la compañía actualizó su archivo robots.txt para bloquear el acceso a los rastreadores que no hayan firmado un acuerdo. Posteriormente, los usuarios descubrieron que el contenido de Reddit solo aparecía en los resultados de búsqueda de Google, con el que tiene un acuerdo, mientras que desaparecía de otros motores de búsqueda como Bing.

Huffman criticó a Microsoft por usar los datos de Reddit sin autorización para entrenar su IA y vender el contenido a otros motores de búsqueda a través de la API de Bing. Citó las declaraciones del CEO de IA de Microsoft, quien calificó los datos públicos de internet como "software libre". Huffman considera que esta opinión refleja la actitud de algunas empresas tecnológicas hacia el contenido de internet.

En relación con la desaparición del contenido de Reddit de Bing, el jefe de búsqueda de Microsoft, Jordi Ribas, declaró que esto se debe a que Reddit impide que Bing acceda a su sitio web. Un portavoz de Microsoft enfatizó que la compañía respeta las instrucciones de los proveedores de sitios web sobre el uso de su contenido.

Huffman señaló que el modelo de intercambio de valor de los motores de búsqueda tradicionales ha cambiado. Con la fusión de la búsqueda, el resumen y el entrenamiento de IA, el modelo de intercambio de contenido por tráfico se ha vuelto complejo. Afirmó que Reddit, junto con los editores de medios tradicionales, está buscando un modelo de pago por la información que alimenta la IA generativa.

Ante esto, Anthropic declaró que ha incluido a Reddit en su lista negra de rastreadores y respeta su configuración robots.txt. Microsoft se negó a comentar al respecto, y Perplexity no respondió a la solicitud de comentarios.

Esta controversia pone de manifiesto la complejidad del valor y los derechos de uso del contenido en la era digital, y presagia posibles nuevos modelos de colaboración entre empresas tecnológicas y proveedores de contenido.