Recientemente, un proyecto de código abierto llamado DroidRun ha llamado mucho la atención. Este proyecto permite controlar teléfonos Android mediante comandos de lenguaje natural utilizando un gran modelo de lenguaje (LLM), ofreciendo a los usuarios una experiencia de automatización sin precedentes. Desde la gestión de redes sociales hasta la automatización de tareas cotidianas, DroidRun muestra el enorme potencial de la IA en la interacción con dispositivos móviles. Según AIbase, DroidRun es oficialmente de código abierto, su código fuente se ha publicado en GitHub y está disponible para que desarrolladores y entusiastas de la tecnología lo exploren y desarrollen libremente.

image.png

Funciones principales: Control del smartphone mediante lenguaje natural

El núcleo de DroidRun reside en el control preciso de los teléfonos Android mediante comandos de lenguaje natural. El usuario simplemente necesita introducir comandos sencillos, como "Abre X y publica 'Hola Mundo'" o "Abre WeChat y envía un mensaje a Juan con el contenido 'Vamos a cenar esta noche'", y DroidRun ejecutará la acción automáticamente. Esta función no solo es adecuada para el uso diario cómodo por parte de particulares, sino también para la automatización de redes sociales y las pruebas automatizadas. AIbase opina que DroidRun representa un campo de aplicación completamente nuevo para los agentes de IA en el ámbito de los dispositivos móviles, ofreciendo a usuarios y desarrolladores una herramienta eficiente y flexible.

Componentes principales: Colaboración entre el agente LLM y la aplicación Portal

Según AIbase, DroidRun consta de dos componentes principales que, en conjunto, permiten su potente capacidad de automatización:

Agente LLM: Como "cerebro" del sistema, el agente LLM se encarga de analizar los comandos de lenguaje natural introducidos por el usuario y de convertirlos en secuencias de comandos ejecutables para el teléfono. El agente también puede acceder de forma flexible a herramientas como la búsqueda web y el análisis de imágenes, según los requisitos de la tarea, para garantizar la precisión y la eficiencia del funcionamiento.

Aplicación DroidRun Portal: Esta es una aplicación instalada en el teléfono Android que sirve como puente entre DroidRun y el teléfono. La aplicación Portal recibe los comandos del agente LLM y ejecuta las acciones específicas en el teléfono, como hacer clic, deslizar o introducir texto.

Este diseño de arquitectura permite que DroidRun ofrezca un rendimiento excelente incluso en tareas complejas, al tiempo que garantiza la modularidad y la capacidad de ampliación del sistema.

Pasos de implementación: Configuración sencilla para una puesta en marcha rápida

AIbase ha constatado que el uso de DroidRun no presenta una barrera alta. Los usuarios solo necesitan los siguientes dispositivos y herramientas para empezar rápidamente:

Un teléfono inteligente Android;

ADB (Android Debug Bridge) instalado en el ordenador para conectar el teléfono y el ordenador;

Instalar la aplicación DroidRun Portal en el smartphone.

Instalar la aplicación DroidRun Portal en el smartphone.

Mediante una configuración sencilla, el usuario puede permitir que el agente de IA controle el smartphone y ejecute diferentes tareas de automatización. Cabe señalar que algunas funciones más complejas pueden requerir conocimientos técnicos, como la instalación y la resolución de problemas de ADB. Sin embargo, la comunidad de código abierto de DroidRun ofrece una documentación y un soporte detallados, lo que simplifica su uso.

Perspectivas de futuro: El comienzo de un nuevo capítulo en la automatización de smartphones

La publicación de DroidRun como código abierto no solo beneficia a los particulares, sino que también ofrece a los desarrolladores mucho espacio para la innovación. AIbase considera que, con el crecimiento de la comunidad de código abierto, DroidRun podría mejorar aún más sus capacidades en el ámbito de la comprensión visual y la interacción con la interfaz de usuario, e incluso podría desarrollar mecanismos de auto reparación más potentes para mejorar el manejo de errores en escenarios complejos. Tanto para usuarios particulares que deseen simplificar sus tareas diarias como para empresas que buscan pruebas automatizadas eficientes, DroidRun ofrece prometedoras posibilidades de aplicación.

Como pionero en el control de smartphones mediante IA, la publicación de código abierto de DroidRun marca un hito importante en el ámbito de la automatización de smartphones. AIbase seguirá observando el desarrollo del proyecto y proporcionará a los lectores más información sobre tecnologías de vanguardia. Para obtener más información y el código fuente, visite la página de GitHub de DroidRun.

Dirección del proyecto: https://github.com/droidrun/droidrun