OmniParser + Automatización

UI Agent

Selecciona una ventana, escribe un comando y el backend la analiza con OmniParser v2 para ejecutar acciones de mouse y teclado en tu PC.

Listo
Ejemplos rápidos:

Resultado

Esperando comando...

Vista analizada

La imagen anotada aparecerá aquí tras ejecutar un comando.