OMG-Agent:你的开源 Android 自动化 AI 助手

图片[1]-OMG-Agent:你的开源 Android 自动化 AI 助手

OMG-Agent 是一款将自然语言处理(NLP)与手机图形界面(GUI)深度结合的开源 Agent 工具。它让“像指挥真人一样操控手机”成为现实。无论是复杂的应用间跳转,还是日常的社交、办公任务,你只需输入一句话,AI 就能自动识别界面并完成点击、滑动等一系列操作。


 核心竞争力:让自动化不再需要脚本

  • 自然语言指令直达:告别复杂的脚本编写,支持“帮我点一杯美式,去冰”、“在抖音搜索并关注 XXX”等模糊指令。

  • 顶尖模型矩阵

    • AutoGLM (智谱AI):针对手机 GUI 深度优化的 9B 模型,具备极强的逻辑推理与任务拆解能力。

    • GELab-Zero (阶跃星辰):轻量高效,在保障响应速度的同时精准捕捉界面元素。

  • ADB 实时驱动:基于底层 ADB 协议,完美适配真机与模拟器,支持屏幕实时投屏预览,操作路径清晰可见。

  • 跨平台与高定制:Python 开发,支持 Win/Mac/Linux 部署;完全开源,支持开发者根据业务需求定制特定的 Agent 行为。


 极简使用路径

1. 环境准备

  • ADB 环境:根据操作系统安装对应的 Android 调试桥工具。

  • 手机端:开启“开发者选项”中的 USB 调试,并安装 ADBKeyboard(用于 AI 自动输入文字)。

2. 快速部署

# 克隆仓库

git clone https://github.com/safphere/OMG-Agent.git
cd OMG-Agent
# 安装依赖并运行

pip install -r requirements.txt
python run.py

3. 任务执行

在 Web 界面点击「刷新」识别设备后,选择对应的模型(如 AutoGLM),在输入框输入任务描述,点击「执行」,即可观察手机自动运行。


 支持模型对比

模型名称 来源 特点 适用场景
AutoGLM-Phone-9B 智谱AI GUI 专项优化,逻辑性极强 跨 App 复杂任务、长链路操作
GELab-Zero-4B 阶跃星辰 轻量、低延迟、响应快 通用点击、简单社交互动

 目标用户群

  • 极客玩家:体验最前沿的 AI Agent 技术,实现手机操作的“动嘴不动手”。

  • 开发者/测试员:利用 AI 替代传统繁琐的 UI 自动化测试脚本,提升回归测试效率。

  • 产品研发团队:快速验证 AI Agent 的交互逻辑,作为移动端自动化的底层框架。

  • 效率达人:处理多设备协同任务,如自动化数据采集、批量操作等。


 你将获得

  1. 一个随身携带的 AI 助理:将手机变成可编程、可理解意图的智能终端。

  2. 极低的自动化门槛:无需学习 Python/Java 自动化框架,人人皆可指挥手机。

  3. 安全私密的运行环境:代码开源,数据通过 ADB 本地传输,保障隐私。

OMG-Agent 正开启手机自动化的 2.0 时代。

附件内容
© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容