OMG-Agent 是一款将自然语言处理(NLP)与手机图形界面(GUI)深度结合的开源 Agent 工具。它让“像指挥真人一样操控手机”成为现实。无论是复杂的应用间跳转,还是日常的社交、办公任务,你只需输入一句话,AI 就能自动识别界面并完成点击、滑动等一系列操作。
核心竞争力:让自动化不再需要脚本
-
自然语言指令直达:告别复杂的脚本编写,支持“帮我点一杯美式,去冰”、“在抖音搜索并关注 XXX”等模糊指令。
-
顶尖模型矩阵:
-
AutoGLM (智谱AI):针对手机 GUI 深度优化的 9B 模型,具备极强的逻辑推理与任务拆解能力。
-
GELab-Zero (阶跃星辰):轻量高效,在保障响应速度的同时精准捕捉界面元素。
-
-
ADB 实时驱动:基于底层 ADB 协议,完美适配真机与模拟器,支持屏幕实时投屏预览,操作路径清晰可见。
-
跨平台与高定制:Python 开发,支持 Win/Mac/Linux 部署;完全开源,支持开发者根据业务需求定制特定的 Agent 行为。
极简使用路径
1. 环境准备
-
ADB 环境:根据操作系统安装对应的 Android 调试桥工具。
-
手机端:开启“开发者选项”中的 USB 调试,并安装 ADBKeyboard(用于 AI 自动输入文字)。
2. 快速部署
# 克隆仓库
git clone https://github.com/safphere/OMG-Agent.git
cd OMG-Agent
# 安装依赖并运行
pip install -r requirements.txt
python run.py
3. 任务执行
在 Web 界面点击「刷新」识别设备后,选择对应的模型(如 AutoGLM),在输入框输入任务描述,点击「执行」,即可观察手机自动运行。
支持模型对比
| 模型名称 | 来源 | 特点 | 适用场景 |
| AutoGLM-Phone-9B | 智谱AI | GUI 专项优化,逻辑性极强 | 跨 App 复杂任务、长链路操作 |
| GELab-Zero-4B | 阶跃星辰 | 轻量、低延迟、响应快 | 通用点击、简单社交互动 |
目标用户群
-
极客玩家:体验最前沿的 AI Agent 技术,实现手机操作的“动嘴不动手”。
-
开发者/测试员:利用 AI 替代传统繁琐的 UI 自动化测试脚本,提升回归测试效率。
-
产品研发团队:快速验证 AI Agent 的交互逻辑,作为移动端自动化的底层框架。
-
效率达人:处理多设备协同任务,如自动化数据采集、批量操作等。
你将获得
-
一个随身携带的 AI 助理:将手机变成可编程、可理解意图的智能终端。
-
极低的自动化门槛:无需学习 Python/Java 自动化框架,人人皆可指挥手机。
-
安全私密的运行环境:代码开源,数据通过 ADB 本地传输,保障隐私。
OMG-Agent 正开启手机自动化的 2.0 时代。
本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途。本站所有信息均来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序,请支持正版,购买注册,得到更好的正版服务。如有侵权不妥之处请致信 E-mail:admin@kongyu.xin 我们会积极处理。敬请谅解





![DL9月新作【互动SLG/NTL/人妻/动态】邻居的人妻2-在丈夫身旁忘我地中出性爱(近所の人妻2-旦那の隣で我を忘れてる中出しSEX)官中步兵版+存档 [4.30G]-空域资源网](https://pan4.649408.xyz/p/image/2025-09-06/df11b2bad9187e7e973f46308c17d789.jpg)
![破解版[国产互动SLG/真人/动态] 这个面试有点硬2 东洋篇 The Hardest Interview2 V1.11 [麻豆出品] 官方中文版 [20.50G]-空域资源网](https://pan4.649408.xyz/p/image/2025-10-01/913b184b59aaaf4c9c86b24331f4d2bc.webp)







暂无评论内容