Appearance
Open-AutoGLM - 智谱 AI 手机 Agent
是什么
智谱开源的手机 Agent 框架,让 AI 控制 Android/HarmonyOS 设备,通过自然语言指令完成手机操作——点外卖、搜餐厅、发消息,完全不用手动点击。
- GitHub: github.com/zai-org/Open-AutoGLM
- 官网: https://www.open-auto-glm.com/
- 支持平台: Android / HarmonyOS / iOS
解决啥
手机操作自动化的痛点:
- 重复操作:每天打开同一个 App、做同样的操作,浪费生命
- 跨 App 协作:需要在小红书搜、口碑看评价、美团下单,手动切换麻烦
- 无障碍场景:视力障碍人士、需要免手操作的场景
Open-AutoGLM 让 AI 理解屏幕内容 + 规划操作序列 + 自动执行,一句话搞定跨 App 任务。
怎么跑
环境要求:
- Python 3.10+
- ADB(Android)/ HDC(HarmonyOS)
- 手机开启开发者模式 + USB 调试
Step 1:安装
bash
git clone https://github.com/zai-org/Open-AutoGLM
cd Open-AutoGLM
pip install -r requirements.txt
Step 2:连接手机
bash
# Android via ADB
adb devices # 确认连接成功
# iOS via Midscene.js(需 Mac)
Step 3:运行
bash
python run.py --task "打开小红书搜索美食"
好在哪
| 能力 | 说明 |
|---|---|
| 📸 屏幕感知 | 多模态理解屏幕内容和布局 |
| 🧠 意图理解 | 理解自然语言指令,规划操作序列 |
| 🤝 人工接管 | 验证码等敏感场景可随时接管 |
| 🔒 安全机制 | 内置敏感操作确认机制 |
| 📡 远程调试 | 支持 WiFi ADB 连接,摆脱数据线 |
怎么用
典型场景:
"打开小红书搜索美食"
"给文件传输助手发消息:部署成功了"
"打开美团外卖,搜附近评分最高的川菜馆"
"打开12306买明天去上海的高铁票"
iOS 体验(免安装):
智谱还提供输入法体验版,无需配置环境,直接在手机输入法里说话操控: 👉 https://autoglm.zhipuai.cn/autotyper/