Skip to content
On this page

Open-AutoGLM - 智谱 AI 手机 Agent

是什么

智谱开源的手机 Agent 框架,让 AI 控制 Android/HarmonyOS 设备,通过自然语言指令完成手机操作——点外卖、搜餐厅、发消息,完全不用手动点击。

解决啥

手机操作自动化的痛点:

  • 重复操作:每天打开同一个 App、做同样的操作,浪费生命
  • 跨 App 协作:需要在小红书搜、口碑看评价、美团下单,手动切换麻烦
  • 无障碍场景:视力障碍人士、需要免手操作的场景

Open-AutoGLM 让 AI 理解屏幕内容 + 规划操作序列 + 自动执行,一句话搞定跨 App 任务。

怎么跑

环境要求:

  • Python 3.10+
  • ADB(Android)/ HDC(HarmonyOS)
  • 手机开启开发者模式 + USB 调试

Step 1:安装

bash
git clone https://github.com/zai-org/Open-AutoGLM
cd Open-AutoGLM
pip install -r requirements.txt

Step 2:连接手机

bash
# Android via ADB
adb devices  # 确认连接成功

# iOS via Midscene.js(需 Mac)

Step 3:运行

bash
python run.py --task "打开小红书搜索美食"

好在哪

能力说明
📸 屏幕感知多模态理解屏幕内容和布局
🧠 意图理解理解自然语言指令,规划操作序列
🤝 人工接管验证码等敏感场景可随时接管
🔒 安全机制内置敏感操作确认机制
📡 远程调试支持 WiFi ADB 连接,摆脱数据线

怎么用

典型场景:

"打开小红书搜索美食"
"给文件传输助手发消息:部署成功了"
"打开美团外卖,搜附近评分最高的川菜馆"
"打开12306买明天去上海的高铁票"

iOS 体验(免安装):

智谱还提供输入法体验版,无需配置环境,直接在手机输入法里说话操控: 👉 https://autoglm.zhipuai.cn/autotyper/