技术茶馆公告

🍵 欢迎来到技术茶馆 🍵

这里是一个分享技术、交流学习的地方

技术札记 | 茶馆周刊 | 工具书签 | 作品展示

让我们一起品茗技术,共同成长

Skip to content

当 AI 不止接管电脑,还伸手拿起了你的手机

聊天式 AI 和执行式 AI 之间,隔着一条叫"动手"的鸿沟。

桌面之争,已经不新鲜了

最近 ClawdBot、Cowork 这类产品频繁出圈,核心思路大同小异——让大模型接管你的终端、鼠标、键盘,替你在电脑上干活。

但有个项目,早就把战场从电脑延伸到了手机。

它叫 AiPy,一个自称"超级 AI 牛马智能体工厂"的开源项目,GitHub 已斩获 3.3k Stars

它到底做了什么?

一句话概括:你说人话,它在手机上跑脚本。

AiPy 通过 ADB(Android Debug Bridge)连接你的安卓手机,把你的自然语言需求拆解成一套 Python 执行脚本,然后在手机上一步步跑完。

ADB 不是什么黑科技,它是安卓官方开放给开发者的"控制通道"——点击、滑动、截屏、安装卸载应用,都能通过它实现。AiPy 做的,就是让大模型帮你把"人话"翻译成手机能听懂的指令序列。

能干嘛?几个真实场景

批量操作手机:比如让它每隔几秒刷一次抖音,按规则截图,截图自动回传电脑端,再基于截图生成带数据图表的分析报告。"执行"和"分析"一条龙。

日常指令秒执行:让它发条短信给 10086,它会自动完成编辑、点击发送整套流程;让它卸载王者荣耀,它二话不说直接动手,还会夸你"有决心"。

后台监控:挂机类游戏、长时间运行的任务,让它定时检查手机状态,发现异常自动执行后续动作。适合仓库设备巡检、持续任务监控这类场景。

本地数据分析:丢一份股票数据给它,它用 Python 数据分析工具跑出可视化图表,交付图文并茂的报告——比让大模型直接"看"数据靠谱得多。

架构上的野心

AiPy 的思路不是做一个单一工具,而是把手机控制、浏览器控制、打印机控制等能力都封装成可调度的智能体,由上层 Agent 统一编排。

它还支持:

  • 多模型接入:阿里云、火山引擎、硅基流动,按需配置
  • 智能体集市:大量现成 Agent 可直接使用,MCP 能力一键接入
  • 多端覆盖:Mac + Windows 都能用

为什么值得关注?

当大家还在讨论"AI 能不能真正接管操作层"的时候,AiPy 已经把电脑、手机、脚本、调度这一整套跑通了。

它的核心启示很简单:AI Agent 的价值不在于聊得多好,而在于能替你干多少活。

手机作为每个人最高频使用的设备,一旦被 AI 真正接管,想象空间远比桌面端大得多。AiPy 算是第一批把这件事做成产品并开源的团队,值得持续关注。