Search K
Appearance
🍵 欢迎来到技术茶馆 🍵
这里是一个分享技术、交流学习的地方
技术札记 | 茶馆周刊 | 工具书签 | 作品展示
让我们一起品茗技术,共同成长
Appearance
聊天式 AI 和执行式 AI 之间,隔着一条叫"动手"的鸿沟。
最近 ClawdBot、Cowork 这类产品频繁出圈,核心思路大同小异——让大模型接管你的终端、鼠标、键盘,替你在电脑上干活。
但有个项目,早就把战场从电脑延伸到了手机。
它叫 AiPy,一个自称"超级 AI 牛马智能体工厂"的开源项目,GitHub 已斩获 3.3k Stars。
一句话概括:你说人话,它在手机上跑脚本。
AiPy 通过 ADB(Android Debug Bridge)连接你的安卓手机,把你的自然语言需求拆解成一套 Python 执行脚本,然后在手机上一步步跑完。
ADB 不是什么黑科技,它是安卓官方开放给开发者的"控制通道"——点击、滑动、截屏、安装卸载应用,都能通过它实现。AiPy 做的,就是让大模型帮你把"人话"翻译成手机能听懂的指令序列。
批量操作手机:比如让它每隔几秒刷一次抖音,按规则截图,截图自动回传电脑端,再基于截图生成带数据图表的分析报告。"执行"和"分析"一条龙。
日常指令秒执行:让它发条短信给 10086,它会自动完成编辑、点击发送整套流程;让它卸载王者荣耀,它二话不说直接动手,还会夸你"有决心"。
后台监控:挂机类游戏、长时间运行的任务,让它定时检查手机状态,发现异常自动执行后续动作。适合仓库设备巡检、持续任务监控这类场景。
本地数据分析:丢一份股票数据给它,它用 Python 数据分析工具跑出可视化图表,交付图文并茂的报告——比让大模型直接"看"数据靠谱得多。
AiPy 的思路不是做一个单一工具,而是把手机控制、浏览器控制、打印机控制等能力都封装成可调度的智能体,由上层 Agent 统一编排。
它还支持:
当大家还在讨论"AI 能不能真正接管操作层"的时候,AiPy 已经把电脑、手机、脚本、调度这一整套跑通了。
它的核心启示很简单:AI Agent 的价值不在于聊得多好,而在于能替你干多少活。
手机作为每个人最高频使用的设备,一旦被 AI 真正接管,想象空间远比桌面端大得多。AiPy 算是第一批把这件事做成产品并开源的团队,值得持续关注。