「豆包手机」尚在讨论风口时,智谱 AI 宣布开源其手机端智能助理框架 Open-AutoGLM,实现了对屏幕内容的多模态理解与自动化操作。


与传统手机自动化工具不同,Phone Agent 采用视觉语言模型实现了对屏幕内容的深度语义理解,结合智能规划能力自动生成并执行操作流程。系统通过 ADB(Android Debug Bridge)控制设备,用户只需用自然语言描述需求,如「打开小红书搜索美食」,Phone Agent 即可自动解析意图、理解当前界面、规划下一步动作并完成整个流程。


在安全与可控性方面,系统设计了敏感操作确认机制,并在登录、支付或验证码等需要人工介入的场景中支持用户接管,确保使用过程安全可靠。同时,Phone Agent 还具备远程 ADB 调试能力,支持通过 WiFi 或移动网络连接设备,为开发者与高级用户提供灵活的远程控制与实时调试支持。


目前,基于该框架实现的 Open-AutoGLM 已覆盖微信、淘宝、小红书等 50 余款主流中文应用,能够处理从社交互动、电商购物到内容浏览等多种日常任务,正逐步发展为覆盖用户衣食住行全场景的智能助手。


目前,HyperAI超神经官网已上线了「Open-AutoGLM:手机端智能助理」,快来试试吧~        


在线使用:https://go.hyper.ai/QwvOU


12 月 8 日-12 月 12 日,hyper.ai 官网更新速览:


* 优质教程精选:5 个

* 热门百科词条:5 条

* 1 月截稿顶会:11 个


访问官网:hyper.ai


公共教程精选


1. Dia2-TTS:实时语音合成服务


Dia2-TTS 是一个基于 nari-labs 团队发布的 Dia2 大规模语音生成模型(Dia2-2B)构建的实时语音合成服务,支持多轮对话脚本输入、双角色语音提示(Prefix Voice)、多参数可控采样,并通过 Gradio 提供完整的 Web 端交互界面,用于高质量对话级语音合成。模型可直接输入连续多轮对话脚本,生成自然连贯、角色音色一致的高质量语音,适用于虚拟客服、语音助手、AI 配音、短剧生成等应用场景。


在线运行:https://go.hyper.ai/Qbfni


效果示例


2. Open-AutoGLM:手机端智能助理


Open-AutoGLM 是由智谱 AI 发布的手机端智能助理框架,基于 AutoGLM 构建。该框架能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。与传统手机自动化工具不同,Phone Agent 采用视觉语言模型进行屏幕感知,结合智能规划能力自动生成并执行操作流程。


在线运行:https://go.hyper.ai/QwvOU



3. VibeVoice-Realtime TTS:实时语音合成服务


VibeVoice-Realtime TTS 是一个高质量的实时文本转语音(Text-to-Speech, TTS)系统,由 Microsoft Research 团队发布的 VibeVoice-Realtime-0.5B 流式语音合成模型构建。该系统支持多说话人语音生成、低延迟实时推理,以及 Gradio Web 端可视化交互。


在线运行:https://go.hyper.ai/RviLs


效果示例


4. Z-Image-Turbo:高效 6B 参数图像生成模型


Z-Image-Turbo 是由阿里巴巴通义千问团队发布的新一代高效图像生成模型。该模型以仅 6B 的参数规模,实现了与 20B 以上参数闭源旗舰模型相媲美的性能,特别擅长生成高保真度的照片级真实人像。


在线运行:https://go.hyper.ai/R8BJF


效果示例


5. Ovis-Image:高质量图像生成模型


Ovis-Image 是一个高质量图像生成模型(Text-to-Image, T2I)系统,由 AIDC-AI 团队发布的 Ovis-Image-7B 高保真文本到图像生成模型构建。该系统采用多尺度 Transformer 编码器与自回归生成架构,在高分辨率图像生成、细节表现及多风格适配能力上表现卓越。


在线运行:https://go.hyper.ai/NoaDw


效果示例


💡我们还建立了 Stable Diffusion 教程交流群,欢迎小伙伴们扫码备注【SD教程】,入群探讨各类技术问题、分享应用效果~



热门百科词条精选


1. 双向长短期记忆 Bi-LSTM

2. 地面真实值 Ground Truth

3. 布局控制 Layout-to-Image

4. 具身导航 Embodied Navigation

5. 每秒帧数 Frames Per Second (FPS)


这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki


1 月截稿顶会


1.2 

8:00:00

VLDB 2026

1.6 

19:59:59

ACL 2026

1.15 

19:59:59

CCS 2026

1.18 

19:59:59

SIGMOD 2027

1.20 

19:59:59

IJCAI 2026

1.23 

6:00:00

SIGGRAPH 2026

1.23 

19:59:59

SIGIR 2026

1.23 

19:59:59

LICS 2026

1.29 

19:59:59

ICML 2026

1.29 

19:59:59

CAV 2026

1.30 

19:59:59

ISSTA 2026


一站式追踪人工智能学术顶会:https://go.hyper.ai/event


以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!


下周再见!


关于 HyperAI超神经 (hyper.ai)


HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:


* 为 1800+ 公开数据集提供国内加速下载节点

* 收录 600+ 经典及流行在线教程

* 解读 200+ AI4Science 论文案例

* 支持 600+ 相关词条查询

* 托管国内首个完整的 Apache TVM 中文文档


访问官网开启学习之旅:

https://hyper.ai/



内容中包含的图片若涉及版权问题,请及时与我们联系删除