
在企业应用上,建立可预测、可重复的工作流是打造标准化管理流程的核心手段。基于标准化工作流,可以通过一些自动化工具来执行繁琐、重复的工作。
传统的测试自动化工具LoadRunner、Selenium IDE 都可以通过录屏方式录制脚本,完成测试自动化工作。AutoHotkey AutoScriptWriter、按键精灵之类的PC自动化工具可以适用于更广的工作流自动化场合。
但传统的自动化工具由于对自然语言理解、图形/语音/视频等多模态的识别及理解并不擅长,因此可适用的场景还是相对受限,必须大量定制。
RPA(Robotic Process Automation)、Manus之类的AI自动化工具,虽然在自然语言理解、多模态处理有了长足进步,但执行速度、成本都存在很大问题以及大模型幻觉导致的结果的不确定性,要大规模应用于企业工作流自动化场景还较难。
Zapier、n8n、Dify 之类AI工作流解决方案,很适合企业自动化应用场景,但其工作流依赖于有技术背景的人员预先编排。
Workflow Use 是由Browser Use 开发商开源的浏览器工作流自动化工具,最大的特色是通过一次性录制浏览器操作,就生成可无限运行的确定性工作流程。
项目地址:https://github.com/browser-use/workflow-use
Workflow Use 核心功能:
- 一次录制,永久重用 :录屏一次浏览器交互过程就可无限期重播。
- 显示,不提示 :无需花费数小时提示浏览器一遍又一遍地做同样的事情。
- 结构化和可执行的工作流程 :将记录转换为确定性、快速且可靠的工作流程,自动从表单中提取变量。
- 类似人类的交互理解 :智能地过滤录音中的噪音,以创建有意义的工作流程。
- 企业级基础 :具有自我修复和工作流差异等功能,专为未来的可扩展性而构建。
与 LLM Agent相比,Workflow Use 速度快10倍,成本低约90%,很适合企业级高频任务(来源)。
Workflow Use的愿景是:只需向计算机显示一次它需要做的事情,它就会一遍又一遍地执行,无需任何人工干预。
Workflow Use未来的一些规划:
- 改进步骤失败时的回退
- 自我修复,如果失败,代理会自动启动并更新工作流文件
- 更好地支持步骤
- 获取前面步骤的输出并将其用作后续步骤的输入
- 将工作流程公开为 MCP 工具
- 使用浏览器自动从网站创建工作流程
- 允许浏览器使用工作流程作为 MCP 工具
- 使用工作流作为网站缓存层
Workflow Use还处于非常早期开发阶段,不建议用于生产环境。但基于Browser User开发团队的过往牛逼的产品能力、开发能力,对Workflow Use的未来值得期待。