T
traeai
登录
返回首页
ManusAI(@ManusAI_HQ)

大多数人跳过浏览器操作器。如何实现超越表面的研究?

8.7Score
大多数人跳过浏览器操作器。如何实现超越表面的研究?

TL;DR · AI 摘要

ManusAI 的浏览器操作器通过授权本地浏览器环境,突破公开搜索限制,可访问需登录或订阅的私有数据,实现深度自动化研究与流程执行。

核心要点

  • 浏览器操作器需手动授权,仅在用户许可下运行于本地 Chrome/Edge 环境。
  • 可访问付费订阅、企业系统及需认证的政府门户等非公开数据源。
  • 支持跨设备任务延续与移动端触发,任务状态可在不同终端无缝衔接。

结构提纲

按章节快速跳转。

  1. 传统 AI 搜索受限于公开网页,无法访问需登录或订阅的私有内容,导致信息深度不足。

  2. ·浏览器操作器的核心机制

    通过授权本地浏览器会话,AI 可以像用户一样操作网页,访问个人账户内所有可访问资源。

  3. 所有操作必须经用户主动授权,且可随时中断或接管,确保全程可控。

  4. 任务可在工作电脑与个人设备间无缝迁移,支持手机端发起后台任务。

  5. 包括自动填写签证申请、提取政府税务文件、处理内部 HR 或财务系统流程。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • ManusAI 浏览器操作器(Browser Operator)
    • 核心能力
      • 访问私有数据源
      • 跨设备任务同步
      • 移动端触发
    • 安全机制
      • 用户主动授权
      • 实时中断与接管
      • 敏感操作暂停确认
    • 典型应用
      • 政府门户文件提取
      • 企业系统自动化
      • 表单填写与流程导航

金句 / Highlights

值得收藏与分享的关键句。

  • 真正影响决策的信息,藏在登录后、仪表盘中以及你已付费订阅的内容里。

    第 2 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 一旦授权浏览器操作器,它将在每个任务中运行于你的本地浏览器环境,操作你已能访问的网站。

    第 3 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 你可以在任何时刻中断并接管,清楚看到 Manus 当前所在的页面,并回溯每一步操作记录。

    第 5 段

    ⬇︎ 下载 PNG𝕏 分享到 X
#ManusAI#AI 自动化#浏览器操作器#网络研究#企业工具
打开原文

文章

图片1:方形头像
图片2:图像

大多数人跳过了浏览器操作员。以下是超越表层研究的方法。

让你的AI为你做研究,然后观察它遇到瓶颈。它调用搜索API,抓取几个公开页面,最后给你一份谷歌决定展示内容的礼貌摘要。真正能影响决策的关键信息,往往藏在登录后的内容、管理后台以及你已付费订阅的服务中——而这些,普通的聊天机器人根本无法触及。

但浏览器操作员可以弥合这一差距,且完全由你掌控。 一切操作只有在你明确授权后才会发生。一旦开启“我的浏览器”连接器并授予权限,Manus 就会在你本地的 ChromeEdge 浏览器会话中运行,看到你所看到的一切,访问你所能访问的所有内容。正是这一转变——基于你自己的浏览器环境,并获得你的许可——解锁了此前根本无法实现的研究新类别。

为什么浏览器操作员能深入挖掘?

有时高价值的信息就隐藏在你已付费订阅的服务中,存在于企业系统内部,或位于需要身份验证才能进入的门户平台。这些内容都无法通过云端访问。一旦你授权浏览器操作员,它就能在每个任务中,于你本地的浏览器环境中执行操作,从而访问你日常使用的网站。

图片3:图像

同样的能力也延伸到了专业自动化场景。通过 Manus API 触发浏览器操作员,可实现端到端的网页操作。这对那些从未开放公共 API 的内部公司工具尤其有用,例如老旧的人力资源门户、财务系统或政府网站。

通往长尾网络的导航指南

除了研究之外,浏览器操作员还悄然成为探索网络最复杂角落的向导。比如你需要从像 IRIS 这样的政府门户中提取一份深藏在三层菜单之后的税务文件。Manus 可以一步步点击导航,精准找到你所需的文件。又或者设想填写签证申请:Manus 能定位正确的模板文档,逐节引导填写表单,并标记出需要你输入信息的字段。它不再只是给你一段泛泛的说明文字,而是真正在你的浏览器中与你一同完成每一步操作。

这种可见性至关重要。你可以在任何时刻中断并接管控制,清楚知道 Manus 当前所在页面,并在任务完成后回溯每一步操作路径。如果遇到敏感步骤(如支付页面),Manus 会暂停等待你确认。整个过程,你始终掌握主导权。

随时随地运行,随时接管控制

浏览器操作员并不绑定单一设备。如果你在工作笔记本上启动一个任务,稍后可在个人设备上继续执行,无缝衔接。要启用此功能,请在 Manus 设置中打开“我的浏览器”连接器,点击“配置”,然后开启“允许跨浏览器任务”。启用后,Manus 可以驱动所有与你的账户关联的已授权浏览器会话——这在你于一台设备登录供应商门户,却希望在另一台设备上执行实际研究时非常实用;或当你想将繁重的自动化任务移出主工作机时尤为方便。

你甚至可以通过手机触发浏览器操作员。通勤途中,通过 Manus 移动应用发送一条指令,Manus 就会在你授权的桌面电脑上启动浏览器会话,并在后台完成任务。回到办公桌时,工作早已完成。

先授权你的浏览器

在让 Manus 代表你浏览之前,你必须先授予它使用本地会话的权限。整个过程不到一分钟,且全程由你掌控其访问范围。

  1. 打开你的 Manus 工作区,进入“连接器”标签页。
  2. 开启“我的浏览器”连接器,并为 Chrome 或 Edge 安装浏览器扩展。
  3. 启动一个新的提示,要求 Manus 使用你的浏览器。
  4. 当 Manus 请求权限接管新标签页时,点击“授权”。

三种使用浏览器操作员的方式

连接成功后,你可以将原本耗时数小时的多标签流程交由 Manus 处理。以下是我在研究中使用的三种方式,从简单的数据提取到完整的演示文稿构建,逐步递进。

  1. 规划团队出行并自动填写预订表单

规划一次团队外派活动通常需要在一台显示器上开着 Google 地图,在另一台显示器上切换浏览 或 Airbnb。你需要权衡预算、用户评价和距离特定场地的距离,这意味着无穷无尽的交叉比对。

我把这些繁琐的分页操作交给 Manus 来处理。我输入提示:“我正在为同事预订酒店,因此请忽略 中可能预填的账户信息,仅使用我稍后提供的客人信息。使用‘我的浏览器’在芝加哥市中心搜索 10 月 12 日至 15 日的酒店,筛选四星级及以上、每晚价格低于 300 美元的选项。对前 3 名结果,使用 Google 地图检查步行至麦考密克会展中心的距离。在此聊天中总结前三名的结果,包括价格、评分和步行时间,以便我做出选择。”

图片4

Manus 打开预订网站,设置好我的入住日期和筛选条件,然后进入地图页面验证通勤时间,最终直接在 Manus 聊天中返回一份清晰的前三名汇总。选定酒店后,我发送一条后续提示,要求 Manus 开始预订并填写客人信息。当系统停在信用卡支付页面时,它会暂停,让我接管浏览器,自行安全地完成付款。

  1. 无需在标签页间混乱切换,快速生成采购候选清单

当需要大批量采购设备时,调研阶段通常会耗掉半天时间。你得逐个点击零售商页面,避开广告推广内容,将价格复制到表格中,再浏览数百条评价,试图找出耐用性或组装方面的潜在问题,才能决定是否下单。

现在,我把整个调研过程交给 Manus 完成。我输入指令:“我正在为公司办公区建设采购升降桌。请使用我的浏览器搜索沃尔玛,跳过广告结果,打开前4个自然排名的页面。针对每个产品,提取价格和平均评分,并总结出前三条最关键的用户评价,让我能提前识别耐用性或组装方面的问题。最后生成一张清晰的对比表格,我可以直接插入采购简报中。”

Image 5

Manus 在我当前活跃的浏览器标签页中打开零售商页面,自动过滤掉广告内容,并逐一处理每个商品详情页。它利用原生的广域研究能力读取每一条评论,随后将价格、评分和潜在风险点整理成一张结构清晰的对比表格。我获得了一份可直接决策的候选清单,完全无需自己手动打开任何标签页。

  1. 从你在 Substack 上阅读的新闻简报中提取研究摘要

我关注的领域中最深刻的分析,往往藏在 Substack 上的新闻简报里。Lenny 的新闻简报就是其中之一。其存档中充满了关于 AI 代理、变现模式和产品战略的文章,我希望能从中汲取灵感,但几乎从未有时间坐下来,一个接一个打开这些文章,提取真正与当前问题相关的内容。

于是我让 Manus 代我完成这次调研。我输入提示:“我正在构建一个关于 AI 如何重塑产品变现与代理策略的观点。请使用我的浏览器打开 Substack,进入 Lenny 的新闻简报,查找过去 30 天内最相关的文章,全文阅读,并提炼出核心论点。我希望得到一个仪表板,展示最强有力的主张、每位作者所依据的支持证据,以及各篇文章中共同浮现的待解问题。”

Image 6

由于 Manus 运行在我的授权浏览器会话中,它能无缝继承我已登录的状态。如果某份简报是我订阅的,Manus 可以像我本人从邮箱点击进入一样,直接打开完整文章。它逐篇通读,然后将观点整合成一份清晰的仪表板,清晰呈现最强主张、背后的证据支撑,以及值得进一步深入探究的问题。我获得了一份高质量的研究摘要,内容来自我原本就关注的写作资源。

一个拥有“双手”的智能体

真正的 AI 智能体不应只存在于聊天窗口中。一个真正有能力的智能体需要一个可用的工作环境:一个可以运行代码的沙箱、一个能浏览网页的浏览器,以及连接外部服务的接口。这些就是智能体的“双手”。当智能体能够使用浏览器时,它便不再只是总结信息,而是能够基于信息采取行动。

由于浏览器操作器直接运行在你的本地浏览器环境中,它也严格遵守你的边界。所有敏感数据不会离开你的设备,智能体仅能访问你授权的内容。这种协作模式建立在透明之上:你可以实时观察它的操作,随时中断,或在遇到敏感步骤(如支付页面)时亲自接管。自动化不该是黑箱,而应是一个你愿意托付真实任务、且始终掌握控制权的可靠伙伴。

AI 可能会生成不准确的信息,请核实重要内容