引言

许多技术专家会告诉你,AI 浏览器是未来的工作利器。但现实远比这复杂。经过数周对 Perplexity 的 Comet 和 ChatGPT 的 Atlas 浏览器的测试,我发现了一个不争的事实:这些工具能在特定研究任务上帮你节省时间,却在复杂任务中不堪一击。对于早已被多个打开的标签页搞得焦头烂额的数据科学家和分析师来说,这一点至关重要。但在你放弃 Chrome 转而选择 AI 浏览器之前,你需要先明白这些工具真正能做什么,更重要的是,它们不能做什么。

什么是 AI 浏览器

AI 浏览器听起来像是最完美的浏览器 —— 直到你实际使用它。本质上,它仍是一款网页浏览器,与 Chrome 或 Safari 类似,但在侧边栏中集成了人工智能助手。该助手可以读取你正在浏览的任何网页、解答相关问题、总结文章内容,甚至尝试自动化任务,例如填写表单或跨网站比价。

Perplexity 的 Comet 与传统浏览器不同,它能同时理解多个标签页的上下文。如果你同时打开了研究论文、数据仪表板和竞争对手报告,Comet 的助手可以一并读取所有内容并整合发现。这款浏览器基于 Chromium 构建,与谷歌 Chrome 同源,因此支持你已在使用的所有扩展程序。

其核心卖点是自动化功能。Comet 助手位于侧边面板中,可执行多标签页操作。无需手动从五个网站复制数据到电子表格,你只需让 Comet 代劳即可。

AI 浏览器在数据科学家工作流中的应用

要判断 AI 浏览器是否适合你的工作流程,不妨看看一位数据科学从业者使用 Comet 的真实一天。

用 Comet 做市场调研

如果研究人员需要获取机器学习平台的竞品数据,通常需要打开 10 到 15 个标签页,手动提取定价、功能和性能指标并整理到电子表格中。

使用 Comet 时,研究人员创建了一个工作区(Comet 称之为 “Space”),并为六个竞争平台打开了标签页,然后向助手发出指令:

“创建一个对比表格,包含平台名称、月均定价、免费版功能和最新更新日期。”

助手会同时读取六个网站的内容,并在三分钟内生成格式规范的表格。而手动完成这项任务大约需要 45 分钟。

用 Comet 做研究整合

接下来是分析三篇关于异常检测算法的学术论文。任务要求提取关键数学概念、比较研究方法,并确定哪种方法最适合他们的数据集。

在传统浏览模式下,这需要打开每篇 PDF、阅读、记笔记、在标签页之间切换,然后手动进行比较。他们向 Comet 提问:

“总结这三篇论文在核心数学原理上的差异,并根据它们对实时金融数据的适配性进行排序。”

助手整合了所有三篇已打开论文的内容,生成了带排名的总结报告,还引用了每篇文献的直接原文。助手甚至能理解之前问题的上下文,因此无需再次提示就优先考虑了金融数据的应用场景。

这项任务手动完成通常需要 2 小时,实际使用 Comet 仅耗时 18 分钟。

Comet 在研究整合中的局限性

但 Comet 也有短板。研究人员需要助手自动从一个 JavaScript 密集型仪表盘中提取数据、与 SQL 数据库进行校验,并标记不匹配之处 —— 而这正是 AI 浏览器失灵的地方。

Comet 无法正常与动态仪表板交互。它尝试点击按钮,但页面并未按预期响应。助手被交互元素搞晕,最终放弃了任务。研究人员不得不手动完成这项工作。

这就是真相:AI 浏览器擅长读取和整合静态信息,却难以应对现代 Web 应用中的复杂多步骤交互。

Comet 与 ChatGPT Atlas:该选哪款浏览器?

关注 AI 领域新闻的人应该知道,OpenAI 已推出了自家的 AI 浏览器 ChatGPT Atlas。它在部分任务上速度更快,但存在其他局限性。

ChatGPT Atlas 的自动化攻击性更强。在速度测试中,它完成一份研究摘要仅需 47 秒,而 Comet 需要 58 秒;提取 CSV 文件时,Atlas 的速度优势更为明显,仅需 36 秒,Comet 则需要 52 秒。

然而,Atlas 有一个关键缺陷:目前仅支持 macOS 系统。如果你的团队使用 Windows 或 Linux,暂时无法使用它。

更重要的是,Atlas 被锁定在 OpenAI 生态系统中。如果你想将它与其他工具或工作流程配合使用,是无法实现的。而 Comet 可与 Perplexity Pro 集成,能融入你现有的 AI 研究工作流程。

对于数据科学家而言,选择哪款工具取决于你的核心任务:如果需要整合多个来源的信息,Comet 更合适,因为它在多标签页上下文感知方面表现更出色;如果要自动化重复性表单填写或网页爬取任务,Atlas 可能会帮你节省更多时间 —— 但前提是你使用的是 Mac。

两款浏览器的性能差距并不大,都不足以成为 “必备工具”。它们存在相同的根本性局限:难以应对复杂的交互式网站。

测试指标Perplexity CometChatGPT AtlasBrave Leo
研究摘要(秒)584762
CSV 提取(秒)523648
多步骤对比(秒)185132161
整体实用性极高

为何 AI 浏览器性能参差不齐?

了解底层技术有助于解释 AI 浏览器性能不稳定的原因。

当你让 AI 浏览器总结网页时,它会获取完整的文本内容,并通过语言模型进行处理。这本质上与 ChatGPT 的工作原理相同,区别只是处理单个网页而非通用提示词。对于这类任务,AI 的表现确实很出色。

但当网站使用 JavaScript 动态加载内容时,一切就会出错。浏览器可以显示渲染后的页面,但 AI 无法确定哪些元素是可交互的、数据存储在何处,也不知道如何正确触发动态内容。下午的测试中,Comet 尝试使用 JavaScript 仪表板时,相当于在解决一个其设计初衷并未涵盖的难题。

这并非 Comet 或 Atlas 独有的缺陷,而是现代 Web 应用工作方式带来的根本性局限。除非 AI 系统能实时可靠地解读复杂的交互式界面,否则 AI 浏览器在研究和阅读场景中的实用性仍会远高于自动化场景。

AI 浏览器的隐私与安全问题

这是 AI 浏览器厂商不愿直面的话题。要实现实用功能,AI 浏览器助手需要获得读取邮件、查看日历、访问联系人以及与你的账户交互的权限。Perplexity 和 OpenAI 需要广泛的访问权限,才能兑现其自动化承诺。

这种访问权限带来了安全漏洞。网络安全研究人员发现,一种名为 “提示注入攻击” 的攻击方式是所有 AI 浏览器面临的系统性风险。其原理是:恶意网站在页面代码中隐藏指令,诱骗 AI 执行本不应执行的操作。攻击者有可能操控 Comet 泄露你的邮件,或进行未授权购买。

目前尚无针对提示注入攻击的完整防御方案。这是一个全行业都在努力解决的新兴问题。

对于处理敏感研究数据的数据科学家而言,在授予浏览器如此广泛的访问权限前,需要慎重考虑。许多有严格合规要求的机构(律师事务所、金融机构、医疗企业)正因这种风险,禁止在企业网络中使用这些工具。

真实的效率提升与局限

实际测试结果如下:

AI 浏览器能带来显著时间节省的任务包括:

  • 总结长篇文章或报告(每份文档节省 15 至 30 分钟)
  • 跨多个静态网站对比信息(节省 30 至 60 分钟)
  • 从 PDF 中提取关键信息(节省 20 至 45 分钟)
  • 整合多个来源创建研究表格(节省 30 至 60 分钟)

AI 浏览器表现不佳或完全失效的任务包括:

  • 使用 JavaScript 密集型仪表板或交互式 API
  • 在不同网站间执行需要动态决策的多步骤复杂交互
  • 处理涉及敏感企业 API 或内部网络的任务

Reddit 上一位深入测试过 Comet 的研究人员表示,它让自己的研究整合效率提升了一倍,每天大约节省一小时。但这仅适用于信息密集型工作。对于普通网页浏览或使用复杂应用,时间节省效果会完全消失。

Perplexity 的 CEO 声称,Comet 能将生产力提升 20%,甚至可能为全球 GDP 增加数万亿美元。这是风险投资领域的宣传话术,而非工程实际。现实使用数据显示,效率提升更为温和 —— 特定工作流程中可能节省 5% 至 10% 的时间,其他场景则毫无增益。

你应该切换到 AI 浏览器吗?

诚实的答案是:取决于你的实际工作流程。

如果你的工作主要涉及阅读、分析和整合多个在线来源的信息,AI 浏览器会为你节省大量时间。需要进行文献综述、竞品分析或研究整合的数据科学家就属于这一类。

如果你的工作涉及使用 Web 应用、填写表单或操作 JavaScript 密集型工具,最好继续使用当前的浏览器。AI 浏览器不仅无法提供帮助,甚至可能拖慢你的进度。

成本也是一个重要因素。Comet 需要订阅 Perplexity Pro Max,月费约为 20 美元。如果每天能在研究工作上节省 30 分钟,这笔费用大致能回本;但如果每周仅节省 5 分钟,就完全不值得了。

ChatGPT Atlas 目前处于测试阶段,可免费使用,但最终可能会收费。对于从事研究密集型工作的 macOS 用户,它可能会成为值得选择的工具;对于其他人而言,是否划算还很难说。

隐私、安全与不争的事实

在采用任何一款 AI 浏览器前,你需要明白自己正在进行的权衡。

AI 浏览器需要将页面内容发送到云服务器进行处理。这意味着你查看的数据在被总结或分析前,会经过外部系统。对于大多数研究工作而言,这没问题;但对于敏感或专有信息,这就是个大问题。

一些机构的解决方案是:仅在公开研究中使用 AI 浏览器,将专有工作留在传统浏览器中处理。这是一种合理的折中方案,但也在一定程度上违背了使用 AI 浏览器的初衷。

提示注入攻击的风险是真实存在的,但只要保持常识,就不会造成即时灾难。不要使用 AI 浏览器代理访问高风险网站,例如银行门户网站或敏感企业系统。将其用于研究、分析和信息整合等场景,这些场景中出错的负面影响相对较小。

结论

总之,AI 浏览器不会消失,但短期内也不会取代传统浏览器。技术会不断进步:JavaScript 应用的性能问题可能会得到改善,新的安全标准最终也会解决提示注入攻击的隐患。

现在关键是让工具适配任务。对于数据科学家而言,最实际的应用场景正如我们测试的那样:整合多个来源的研究信息。这正是 AI 浏览器能带来可衡量的生产力提升、又不会牺牲安全性或陷入过度复杂操作的领域。

如果你每周要花费数小时阅读、比较和整合信息,不妨试用 Comet 或 Atlas 一周。仅时间节省这一点就可能让你觉得物有所值。如果你的工作以应用程序使用为主,或涉及复杂的交互式任务,那就省点钱,继续使用你熟悉且可靠的工具吧。

原文链接:https://36kr.com/p/3569743178464137

网站页脚示例