2025-07-31万象ai
经过了两年对Edge浏览器AI功能的小修小补之后,微软在今天为Edge浏览器加入Copilot模式,正式进军AI浏览器市场。
具体来说,Edge浏览器中的AI功能不再像以前一样只是一个聊天侧边栏,新推出的Copilot模式可以让AI阅读和理解网页内容,比如帮你做一个技术文档页面的解读或者Youtube视频的观看大纲。
它也可以一次性浏览所有你已打开的网页,当你在多个商品或者酒店页面来回切换烦恼时,帮你列一个对比表格来辅助决策。微软还增加了语音功能,你可以通过语音聊天来理解网页、和AI实时对话。
这些功能看上去与市面上已有的AI浏览器好像没什么不同,但微软CEO萨提亚·纳德拉(SatyaNadella)对此赞不绝口,“这是我们为AI时代重新定义浏览器的第一步。”他说他最喜欢multi-tabRAG功能,可以让他更快地分析微软过去一年在Nature上发表的论文——介绍新功能的同时顺带炫耀一番。
目前该功能尚处实验阶段,微软称将会逐渐为Copilot模式加入新功能。实验的另一层含义是现在Copilot模式为“限时免费”。考虑到目前Copilot仍由OpenAI提供基础模型支持,这意味着你可以免费使用不少ChatGPT的付费功能。
比如你可以在Copilot模式下使用ChatGPT中付费的DeepResearch功能。纳德拉还透露他们将推出任务代理功能,让用户在浏览网页的同时委托Copilot处理任务。一位AI创业者将其称之为ChatGPTAgent的免费替代版。ChatGPTAgent目前仅向Plus及以上用户开放,最低月付费20美元。
这大概也是当前Edge相较其他AI浏览器最大的吸引力了。在OpenAI还没正式推出自家浏览器之前,你可以在Edge中使用平替版的ChatGPT——算是为山姆·阿尔特曼(SamAltman)脱离微软又提供了一个借口。
和2023年最初宣布Edge浏览器向AI转型一样,微软官网发布的产品更新中对Copilot模式依然添加了不少宏大的名词概念,诸如“我们正见证着网络互动方式的转折点”“这是我们进一步探索更强大网页浏览方式的下一步”等等。
但用户打开Copilot模式之后,最明显的感知或许就是主页界面变成了一个Copilot对话框,微软称之为“整合了对话、搜索和网页导航”,敲入关键词时可以启用Bing搜索也可以直接与Copilot对话。
微软在产品文档中介绍,Copilot可以理解用户意图,帮助用户更高效地理清信息,不再被庞杂的标签页面困扰。你在浏览网页时,也可以随时调出地址栏左侧的Copilot提问,Copilot还可以根据用户的历史记录,预测用户下一步操作给出建议。
以前段时间Manus在官网发布的AIAgent上下文工程的技术文档为例。打开网页,Copilot可以理解网页内容,为用户提供文档解读或大纲。它似乎也可以理解视频内容,比如对一则Youtube视频进行要点整理,生成视频摘要。
Copilot总结网页内容
Copilot总结Youtube视频
针对电商网站,Copilot还可以根据商品详情页进行AI总结,还会提供历史价格走势图、与其他网站进行比价等。不过这项功能仅适应于亚马逊、Shein等海外购物网站,国内淘宝、京东等电商网站尚不支持。
Copilot总结商品页面
但这些只能算是AI浏览器的基础能力。国内的夸克、豆包乃至QQ浏览器也有类似功能,夸克的AI总结会将原有网页转换阅读模式,豆包也可以对B站上的视频进行分析整理,QQ浏览器还推出了网页搜索与模型对话的双屏功能。更不客气点,你在Chrome上安装一个AI插件就可以获得近似体验,还能自定义模型。
Copilot模式更显著的区别是它具备了主动能力,比如AItabgrouping,可以自动按主题将你的标签页归组。又或者纳德亚口中的multi-tabRAG功能,它可以让AI浏览用户已打开的所有标签页内容,无论你是在阅读论文、比较酒店或者浏览新闻,都可以快速启用这一功能,“让你的浏览器变成一个帮助你轻松比较、决策和完成任务的工具。”
《山上》实测了包括淘宝、京东以及亚马逊等多个国内外的电商网站,Copilot都可以整理多个不同平台、网页的商品型号、卖点、价格、评价等,给出一个详细的购买建议。此前国内密集更新的AIAgent产品,多数也都能实现类似功能。
Copilot总结天猫商品页面并给出购买建议
但也仅此而已了,和市面上所有号称Agent能力的产品一样,Copilot并没有打通支付环节,无论是预定酒店、购买商品还是规划行程,它都无法实现微软宣传片中的无缝体验,这些功能都还是期货。
Copilot也可以阅读PDF文档。打开阿里巴巴的2024年的季度财报,Copilot会阅读文档内容并给出针对性的回答。它还接入了OpenAI的文生图能力,连续对话后它会询问你是否需要将财务数据整理成可视化图表。只是仍然没法直接使用,图表中有不少错误,比如完全丢掉了阿里巴巴2024年第一季度的业绩——它只阅读了三个网页。
Copilot阅读PDF财报
在语音模式的加入下,微软为Copilot模式增加了一个颇具科幻感的Vision功能。你可以用语音与Copilot实时对话,无论你正在浏览什么网页,都可以直接语音提问“这段在说什么”或者“这张图片是什么”。“它会看到你当前的页面,与你一起阅读,一起讨论你面临的难题。你不会再有独自一人面对所有标签页的孤独体验。”微软此前的产品文档中说。
但这项能力同样不算新鲜。Perplexity本月初发布的Comet浏览器同样支持语音实时交互,但目前Comet初期仅向PerplexityMax订阅用户($200/月)及部分邀请用户开放,尚未全量铺开。
豆包桌面版同样具备类似功能,但在Mac系统下必须打开屏幕共享权限,将整个桌面画面共享给AI,而Edge无需打开屏幕共享。《山上》实测发现,豆包的语音互动无法实时对话打断,只能通过手动点击屏幕打断,互动性不强。与之相比,即便在国内网络环境访问下,CopilotVision的反应速度也更快、回答更精准,同时也可以实时打断,交互体验更接近即时沟通。
忘掉那些AI博主们高呼的网页浏览形式变了的口号吧,就当下的体验而言,Copilot模式的许多功能与现有AI浏览器没有什么不同。微软强调Copilot仍处于实验阶段,他们仍将继续增加新功能,用户也可自行选择打开或者关闭。
与今年上半年的通用AIAgent概念相比,AI浏览器是一个更早也更快进入到人们视野的产品。最早的AI浏览器大多只是在浏览器中内置了部分AI能力,提供基础的AI对话或网页总结功能。
Agent热潮袭来之后,更多的AI浏览器开始强调自主执行任务的能力,诸如TheBrowserCompany的Dia浏览器、Perplexity的Comet浏览器以及OperaNeoa均属此类。微软在宣传Edge中的Copilot模式时,同样强调它的主动性。
科技公司们对于AI浏览器的热衷不难理解,诞生30余年之后,浏览器仍然是人们在桌面端触达互联网的第一窗口——甚至它的核心交互模式都没有发生太大变化,一路从网景、IE演变到今天的Chrome,就连Chrome也是17年前的产品了。
大模型的诞生重塑了人们获取信息的方式,人们普遍相信浏览器也将会发生改变,无论是巨头还是创业公司都试图抢占这一市场。市场调研机构Market.us预测,全球AI浏览器市场将从2024年的45亿美元增长至2034年的约768亿,年复合增长率达32.8%。
Market.us报告
但很难说当下的AI浏览器与AIAgent之间的区隔有多么清晰——二者的底层技术类似、瞄准的方向也是一样的。微软在Copilot模式中展现的能力,都可以在OpenAI过去半年的功能更新中找到影子。比如OpenAI年初更新的Operator功能,它让AI操作网页成为可能。微软在宣传片中描绘的Copilot未来能力,也和OpenAI的ChatGPTAgent十分类似。
蝴蝶效应在推出Manus之前瞄准的就是AI浏览器方向,但他们最终放弃了。Manus联合创始人张涛说,AI浏览器的用户体验受限,他们意识到要实现真正的通用的人工智能代理,必须要从浏览器界面脱离。
甚至Perplexity决定推出AI浏览器也像是被迫的,PerplexityCEOAravindSrinivas说,他曾经联系Chrome团队,希望将Perplexity作为Chrome的默认搜索引擎,但被拒绝,于是决定自己做一个。
——天知道Srinivas怎么想的。纽约时报称,Google为了成为Safari的默认搜索引擎,仅2021年就向苹果支付了约180亿美元,怎么可能会将自家Chrome让给竞争对手。
Srinivas对于AI浏览器的看法也和AIAgent有些类似。他今年4月的一次播客对谈中说,浏览器就是构建Agent的最佳方式。“浏览器本质上就像一个容器化的操作系统。它可以在你已登录第三方服务的情况下,通过隐藏标签页访问这些服务,在客户端抓取页面内容,并代表你进行推理和执行操作。”
换句话说,AI浏览器其实也是一种AIAgent。只是由于当前大模型能力受限,仍无法摆脱原有的浏览器框架,只能继续以传统标签页和网页交互为核心,更多只是对现有浏览器体验的增强,而非彻底颠覆。
很难说这样的中间形态会吸引多少用户改变习惯。微软早在2023年就开始为Edge浏览器加入AI功能,但两年下来基本没对Chrome造成太大威胁,AI的带动作用可能还没有Chromium内核大。
豌豆荚创始人王俊煜发表在《第一财经》杂志的评论文章称,今天的AI浏览器虽然努力做了很多体验创新,但还远远不够形成质变。AI还没有深度融合到浏览器中,没有真正成为“眼睛和手脚”。
Chrome浏览器的市场垄断地位也很难轻易撼动,多数标榜AI的浏览器仍然在使用Chromium内核。OpenAI虽然被传即将推出AI浏览器,但他们同时也对收购Chrome兴趣颇大。
“即使Dia能从其中找到带来10倍体验的亮点,我也看不到什么Chrome无法跟进的理由。”王俊煜说。5月,Google在Chrome中增加了Gemini入口,可以阅读网页和对话,体验与Dia相似。
AI浏览器往往强调可以自主操作网页,但又带来了隐私安全问题,并不是所有用户都愿意将自己浏览的网页发给AI。
此前微软在Windows中内测Recall功能,这是一个内嵌在系统层级的AI工具,可以在后台定期截取用户屏幕和内容,以方便用户随时切换至此前时间点。Recall一经推出就遭遇不少批评,部分媒体报道甚至将其形容为监控软件。
科技媒体TheVerge报道了微软在Edge浏览器中推出Copilot模式的消息。文章下的高赞评论写道:“微软在Edge的最新更新中捆绑了*软件Copilot。”
另一条更活泼的评论说,“微软需要决定一下,我到底该在浏览器里使用Copilot,还是在Windows11里使用?抑或是在Word文档的每一行,甚至Excel的每一个单元格用?把那个该死的Copilot标志塞满每个角落,实在让人心烦。”
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表本站立场。文章及其配图仅供学习分享之
新品榜/热门榜