美国谷歌Chrome推屏幕选取功能增强Gemini上下文理解
2026-06-25 14:14
收藏

维度网讯,谷歌(Google)正式在Chrome浏览器中推出“屏幕选取(Select from Screen)”新功能,旨在提升其AI助手Gemini的上下文理解能力与交互响应速度。该功能允许用户直接从网页中高亮特定文本或图像,并将其作为对话上下文发送给Gemini。

Chrome 浏览器中“屏幕选取”功能的界面,用户可高亮文本或图像发送至 Gemini

“屏幕选取”功能解决了此前AI交互的主要障碍:用户需手动描述屏幕上的内容。借助该功能,Gemini可直接聚焦用户想要询问的具体内容,无需额外描述。该功能位于Chrome内Gemini的“+”菜单中,工作原理类似内置截图工具。激活后,用户可选择当前浏览器标签页中可见的文本或图像,所选内容会自动附加到Gemini的提示中。

谷歌已开始作为Chrome 149的一部分推出此功能。部分用户可能需要重启浏览器后才能看到该功能。此次更新延续了谷歌让Gemini从独立聊天机器人转变为了解用户当前操作助手的努力。这一增强更多是消除交互障碍,通过让Gemini精确理解屏幕内容并与之直接交互,谷歌正在推动AI助手向能够理解上下文、预判意图并协助完成任务的方向演进。

“屏幕选取”功能满足了现代用户常在阅读内容与查找补充信息间切换的需求。例如,阅读包含陌生术语的技术文章时,用户只需高亮该词,Gemini便会直接给出解释,无需重新输入。上下文成为AI助手进化的关键,该功能从根本上改变了用户与Gemini的交互方式,从抽象提问转为根据所见内容进行上下文相关的提问。

该公告与同一天Gemini的其他重大升级同时发布。开发者现可通过Gemini 3.5 Flash直接使用“计算机使用(computer use)”能力。该能力允许AI代理在浏览器、移动应用和桌面环境中查看、推理并执行操作,无需依赖单独的模型。谷歌表示,这一集成增强了软件测试、企业工作流和其他多步骤自动化等长周期任务。

对于日常Chrome用户,“屏幕选取”功能意味着时间节省。学生可高亮电子书或文章内容以获得详细解释,专业人士可从报告中选择数据进行快速分析,研究人员可引用内容进行交叉验证。该功能表明谷歌致力于将Gemini更深入地整合到其产品中,与将其打造成跨平台通用助手的战略一致。

“屏幕选取”功能也为更直观的AI交互铺平了道路。通过消除不必要的步骤,创造了更流畅的体验,这标志着从问答模型向协作模型的转变。该功能仍处于推出初期,并非所有用户都能立即获得。谷歌未透露该功能是否会出现在除桌面版Chrome之外的其他平台上。随着该功能推出,AI助手市场竞争进一步升温。“屏幕选取”有望成为与竞争对手的显著差异化优势。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com