Google 近日在其 Colab Python 平台推出了一款由 Gemini 2.0 驱动的免费数据科学代理。这款 AI 助手专注于自动化数据分析,现已面向特定国家和语言的 18 岁以上用户开放。用户可通过 Google Colab 访问该工具,这是一个已有 8 年历史的云端服务,支持在谷歌的图形处理单元(GPU)和张量处理单元(TPU)上运行 Python 代码。数据科学代理最初于 2024 年 12 月向受信任的测试人员推出,旨在通过自然语言描述生成功能完整的 Jupyter Notebook,简化研究人员和开发人员的工作流程。

Google Colab 是一个基于云的 Jupyter Notebook 环境,用户可在浏览器中直接编写和执行 Python 代码。自 2017 年上线以来,其低门槛和对 GPU、TPU 的免费访问使其成为机器学习和数据科学领域的热门选择。该代理延续了 Google 在 Colab 中集成 AI 功能的努力,例如 2023 年 5 月推出的 Codey 编码辅助工具。数据科学代理还能与 OpenAI 的 ChatGPT 高级数据分析功能竞争,提供更高效的替代方案。
这款代理利用 Gemini AI,用户只需用简单英语描述需求,如“可视化趋势”或“训练预测模型”,即可生成可执行的 Colab 笔记本。它能自动化分析流程,节省手动设置时间,并支持团队协作,用户还可自定义生成的代码。劳伦斯伯克利国家实验室的一位科学家表示,其研究热带湿地甲烷排放的数据处理时间从一周缩短至五分钟。在 DABStep 多步推理基准测试中,该代理排名第四,超越部分 GPT-4.0 和 Claude 3.5 Haiku 模型,但仍落后于 OpenAI 的 o3-mini、o1 以及 Anthropic 的 Claude 3.5 Sonnet。
尽管存在会话时间限制和资源分配的不确定性,Colab 凭借其便捷性和强大计算资源,仍是数据分析早期阶段的优选工具。数据科学代理的推出进一步提升了其价值,尤其在加速科学研究方面展现潜力。









