美国旧金山Unstructured与Teradata合作,2026年4月起集成AI数据处理功能
2026-03-10 09:11
收藏

2026年3月9日,美国旧金山,数据平台Unstructured宣布与Teradata达成合作,将数据摄取和处理功能原生集成到Teradata Enterprise Vector Store中。预计从2026年4月开始,符合条件的Teradata客户能够使用此集成功能,自动处理非结构化内容,如文档、PDF、电子表格、电子邮件、图像、视频和音频,直接转化为高质量的AI就绪数据。在典型部署中,无需外部管道或额外基础设施管理,简化了企业AI数据处理流程。

Unstructured的文档预处理和增强能力作为服务原生嵌入到Teradata Enterprise Vector Store中,而非独立运行。客户可在同一平台上处理非结构化内容,该平台也用于结构化分析,输出直接进入Teradata Enterprise Vector Store,作为向量、结构化数据或两者兼具,提升数据处理效率。

Unstructured创始人兼首席执行官Brian Raymond表示:“这次合作验证了我们一直以来的目标:使非结构化数据处理成为企业数据栈的核心部分。Teradata的客户运行着要求高、监管严格的工作负载。将我们的平台嵌入Teradata Enterprise Vector Store意味着这些客户现在可以解锁其非结构化数据,用于生成式AI,并享有与环境中其他部分相同的治理、安全和操作严谨性。”

约80%的企业数据以AI系统无法原生使用的格式存在,如PDF、图像、视频、音频、电子邮件和扫描文档。Unstructured平台将70多种文件类型预处理为分块JSON,并在Teradata Enterprise Vector Store内生成生产质量的嵌入。此集成支持Teradata的混合部署模型,可在AWS、Azure、GCP、本地和隔离环境中运行,满足金融服务、医疗保健等领域的数据主权需求,确保摄取和预处理在数据所在处进行。

Teradata首席产品官Sumeet Arora表示:“我们的客户管理着复杂、受监管的数据环境,他们需要可信的AI就绪数据。Unstructured带来了客户所需的生产级预处理深度——原生交付于Teradata Enterprise Vector Store中,覆盖多云和本地环境。这意味着他们所需的可靠性、治理和合规性,以及部署在数据所在处的灵活性,而无需为其现有环境增加复杂性或额外工具。”

此集成涵盖预处理的所有阶段,包括文本、图像和音频的解析、增强、分块和嵌入生成。处理后的输出直接进入Teradata Enterprise Vector Store,准备用于混合搜索、RAG、代理AI工作流和传统分析。嵌入设计为与Teradata中已定义的基于角色的访问控制和治理策略对齐,平台提供与SLA兼容的可靠性,并在企业规模下实现确定性输出。

结果是一个完整的、受治理的管道,从原始企业内容到AI就绪数据,作为原生平台能力交付。企业无需拼凑开源库、独立向量数据库和外部摄取服务,而是在现有Teradata环境中获得端到端解决方案,推动AI数据处理进程。更多信息可访问unstructured.io。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com