美国旧金山Unstructured与Teradata合作，2026年4月起集成AI数据处理功能

2026-03-10 09:11

关键词:

2026年3月9日，美国旧金山，数据平台Unstructured宣布与Teradata达成合作，将数据摄取和处理功能原生集成到Teradata Enterprise Vector Store中。预计从2026年4月开始，符合条件的Teradata客户能够使用此集成功能，自动处理非结构化内容，如文档、PDF、电子表格、电子邮件、图像、视频和音频，直接转化为高质量的AI就绪数据。在典型部署中，无需外部管道或额外基础设施管理，简化了企业AI数据处理流程。

Unstructured的文档预处理和增强能力作为服务原生嵌入到Teradata Enterprise Vector Store中，而非独立运行。客户可在同一平台上处理非结构化内容，该平台也用于结构化分析，输出直接进入Teradata Enterprise Vector Store，作为向量、结构化数据或两者兼具，提升数据处理效率。

Unstructured创始人兼首席执行官Brian Raymond表示：“这次合作验证了我们一直以来的目标：使非结构化数据处理成为企业数据栈的核心部分。Teradata的客户运行着要求高、监管严格的工作负载。将我们的平台嵌入Teradata Enterprise Vector Store意味着这些客户现在可以解锁其非结构化数据，用于生成式AI，并享有与环境中其他部分相同的治理、安全和操作严谨性。”

约80%的企业数据以AI系统无法原生使用的格式存在，如PDF、图像、视频、音频、电子邮件和扫描文档。Unstructured平台将70多种文件类型预处理为分块JSON，并在Teradata Enterprise Vector Store内生成生产质量的嵌入。此集成支持Teradata的混合部署模型，可在AWS、Azure、GCP、本地和隔离环境中运行，满足金融服务、医疗保健等领域的数据主权需求，确保摄取和预处理在数据所在处进行。

Teradata首席产品官Sumeet Arora表示：“我们的客户管理着复杂、受监管的数据环境，他们需要可信的AI就绪数据。Unstructured带来了客户所需的生产级预处理深度——原生交付于Teradata Enterprise Vector Store中，覆盖多云和本地环境。这意味着他们所需的可靠性、治理和合规性，以及部署在数据所在处的灵活性，而无需为其现有环境增加复杂性或额外工具。”

此集成涵盖预处理的所有阶段，包括文本、图像和音频的解析、增强、分块和嵌入生成。处理后的输出直接进入Teradata Enterprise Vector Store，准备用于混合搜索、RAG、代理AI工作流和传统分析。嵌入设计为与Teradata中已定义的基于角色的访问控制和治理策略对齐，平台提供与SLA兼容的可靠性，并在企业规模下实现确定性输出。

结果是一个完整的、受治理的管道，从原始企业内容到AI就绪数据，作为原生平台能力交付。企业无需拼凑开源库、独立向量数据库和外部摄取服务，而是在现有Teradata环境中获得端到端解决方案，推动AI数据处理进程。更多信息可访问unstructured.io。

美国