维度网讯,pgEdge 宣布推出针对 PostgreSQL 的透明数据分层解决方案 pgEdge ColdFront。该方案支持对归档数据直接执行 UPDATE 和 DELETE 操作,应用可通过已使用的同一 SQL 对冷层数据进行读写,无需修改代码或重新激活数据。旧数据以 Parquet 格式自动迁移至 Apache Iceberg,存储于任何兼容 S3 的对象存储上,存储成本降低高达 90%。完整数据集仍可通过单个 PostgreSQL 表名进行读写,冷层扫描借助 DuckDB 矢量化列式引擎实现分析级速度。

生产级 PostgreSQL 数据库随时间增长会面临历史数据带来的存储成本与操作复杂性增加问题,包括备份、真空开销和副本滞后。传统处理方式包括删除旧数据、归档到破坏查询的平面文件,或采用专有解决方案。pgEdge ColdFront 通过将冷数据自动移至廉价对象存储,同时保持通过标准 Postgres 接口的完全读写能力,且每一层均以开放格式存储,从而消除了这些权衡。
一个应用场景示例为针对五年旧归档数据的 GDPR 删除请求。使用 ColdFront 可通过一条 SQL 语句执行,无需经历将数据恢复到热层、删除、重新归档和重新验证的循环。
pgEdge 首席产品官 Phillip Merrick 表示,该方案消除了对专有供应商锁定的担忧,应用保持相同的 SQL,DuckDB 在进程内为冷数据提供分析速度,冷层可写,且可在标准的未修补 PostgreSQL 上运行。
ColdFront 的关键特性包括:唯一可直接写入的冷层,支持通过同一 PostgreSQL 表名执行 UPDATE 和 DELETE,无需重新激活或特殊路径;在 PostgreSQL 进程内运行 DuckDB,基于 Parquet 数据的冷层扫描性能比行式存储快 10 至 100 倍;无需对应用进行代码或架构更改;全层采用开源格式,冷数据为标准 Apache Iceberg(S3 上的 Parquet),可被 Spark、Trino、DuckDB 等工具独立读取。
该方案还具备内置分区生命周期管理,通过单个配置参数 hot_period 控制热数据工作集,并可设置可选参数 retention_period 在指定时间后自动删除冷数据。在多主集群环境中,冷数据从每个节点可同时进行读写访问。通过 Spock 多主集群,热数据由 Spock 复制,冷数据位于共享对象存储中,Bakery 协议(面包店协议,在 TLA+ 中正式验证)跨节点序列化 Iceberg 提交,无 409 冲突且无需应用级重试;在三个小节点上针对 9000 万行数据的测试中达到了每秒 756,000 行的性能。
pgEdge 首席技术官 Dave Page 指出,该方案自动处理数据生命周期,将存储成本降低高达 90%。其数据基础设施支持 AI 和 ML 管道,通过解耦模式将 PostgreSQL 转变为 Iceberg 上的无状态计算前端,新计算节点可在几秒内启动,无需数据同步。
pgEdge ColdFront 提供三种操作模式:分层模式(热+冷)、解耦模式(仅 Iceberg)和仅分区模式(无冷层)。该产品现作为生产级测试版提供,支持 PostgreSQL 16、17 和 18 的单实例及多主 Spock 网格拓扑。ColdFront 将随 pgEdge Enterprise Postgres 捆绑,并计划于 2026 年下半年集成到 pgEdge Cloud 中。其采用 PostgreSQL 许可证开源,文档与安装说明可在指定网站获取。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









