维度网讯,印度数据服务企业SunTec India完成了一项为政府基础设施咨询公司提供的数据标注项目,处理了超过300万个标注,准确率达到99%。该数据集将用于训练一个覆盖印度国家及邦级公路网络的路面资产与损坏检测模型。
标注团队在客户托管的CVAT平台上使用边界框以及4点和多点多边形标注对公路图像进行标注,以识别路面损坏并根据IRC82政府标准对道路资产进行分类。项目覆盖超过1000公里公路走廊,涉及71种不同的损坏和资产类别。其中,4点标注约占工作总量的80%,其余20%需要高度精细的多点标注。
该图像标注项目最初以4名标注员和1名审核员的小规模试点展开。试点完成后,范围迅速扩大,团队扩展至35名标注员和7名审核员,均为具备土木工程背景的领域专家。在团队规模增长八倍的过程中,准确率保持稳定。SunTec India将这一成果归功于合理的审核员与标注员比例,以及在标注真实数据前对IRC82标准进行的系统培训。
SunTec India数字工程服务总监兼营销主管Rohit Bhateja表示,最令其自豪的是随着规模扩大准确率一直保持不变。他补充说,公路并非统一,不同地区的天气、光照和磨损程度各异,在一千公里范围内标注71个类别会产生数千个边缘案例,而在此情况下达到99%的准确率表明,无论数据集大小如何,人机协同工作流程都能保持稳定。
这一里程碑巩固了SunTec India在人工智能和机器学习应用领域、特别是地理空间和航拍图像标注方面的专业数据标注地位。同时,这也反映出市场对具有技术标注指南和密集类别的专业AI训练数据的需求日益增长。该公司预计,在受监管行业中对此类高一致性标注的需求将进一步增加。
SunTec India成立于1999年,是一家基于人工智能的IT和数字服务公司,为AI培训、ESG研究、B2B销售情报和文档处理提供智能数据服务和AI技术平台,同时还提供数据收集、清洗和丰富等数据管理操作。该公司拥有超过25年的行业经验,已服务超过50个国家的8500多家客户,拥有1500多名全职专业人员。









