资料简介
摘要在建筑项目规划阶段进行可靠的项目管理是一个细致的过程,通常需要充足的先例作为依据。典型的施工工期估算基于类似项目的过往案例,用于验证承包商提出的施工工期方案、规划项目总工期,并作为衡量项目成败的标准。对于超过200米的高层建筑,由于此类项目数量稀少,往往会出现数据不足的情况,导致施工工期估算较为粗略。因此,本研究探索了基于工程原理的过采样和数据增强技术,如参数优化和数据不平衡问题的处理方法,以用于高层建筑幕墙施工工期的估算。本研究分两个阶段进行。第一阶段,将拉丁超立方抽样(LatinHypercube)、最优拉丁超立方抽样(optimalLatinHypercube)、简单蒙特卡罗抽样(simpleMonteCarlo)、描述性蒙特卡罗抽样(descriptiveMonteCarlo)、索博尔蒙特卡罗抽样(SobolMonteCarlo)、合成少数过采样技术(syntheticminorityoversamplingtechnique,SMOTE)和SMOTE-Tomek等过采样和数据增强技术应用于从以往项目收集的15个原始数据集。将数据集按照8:2的比例划分为训练集和测试集,并运用上述技术从训练数据中生成500个虚拟样本。第二阶段,应用支持向量回归(supportvectorregression,SVR)预测施工工期,并采用统计性能指标进行评估。结果表明,基于展示数据分布的箱线图分析,SMOTE和SMOTE-Tomek能最好地代表原始数据集。此外,根据统计性能指标发现,过采样技术提高了预测性能,其中表现最佳的采样方法使线性、多项式和径向基函数(RBF)的皮尔逊相关系数分别提高了0.611%、4.232%和0.594%。最后,在预测模型方面,根据统计性能指标,概率过采样方法优于其他方法。关键词:数据增强;数据不足;高层建筑;幕墙施工;工期估算
|