数据挖掘算法在河口羽状流数据分析中的应用*
羽状流的近场扩散角作为河口动力学的关键参数,对河流入海物质的输运扩散过程有重要影响,而在真实环境中由于受到复杂因素的影响,羽状流扩散角存在着显著的变化。数据挖掘技术尽管在地学数据的应用上尚处于探索阶段,但研究这一问题提供了一种有效途径。本文基于马格达莱纳河羽状流近场扩散角及周边环境数据,利用多重数据挖掘算法开展数据分析和评估,最终建立了羽状流扩散模型,对其影响因素和时间序列开展研究。结果表明,数据挖掘算法能够有效指示环境因素的贡献值而不受量纲、极值的影响,从而为进一步探究河口羽状流控制因素提供参考。受数据量和数据精度的影响,随机森林算法得到的变量分析结果与实际情况更为相似,数据集特征与数据量之间的博弈是造成模型结果差异的主要原因。根据数据挖掘算法结果,可以在马格达莱纳河河口建立羽状流扩散角模型,并分析其随环境参数和时间变化的趋势。模型结果显示,对马格达莱纳河而言,环境因素与羽状流扩散角均存在负相关关系,河流的指向方向为最主要影响因素,其次为风速,因此在开展进一步分析时可以针对环境因素添加不同权重以期获得更真实的结果。随时间增长,羽状流扩散角将进一步收紧,可能会引起河口的通道化。