Skoltech的研究人员已经训练了一个神经网络来有效地识别岩芯盒图像中的岩石样本。它将分析过程加快了20倍,并使岩石样本的描述自动化成为可能。开发的算法用于DeepCore系统鈥攁 数字地质勘探服务由Skoltech的子公司digital Petroleum创建。发表在《计算机与地球科学》上的文章描述了该方法的细节。
地质研究的常规任务之一是描述岩石样品。在许多情况下,提取的岩芯堆放在箱子中。科学家在核心研究期间拍摄盒子或柱子的照片。该说明是通过填写电子表格或地质日志手动编制的。标准分析程序涉及在图形编辑器中从盒子的照片中手动提取色谱柱。这是一个相当耗时的过程。
为了使这一过程自动化,科学家们使用了机器学习方法。然而,传统的计算机视觉算法由于数据量有限和图像之间的巨大差异,在这方面表现不佳。例如,如果核心柱的颜色或纹理与相邻柱或在不同条件下拍摄的柱不同。这种差异会显著影响机器学习算法的性能,因为机器学习算法需要一个描述所有可能变体的大型数据集。因此,人们不得不花时间重新训练模型。
为了解决这个问题,Skoltech的科学家们使用了深度卷积神经网络鈥?与动物视觉皮层结构相似的人工神经网络。为了训练神经网络,科学家们使用了增强技术,添加了核心盒照片的修改副本,以增加数据量。基于改进的CutMix算法创建“合成”图像。CutMix算法通过随机剪切一幅图像并将其插入另一幅图像,从一对现有图像中创建新图像。由于科学家们对识别岩柱特别感兴趣,他们基于岩芯图像模板优化了该方法,仅从岩芯所在的区域切割和交换碎片。
“在同一区域拍摄的岩芯盒在视觉上可能非常相似,但岩石可能不同。如果另一个盒子中的岩石实际上放置在同一个盒子中,由于颜色的相似性,网络可能会将岩芯区域与盒子边界混淆。增强有助于网络关注颜色和形状以外的其他特征,如结构和纹理,”第一个解释道该作品的作者,斯科尔特科技公司的科学家埃夫根尼·巴拉博什金。
在他们的研究中,科学家们描述并测试了新方法,并比较了在“原始”数据上训练的算法和与增强数据混合的算法的效率。事实证明,由于增强,该算法经过训练,可以在大多数新图像中高效准确地检测岩石柱。这种自动化方法将一个核心盒的处理速度提高了20倍。此外,该方法还可以自动确定每个柱对应的深度。以前这需要用直尺测量。
“有趣的是,当我们向常规数据集中添加增强数据时,神经网络学会了识别列上有铭文的纸片,尽管在原始数据集中它们也被标记为核心。该算法检测到初始标记中的错误,并在将来避免了它,”埃夫根尼补充道。
科学家们将开发的方法作为分析阶段之一引入DeepCore系统,这是他们为从图像中自动描述核心而创建的软件产品。从图像中提取列后,程序确定层边界和岩石类型。同时,用户仍有维护的可能性。如有必要,专家可以添加其他类型的岩石或更改层边界。自2021以来,DeepCore已用于采掘行业,帮助专家减少日常工作时间并实现分析自动化。