微信扫码
添加专属顾问
我要投稿
工业数据资产构建的创新思路,助力AI技术在制造业的应用。 核心内容: 1. 工业高质量数据集建设的重要性与挑战 2. 工艺过程统一语义建模框架的构建 3. 统一语义建模在实际工业案例中的应用
一、 统一语义建模框架:构建过程数据的“共同语言”
统一语义建模框架的目标,是为企业内所有工业过程数据(特别是时间序列和与之关联的批次/事件数据)提供一套标准化的、精确的、无歧义的描述方法。语义建模方法可以保存数据的业务含义、产生背景、物理单位、有效范围以及数据间的内在联系。类似构建了一种工业数据的“语法和词典”,可以确保现在和将来、专业和非专业的所有参与者(人与机器),都能使用同一种语言来理解和交换工业过程数据。
这个框架可以由几个关键构件组成:
1、定义过程上下文:“方面 (Aspect)”-界定一个有明确业务边界的数据视图或数据集范围。它回答了“这组数据是关于什么的?”的问题。
2、描述过程变量/参数:“属性 (Property)”-在一个“方面”内部,定义具体的测量值、设定值、计算值、状态标识或事件标签。它回答了“这个具体的数据点是什么?”的问题。
3、赋予精确语义:“特征 (Characteristic)”与“单位 (Unit)”-这是语义建模的核心价值点,用于消除歧义,明确属性的内在类型、物理意义、度量单位以及合理约束。它回答了“这个数据点具体代表什么以及如何度量?”的问题。框架通常会设计一组预定义的“特征”,如“测量值 (Measurement)”、“枚举值 (Enumeration)”、“标识符 (Identifier)”等。
4、唯一关联标识:“语义 ID (Semantic Identifier)”-在框架中定义的每一个语义构件(如每个方面、每个属性)分配一个全局唯一的标识符,通常采用 URN(统一资源名称)或 IRI(国际化资源标识符)的形式。
二、 标准应用:铜阳极炉过程数据的语义建模实践
我们以铜火法精炼工艺中阳极炉数据工程任务为例,具体展示如何运用“统一语义建模框架”构件,为工艺过程产生的复杂数据建立清晰、一致的语义模型。
1、建模场景细化:阳极炉精炼主要包括氧化、还原两个核心阶段,并最终产出合格的阳极铜。我们需要对整个批次(Charge/Heat)的总结信息、以及两个主要阶段的过程参数(高频时间序列)、还有伴随产生的烟气成分(高频时间序列)进行建模。
2、过程时序数据建模实例 (以氧化阶段为例):
方面 (Aspect):AnodeFurnace_OxidationPhase_TimeSeries
urn:com:example:copper-smelter:aspect:anode-furnace-oxidation-ts:1.0
timestamp
xsd:dateTimeStamp
(记录采样时间)batchIdentifier
samm-c:Text
(关联到具体批次)furnaceIdentifier
samm-c:Text
(关联到具体炉号)furnaceTemperature
samm-c:Measurement
, 单位 unit:degreeCelsius
(炉膛温度)oxidationAirFlow
samm-c:Measurement
, 单位 unit:cubicMetrePerHour
(氧化空气流量)flueGasPressure
samm-c:Measurement
, 单位 unit:pascal
(烟道压力)sulfurContentEstimate
samm-c:Measurement
, 单位 unit:percent
(过程中硫含量估算值)3、烟气时序数据建模实例:
AnodeFurnace_FlueGas_TimeSeries
urn:com:example:copper-smelter:aspect:anode-furnace-fluegas-ts:1.1
timestamp
xsd:dateTimeStamp
batchIdentifier
samm-c:Text
furnaceIdentifier
samm-c:Text
so2Concentration
samm-c:Measurement
, 单位 unit:percent
(二氧化硫体积浓度)o2Concentration
samm-c:Measurement
, 单位 unit:percent
(氧气体积浓度)coConcentration
samm-c:Measurement
, 单位 unit:ppm
(一氧化碳体积浓度)4、批次总结数据建模实例:
AnodeFurnace_BatchSummary
urn:com:example:copper-smelter:aspect:anode-furnace-batch-summary:2.0
batchIdentifier
samm-c:Text
(主键)furnaceIdentifier
samm-c:Text
startTime
xsd:dateTimeStamp
(批次开始时间)endTime
xsd:dateTimeStamp
(批次结束时间)totalOxidationDuration
samm-c:Measurement
, 单位 unit:minute
(总氧化时长)totalReductionDuration
samm-c:Measurement
, 单位 unit:minute
(总还原时长)tappingWeight
samm-c:Measurement
, 单位 unit:tonne
(出铜重量)tappingTemperature
samm-c:Measurement
, 单位 unit:degreeCelsius
(出铜温度)finalCopperPurity
samm-c:Measurement
, 单位 unit:percent
(最终铜纯度)oxygenContentPostRed
samm-c:Measurement
, 单位 unit:ppm
(还原末期氧含量)finalSulfurContentPPM
samm-c:Measurement
, 单位 unit:ppm
(最终硫含量)三、 标准推行:保障过程数据持续、准确积累的机制
定义了标准语义模型,还需要将这套“共同语言”融入到日常的数据产生、流转和使用的实践中,从而确保持续、准确地积累高质量过程数据资产。这需要将语义标准转化为具体的行动规范:
1、指导数据源头采集与配置:
2、规范数据接入与及时校验:
3、实现 AI 就绪的数据资产聚合:
假设要训练一个预测阳极铜含氧量的 AI 模型,需要关联还原阶段的时序数据 (AnodeFurnace_ReductionPhase_TimeSeries
) 和最终的批次结果 (AnodeFurnace_BatchSummary
)。通过共享的 batchIdentifier
以及各变量清晰的语义定义(尤其是 oxygenContentPostRed
的 ppm 单位),可以轻松、准确地构建出包含数千甚至数万个批次的高质量训练数据集。模型开发者无需再担心因数据含义不清或单位混淆而引入噪声。
四、 总结
“统一语义建模框架”是构建可信工业过程数据资产的有效方法,通过为每一类过程数据(无论是高频时间序列还是批次总结信息)赋予精确、一致、机器可读的语义定义,并将其融入数据产生、流转、使用的全过程实践中,该框架能够:
只有解决了工业过程数据在长期、分散、动态采集过程中的持续准确性、一致性和可解释性,构建起真正可信赖、AI友好的核心数据资产,才能为后续工业人工智能的发展打下关键基础。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-10-14
2024-10-09
2024-06-20
2025-02-04
2024-06-14
2024-06-16
2024-06-14
2025-02-09
2024-05-31
2024-07-24