容错:钢厂制造执行系统的基石设备硬件
MES系统可以在统一平台上集成诸如生产调度(计划排产)、产品(生产)跟踪、质量控制、设备管理、网络报表等管理功能,使用统一的数据库和通过网络联接可以同时为生产部门、质检部门、工艺部门、物流部门(包括管理原料、成品的入和出)等提供厂级(车间)管理信息服务。对上能够汇总ERP所需要的数据和信息,对下可以将生产任务分解并传递可以执行的信息给自动化设备进行生产,并实时跟踪和采集生产过程数据。
MES系统包括16个主要功能模块:计划排产(SM_PP)、技术标准管理(SM_TS)、质量管理(SM_QM)、生产状态监视(SM_DM)、生产过程跟踪(SM_PT)、生产实绩收集(SM_DA)、生产异常记录(SM—AR)、原材料管理(SM_RM)、能源介质管理(SM_EM)、产品管理(SM_PM)、副产品管理(SM_BPM)、生产设备管理(SM_FM)、备品备件管理(SM_SP)、数据查询和分析(SM_SA)、报表打印(SM_RP)、数据通信(SM_DC)。由此不难看出,MES系统负责生产管理及计划执行等工作,一旦MES系统宕机就会导致停产,造成无法估量的损失。
MES系统对可靠性的要求达到99.999%,也就是5个9 的水平。目前只有容错服务器方案可以满足需求,如果采用双机方案,其可靠性只有99.9%,也就是3个9的水平。通过深入分析比较,某钢铁厂最终决定采用了美国Stratus的ftServer4500。其中数据库服务器(ftServer 4500)配置Redhat Enterprise Linux 5.4(64bit)操作系统,主流的Oracle 11g企业级数据库软件及PSI Integration相关中间件。而实时数据库服务器(ftServer 4500)采用MS Windows Server 2003系统和Wonderware InSQL数据库软件及工厂智能平台软件。
谈到容错方案,技术人员表示,容错系统可靠性达到99.999+%,其电源、CPU、内存、I/O控制单元、主机母版等组件均具有冗余保护,其独有的硬件锁步(Lock-Step)技术,可以有效防止CPU/MEM集成产生故障的可能性。因为它具有故障主动检测、隔离和恢复功能。因此,所有关键部件如CPU/MEM、IO设备、电源甚至主板出现故障时,均可不停机进行更换,硬件错误导致的非计划停机时间控制在每年1分钟以内。
美国Stratus公司所提供的ftSSS远程监控系统服务是技术人员看好的另外一个特性。通过全球主动服务网络ASN的接入,Stratus 24/7对ftServer的硬件参数进行监控,可以及时发现潜在的问题。不待故障发作,消除问题于无形。用户可以根据情况选择是否采用远程监控系统服务。