T/BFIA 038-2024 金融分布式系统 参考架构 ,该文件为pdf格式 ,请用户放心下载!
尊敬的用户你们好,你们的支持是我们前进的动力,网站收集的文件并免费分享都是不容易,如果你觉得本站不错的话,可以收藏并分享给你周围的朋友。
如果你觉得网站不错,找不到本网站,可以百度、360搜搜,搜狗, 神马搜索关键词“文档天下”,就可以找到本网站。也可以保存到浏览器书签里。
收费文件即表明收集不易,也是你们支持,信任本网站的理由!真心非常感谢大家一直以来的理解和支持!
CCS A 11
团体标准
T/BFIA 038—2024
金融分布式系统参考架构
Financial standard specification of distributed system—Referencearchitecture
2024 - 11 - 29 发布2024 - 11 - 29 实施
北京金融科技产业联盟 发布
目 次
前言.................................................................................. II
引言................................................................................. III
1 范围................................................................................. 1
2 规范性引用文件....................................................................... 1
3 术语和定义........................................................................... 1
4 缩略语............................................................................... 1
5 总体架构............................................................................. 2
6 基础设施方案......................................................................... 3
7 技术平台方案......................................................................... 3
8 金融应用方案........................................................................ 5
9 安全保障方案........................................................................ 7
10 运维管理方案........................................................................ 8
T/BFIA 038—2024
II
前 言
本文件按照GB/T 1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由北京金融科技产业联盟归口。
本文件起草单位:中国金融电子化集团有限公司、北京金安信息技术有限责任公司、中国建设银行
股份有限公司、建信金融科技有限责任公司、中国工商银行股份有限公司、中国农业银行股份有限公司、
中国银行股份有限公司、招商银行股份有限公司、平安银行股份有限公司、华为技术有限公司、蚂蚁科
技集团股份有限公司、腾讯云计算(北京)有限责任公司、中电金信数字科技集团有限公司、安超云软
件有限公司、新华三技术有限公司。
本文件主要起草人:姜云兵、班廷伦、马国照、韩竺吾、李晨晓、金磐石、张正园、杨永、隋宁宁、
王方、唐成山、丁陈飞、卞嘉骏、王炳辉、夏龙飞、施经纬、刘琼、王磊、张煌辉、李祥熙、张美庆、
刘艳明、金艳、杨进、潘振禹、胡晓磊、郭智慧、蒋增增、李克鹏、骆君柱、刘昕、范广、隋成龙、许
刚、高云超、李培。
T/BFIA 038—2024
III
引 言
近年来随着科技与金融加速融合,金融业务模式逐步朝着线上化和多样化的方向发展,分布式架构
具备高效弹性、开放灵活等特性,可有效适应业务的快速调整和市场的快速变化,为金融信息系统的发
展筑牢基石。
金融业IT系统分布式架构转型提升了应用系统海量交易高并发和海量数据处理的整体性能,保证了
金融应用系统的可用性,分布式架构是未来金融业IT系统架构的重要架构形式。当前,仍存在较多的金
融业IT系统运行于集中式架构之上,IT系统整体进行分布式架构转型还面临着业务连续性要求高、海量
遗留系统改造难、海量应用管理难、缺少行业级架构设计标准指导以及潜在技术安全风险等共性问题,
随着金融行业数字化转型的深入,这些问题将影响金融机构数字化转型质量与进程。
为帮助和引导金融机构快速构建自身的分布式架构支撑体系,推动金融行业应用系统的整体分布式
架构转型,提升各金融机构分布式架构转型的质量和效率,降低实施成本,特编制金融分布式系统系列
标准。
本文件是金融分布式系统系列标准之一,金融分布式系统系列标准包括:
——《金融分布式系统术语》。目的在于给出本标准系列中所使用的专业名词,是其余各部分阅
读和应用的基础。
——《金融分布式系统IT治理指引》。目的在于给出金融机构分布式架构转型后IT治理能力建设
原则、流程管理、技术要求、技术支撑体系等方面的要求,以指导金融业分布式架构转型的IT治理能力
建设,形成贯穿研发、运维、管理各领域的立体式的深度治理体系。
——《金融分布式系统参考架构》。目的在于给出金融业IT系统分布式架构设计参考,确立金融
业IT系统分布式架构的核心模块、组件以及整体结构,阐明分布式系统架构下各模块和组件的主要功能
以及相互间关系。
——《金融分布式系统应用设计原则》。目的在于给出金融应用微服务改造设计的总体要求,阐
明微服务设计、单元化设计、一致性方案设计、并行验证设计以及正确性验证等通用要求。
——《金融分布式系统技术平台能力要求》。目的在于给出金融应用运行时所需关键技术平台能
力的总体要求,阐明软负载、微服务、分布式事务、分布式消息、分布式数据库、分布式缓存以及批量
调度等领域的通用要求和安全扩展要求。
——《金融分布式系统应用开发测试原则》。目的在于给出分布式架构下金融应用开发与测试相
关要求,阐明分布式应用软件开发规范、工具方法与测试要求、内容、方法、过程、环境、文档、工具
以及管理的通用要求,保障金融分布式应用的研发质量,更好满足用户需求。
——《金融分布式系统运维能力要求》。目的在于给出金融应用运维时所需关键支撑能力的总体
要求,阐明金融应用部署、监控、故障定位与分析、运行保护等领域的通用要求。
T/BFIA 038—2024
1
金融分布式系统参考架构
1 范围
本文件给出了金融分布式系统参考架构说明,包括总体架构、基础设施方案、技术平台方案、金融
应用方案、安全保障方案、运维管理方案等内容。
本文件适用于金融机构IT 系统分布式架构的规划、设计、建设和维护。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T 34982—2017 云计算数据中心基本要求
GB/T 36618—2018 信息安全技术金融信息服务安全规范
JR/T 0166—2020 云计算技术金融应用规范技术架构
JR/T 0167—2020 云计算技术金融应用规范安全技术要求
JR/T 0168—2020 云计算技术金融应用规范容灾
JR/T 0203—2020 分布式数据库技术金融应用规范技术架构
JR/T 0204—2020 分布式数据库技术金融应用规范安全技术要求
JR/T 0205—2020 分布式数据库技术金融应用规范灾难恢复要求
JR/T 0223—2021 金融数据安全数据生命周期安全规范
T/BFIA 037-2024 金融分布式系统术语
T/BFIA 040-2024 金融分布式系统技术平台能力要求
T/BFIA 041-2024 金融分布式系统运维能力要求
3 术语和定义
T/BFIA 037-2024 中界定的术语和定义适用于本文件。
4 缩略语
下列缩略语适用于本文件。
API:应用程序编程接口(Application Programming Interface)
ATM:自动取款机(Automated Teller Machine)
POS:销售终端(Point of Sale)
RPO:恢复点目标(Recovery Point Objective)
RTO:恢复时间目标(Recovery Time Objective)
STM:智慧柜员机(Smart Teller Machine)
T/BFIA 038—2024
2
5 总体架构
5.1 概述
基于云计算设计理念,结合金融行业当前平台化基础设施、技术能力以及应用研发现状模式,在分
布式架构下金融IT 系统主要组成部分将按照平台化、服务化、组件化的形式进行设计,本文件将金融
分布式系统架构分为金融应用层、技术平台层、基础设施层、安全保障与运维管理五个主要组成部分。
金融分布式平台总体架构见图1。
注:虚线框内为可选。
图1 金融分布式平台总体架构
5.2 基础设施
基础设施是金融分布式系统运行所需软硬件资源供给方,为金融应用系统提供计算、存储、网络等
基础IT 硬件资源,并提供配套的基础软件服务。
5.3 技术平台
技术平台是为金融分布式系统提供分布式架构运行支撑的平台服务,为金融应用服务提供所需的技
术组件、通用分布式中间件以及服务管理等通用基础技术能力服务,解耦金融应用系统与底层技术,屏
蔽底层技术升级或替换对金融应用的影响。
其中,结合当前云计算发展趋势,技术平台使用的资源可以是经过虚拟化的虚拟资源,如容器化资
源。
5.4 金融应用
金融应用是为金融用户提供金融业务接入、处理、响应等主要处理逻辑的硬件设备及软件程序集合,
T/BFIA 038—2024
3
是金融核心业务功能的软硬件实现。
5.5 安全保障
安全保障主要提供金融应用系统安全、技术平台安全、基础设施安全、安全管理等能力。
5.6 运维管理
运维管理主要提供部署管理、监控告警、灾备管理、多活管理、故障应急、合规审计、系统维护等
能力。
6 基础设施方案
6.1 概述
基础设施提供安全稳定、高效易用以及绿色节能的资源型服务,一般由服务器、专业存储系统、网
络设备、终端设备等构成,通过存储虚拟化、软件定义或云计算化的方式对资源实现池化、虚拟化、容
器化的管理。
6.2 基础设施层
基础设施层是以平台化、服务化的方式为用户提供资源池服务以及其他软硬件服务,包括但不限于
虚拟机服务、物理机服务、容器服务、存储服务、负载均衡服务、虚拟网络服务、网络连接服务、域名
服务,除了应满足JR/T 0166—2020第6章和第7章以及JR/T 0203—2020第6章和第7章所要求的内容之外,
还需考虑的因素包括以下内容:
a) 应提供管理API,供技术平台调用;
b) 应具备运行在不同芯片架构宿主机的能力;
c) 宜具备多机房部署能力。
金融分布式架构基础设施核心模块见图2。
图2 金融分布式架构基础设施核心模块
7 技术平台方案
7.1 概述
技术平台主要由统一接入服务、核心技术服务、数据服务等关键服务组成,其中统一接入服务包括
但不限于负载均衡、服务配置、认证鉴权、灵活发布,核心技术服务包括但不限于运行支撑、批量处理、
分布式中间件、外部联通,数据服务包括但不限于数据库、分布式文件、对象、块、分布式缓存、数据
T/BFIA 038—2024
4
同步与迁移。技术平台应支持分布式架构和微服务架构运行所需的基础功能,保障平台的可用性、安全
性、可靠性、高性能、可扩展性以及可维护性。金融分布式架构技术平台核心模块见图3。
注:虚线框内为已具备的能力。
图3 金融分布式架构技术平台核心模块
7.2 统一接入
统一接入服务是技术平台的网络流量的统一接入与接出的接口,也是技术平台与金融应用服务层进
行信息交互的中介,负责对进入技术平台的网络流量的处理、控制与管理,具体内容如下:
a) 应支持负载均衡能力,支持网络传输层和应用层负载均衡,支持不同协议、不同类型的负载均
衡策略;
b) 应支持服务配置管理,服务配置发布和配置回滚;
c) 应支持认证鉴权,对接入的请求进行安全校验或者进行安全相关的处理;
d) 应支持对接入服务进行灵活发布,如蓝绿发布、灰度发布、分组发布等;
e) 应保证统一接入层高可用性,避免出现单点故障;
f) 应支持国密算法加解密相关要求,包括算法支持、密钥管理、加解密接口、合规认证、安全监
控和日志等;
g) 宜支持通过插件方式对统一接入层的功能进行动态配置扩展;
h) 统一接入层宜设计为无状态服务,支持根据请求负载对统一接入层扩缩容,避免成为性能瓶颈。
7.3 服务集成
服务集成服务为金融分布式应用系统提供分布式架构核心技术支撑服务能力,是微服务技术栈核心
技术组件的集合,主要提供联机交易、批量调度、外部联通、分布式中间件等重要技术支撑能力,具体
内容如下:
a) 应支持联机交易运行支撑服务,具备对联机交易请求的实时响应、事务管理、服务运行时、服
务治理、服务注册、服务发现等微服务支持能力;
b) 应支持分布式批量调度支撑服务,除了应具备T/BFIA 040-2024 所要求的内容之外,还应具备
不同编程语言任务类型的调度能力;
c) 应支持业务运行支撑所需要的分布式中间件服务,如Web 中间件、消息、文件传输、分布式序
列号、工作流引擎、分布式协调器等;
T/BFIA 038—2024
5
d) 应支持外联支撑服务,为金融机构内部系统与外部系统间进行网络通信及数据信息交换提供,
是金融机构间、金融机构与监管部门、金融机构与外部机构进行信息交换的载体。应具备信息
交换、异构报文转换、复杂数据处理等能力。
7.4 数据处理
数据处理服务为金融分布式应用提供多种类型的数据存储服务以及配套的同步迁移工具,具体内容
如下:
a) 应提供分布式数据库服务,分布式数据库提供分布式架构下关系型和非关系型数据存储能力,
应具备JR/T 0203—2020 第7 章所要求的内容;
b) 应提供分布式持久化存储服务,如文件存储服务、对象存储服务、块存储服务;
c) 应提供分布式缓存服务,应符合T/BFIA 040-2024 中的相关要求;
d) 应提供数据同步与迁移服务,支持多数据源之间的多维度数据对象的同步、迁移和比对;
e) 应具备分布式批量任务处理服务,支持按照服务集成层批量调度策略进行批量处理任务的执
行。
7.5 虚拟资源管理
虚拟资源管理服务通过虚拟化以及软件定义技术将底层硬件设备资源进行池化与服务化供给,支持
多租户按需获取相应资源,并可根据资源实际使用情况对资源池内资源进行统一编排和管理以提升资源
使用效率,资源管理服务主要包括计算资源池、网络资源池、存储资源池以及资源池编排与调度管理服
务,其在多租户环境、动态资源需求、高效资源利用、复杂资源管理和灵活扩展等场景是必须选择的,
具体内容如下:
a) 计算资源池是将计算设备进行逻辑抽象和集中管理形成的资源池,应满足GB/T 34982—2017
中5.2.1 和JR/T 0166—2020 中7.3.2 的相关要求;
b) 网络资源池是将网络设备进行逻辑抽象和集中管理形成的资源池,应满足GB/T 34982—2017
中5.2.2 和JR/T 0166—2020 中7.3.4 的相关要求;
c) 存储资源池是将存储设备及存储系统进行逻辑抽象和集中管理形成的资源池,应满足GB/T
34982—2017 中5.2.3 和JR/T 0166—2020 中7.3.3 的相关要求。
d) 宜具备按照预定策略对计算资源池内资源进行编排和调度管理能力;
e) 宜具备按照预定策略对存储资源池内资源进行编排和调度管理能力;
f) 宜支持资源池编排元数据管理服务,具备可视化的资源池编排与管理能力。
8 金融应用方案
8.1 概述
金融应用按照对金融应用服务的模块化、层次化架构设计包括客户渠道层、金融应用层及业务基础
层。金融应用系统应保证金融应用业务功能满足业务运营需求,非功能指标符合企业自身、行业及国家
对信息系统的要求。金融分布式架构金融应用核心模块见图4。
T/BFIA 038—2024
6
图4 金融分布式架构金融应用核心模块
8.2 客户渠道层
客户渠道层是金融应用系统与外部金融服务用户交互的接口,负责接入金融用户业务请求并对请求
进行响应,具体内容如下:
a) 应支持通过互联网渠道技术进行金融服务的接入,如常用手机银行、电子银行、网上银行、电
子支付等渠道;
b) 应支持通过柜面渠道技术进行金融服务的接入;
c) 应支持通过终端设备渠道技术进行金融服务的接入,如ATM、STM、POS 等设备;
d) 应支持开放平台进行金融服务和运营管理服务的接入;
e) 应支持其他渠道进行金融服务的接入,如同业渠道、生态渠道、监管渠道等;
f) 各渠道宜采用统一入口及标准实现统一接入,并设置相关识别标识进行渠道类型识别。
8.3 金融应用层
金融应用层是金融机构业务活动的代码逻辑实现与服务化供给,是金融分布式应用系统的主要业务
逻辑,应在保障系统架构特性的基础上重点关注业务核心功能需求,具体内容如下:
a) 应提供联机交易类应用,支持实时或近实时的业务处理,主要包括流水型、账户型、计算型和
查询型应用;
b) 应支持批量处理类应用,支持在非高峰时段执行数据整合、分析和报告生成等任务,如日切、
数据汇总分析、业务自动化等服务;
c) 应支持办公管理类应用,办公系统是金融机构进行组织管理,提升组织办公效率,实施机构信
息化建设的重要组成部分,承接了金融机构日常行政业务流程,如人力资源管理系统、财务管
理系统、客户关系管理系统、电子邮件系统等;
d) 应提供其他类应用,承接金融机构中部分关键业务功能,且对于短时间中断具有一定容忍度,
如市场营销系统、广告推广系统、消息中间件、API 网关、客服系统等。
8.4 业务基础层
业务基础层为金融应用服务提供业务逻辑处理所需基础信息与业务管理应用服务,具体内容如下:
a) 应提供数据类基础服务,并保证相关数据的完整性与安全性,信息采集、传输、处理、存储等
过程中不得出现信息未授权使用、无故丢失或随意篡改等,如客户信息、卡片信息等服务;
T/BFIA 038—2024
7
b) 应提供配置类基础服务,按照平台化、服务化统一设计,避免多系统对同一系统信息及数据进
行维护、操作与管理,如参数管理服务;
c) 应提供管理类基础服务,并保证相关信息的一致性,信息多副本存储时需按照不同业务需求保
证信息的一致性,如定价管理、合约管理等服务;
d) 提供其他类型基础服务,并保证相关基础应用服务的高可用性,避免出现单点故障而导致整体
服务不可用。金融应用系统的RPO、RTO 指标应满足JR/T 0168—2020 中5.3 的相关要求,金
融数据库系统的RPO、RTO 指标应满足JR/T 0205—2020 中6.3 的相关要求。
9 安全保障方案
9.1 概述
安全保障应从系统、软件、数据、网络、资金安全等维度为金融应用、技术平台、基础设施以及运
维管理提供全面安全保护,主要包括应用系统安全、技术平台安全、基础设施安全以及安全管理。金融
分布式架构安全保障核心模块见图5。
图5 金融分布式架构安全保障核心模块
9.2 应用系统安全
应用系统安全负责提供应用、金融业务活动和数据的安全能力,具体内容如下:
a) 应具备应用安全能力,对于应用之间的访问提供认证鉴权、黑白名单等安全控制能力;
b) 应针对应用运行环境提供相应措施以防范各类安全攻击;
c) 应定期进行漏洞扫描和风险评估,对存在风险的应用运行环境进行督促整改;
d) 应确保交易和结算等金融业务活动的过程安全,确保数据传输和存储的安全;
e) 应具备数据的全生命周期安全管理能力,涵盖从数据生产、传输、存储、访问、迁移、销毁、
备份等各个阶段都进行安全管理,应符合JR/T 0223—2021 第7 章至9 章和JR/T 0167—2020
第9 章的相关要求。
9.3 技术平台安全
T/BFIA 038—2024
8
技术平台安全负责提供金融业务应用在使用分布式中间件和数据库等软件时应遵循的安全机制,具
体内容如下:
a) 应部署访问控制策略,实现客户端与分布式中间件软件、分布式中间件软件多个实例、分布式
中间件软件与基础软件之间的安全访问控制;
b) 应对管理员访问分布式中间件管理网络进行访问控制;
c) 应实时监控分布式中间件软件远程管理的访问,并支持对未授权管理连接的处置;
d) 应对远程执行特权命令进行限制;
e) 应禁止管理端口或者管理API 向互联网开放;
f) 应记录分布式中间件运行状况、管理员用户行为等日志;
g) 数据库安全涵盖基础支撑保障、用户管理、访问控制、数据安全、监控预警、密钥管理、安全
管理和安全审计等内容,应支持金融数据库应用满足JR/T 0204—2020 中第6 章、第7 章、第
8 章、第9 章、第10 章、第11 章a)、第12 章、第13 章的相关要求。
9.4 基础设施安全
基础设施安全包括计算、网络、存储、设备等基础设施领域的软硬件安全,具体内容如下:
a) 计算安全既包括物理机、虚拟机、容器等自身安全,也包括保障物理机、虚拟机、容器安全的
产品、功能和服务的安全要求,使用者应经过授权获得计算资源和控制权。计算安全应满足
JR/T 0167—2020 中7.4 的相关要求;
b) 网络安全包括针对网络资源配置和运营的安全要求,也包括对保障网络安全的安全产品、功能
或服务的安全要求,使用者应经过授权获得网络资源和控制权。网络安全应满足GB/T 36618
—2018 和JR/T 0167—2020 中7.2 的相关要求;
c) 存储安全包括对存储资源配置和运营的安全要求,也包括对保障存储安全的安全产品、功能或
服务的安全要求,使用者应经过授权获得存储资源和控制权。存储安全应满足JR/T 0167—2020
中7.3 和GB/T 20988—2007 中第6 章的相关要求;
d) 金融机构通过各种设备为用户提供金融服务。设备安全应满足JR/T 0167—2020 中6.3 所要求
的内容。
9.5 安全管理
安全管理是指在接入处理层针对请求的流量进行安全校验或者进行安全相关的处理,具体内容如
下:
a) 金融分布式系统身份和权限管理应满足JR/T 0167—2020中10.1所要求的内容;
b) 金融分布式系统审计管理应满足JR/T 0167—2020中10.4所要求的内容;
c) 金融分布式系统风险管理应满足JR/T 0167—2020中10.6所要求的内容。
d) 应支持在服务路由粒度配置加解密功能,对流量进行解密处理和加密转发;
e) 应支持在服务路由粒度配置是否启用安全认证,对非法的流量进行拦截;
f) 应支持通过插件方式动态配置安全相关功能的启用和停用;
g) 应支持国密算法加解密;
h) 宜支持可视化方式管理安全认证,支持新增、修改和删除。
10 运维管理方案
10.1 概述
T/BFIA 038—2024
9
在集中式架构下,IT 运维管理包含应用管理、技术服务管理、资源资产管理、设备管理、信息安
全管理、合规审计管理、目录与内容管理、日常管理等。针对分布式架构,IT 运维管理需在部署管理、
监控管理、故障管理、资源弹性管理、灾备多活管理、数据信息管理等方面进行针对性能力建设。金融
分布式架构运维管理核心模块见图6。
图6 金融分布式架构运维管理核心模块
10.2 部署管理
部署管理需支持多环境、多种版本、多种部署策略的灵活持续部署与管理,具体内容如下:
a) 应具备多环境部署能力,支持在物理机、虚拟机、容器等环境进行软件部署;
b) 应具备多版本部署能力,支持不同环境中相同版本部署以及相同环境中不同版本部署;
c) 应具备多部署发布与升级更新策略能力,支持灰度发布、蓝绿发布、滚动升级等;
d) 应具备跨机房部署能力,支持在同城/异地多数据中心跨机房部署;
e) 应具备部署失败重试与回退能力,支持部署失败后回退至默认/指定版本或者部署失败后进行
特定次数的重试;
f) 应具备部署配置能力,支持软件源、软件版本、部署环境、部署策略、部署失败处理策略等的
统一配置;
g) 应具备部署验证能力,支持部署有效性验证、功能性、非功能性验证等;
h) 应具备部署后评估能力,支持对部署过程进行全生命周期的度量分析智能评估;
i) 应具备部署风险管控能力,支持部署风险评估与应急处置;
j) 应具备人工部署能力,支持全流程人工部署,以及自动化部署的人工接入。
k) 宜具备持续部署能力,支持持续将代码变更自动部署到指定环境中;
l) 宜具备多活部署能力,支持同城/异地跨数据中心的应用多实例正常部署与运行;
m) 宜具备自动化部署能力,支持按照部署配置进行软件自动化部署。
具体能力要求见T/BFIA 041-2024。
10.3 监控管理
监控管理需支持对分布式架构下软硬件运行情况监控,为系统故障处置和运维决策提供支撑,具体
内容如下:
a) 应具备分布式环境下多日志源、多采集方式、多日志格式、多文件类型、多存储方式的日志全
生命周期处理能力;
b) 应具备统一监控数据采集、上报、处理、分析能力,支持跨数据中心、跨地域软硬件运行数据
统一监控管理;
c) 应具备监控数据高可用能力,支持监控数据多副本存储或数据恢复;
d) 应具备监控应用/系统间调用关系链路跟踪、定制化分析与查询以及可视化展示能力,支持调
用关系生成与查询、链路负载分析、链路流量分析等;
T/BFIA 038—2024
10
e) 应具备监控与应用运行解耦能力,支持监控失效不影响应用正常运行,支持日志和链路跟踪数
据异步处理;
f) 宜具备监控指标自定义管理,支持用户配置自定义的监控指标阈值和告警策略,在业务出现异
常时及时通知用户介入处理;
g) 宜支持应用/系统内各分布式模块间的监控,如系统内部应用调用、应用访问数据库、缓存等。
具体能力要求见T/BFIA 041-2024。
10.4 故障管理
故障管理需支持系统运行情况的健康检查、故障定位、故障诊断、故障快照、故障告警、故障处置
等,具体内容如下:
a) 应具备对系统中软件服务进行健康状态检查的能力,支持定期心跳、调用时检查等方式(具体
见T/BFIA 041-2024中关于软负载均衡要求);
b) 应具备系统故障快速定位能力,支持服务停止、服务响应能力下降、服务指标异常等软硬件故
障定位;
c) 应具备系统故障快速诊断能力,支持软硬件故障原因分析、根因查找等;
d) 应具备系统故障快照能力,支持故障现场信息保存、恢复、日志记录等;
e) 应具备系统故障告警能力,支持故障事件邮件、短信等多渠道通知;
f) 应具备系统巡检能力,支持常规和定制化系统巡检;
g) 宜具备系统故障快速处置能力,支持故障隔离、故障恢复、故障迁移等;
h) 宜具备故障管理自动化能力,支持自动化故障定位、诊断、快照、告警和处置的自动化;
i) 宜具备故障可视化能力,支持故障信息通过图形化等易理解方式展示。
具体能力要求见T/BFIA 041-2024。
10.5 容量管理
容量管理需支持系统运行期间系统存储容量、计算资源容量、网络带宽容量、应用与系统性能容量
等进行监控与管理,具体内容如下:
a) 应具备对系统中磁盘、数据库、文件系统、分布式存储系统等存储相关容量的监控与管理;
b) 应具备对系统中计算设备CPU、内存和I/O设备等计算资源相关容量的监控与管理;
c) 应具备对系统中网络带宽、网络设备状态相关网络容量的监控与管理;
d) 应具备对系统中应用系统及操作系统负载、响应时间等应用系统相关处理能力的监控与管理。
具体能力要求见T/BFIA 041-2024。
10.6 资源弹性管理
资源弹性管理需支持根据业务量和系统运行需求动态调整计算、存储、网络等资源使用量,具体内
容如下:
a) 应具备资源弹性调度能力,支持应用服务的灵活迁移;
b) 宜具备资源弹性伸缩能力,支持计算、存储、网络等基础设施资源的弹性供给;
c) 宜具备基于容器技术的资源虚拟化管理能力,支持容器资源管理。
具体能力要求见T/BFIA 041-2024。
10.7 灾备多活管理
灾备多活管理需支持应用系统、技术服务、基础设施资源、数据等的高可用,具体内容如下:
a) 应具备应用服务、基础技术服务和数据的灾备能力,支持应用和数据的灾难备份以及恢复;
T/BFIA 038—2024
11
b) 应具备基础设施的灾备能力,支持服务器、网络、存储等硬件设备的灾难备份以及恢复;
c) 应具备同城灾备、异地灾备能力,支持同城与跨地域灾备;
d) 应具备异地数据同步能力,支持跨地域数据在秒级内完成同步;
e) 应具备灾备部署管理能力,支持部署检查、资源管理、容灾监控等;
f) 应具备同城多活部署能力,支持同城数据中心的多活部署;
g) 应具备多活灵活切换能力,支持定制化业务流量切换;
h) 应具备常规故障演练能力,支持各种软硬件故障的常规演练;
i) 应支持人工灾备多活管理能力,支持全流程人工介入;
j) 宜具备异地多活部署能力,支持跨地域多数据中心的多活部署;
k) 宜具备混沌工程实施能力,支持通过混沌测试进行非常规故障模拟演练、故障模式分析以及应
急预案升级;
l) 宜具备自动化灾备多活管理能力,支持定制化、自动化管理;
m) 宜具备按需灵活灾备支持能力,支持按系统重要等级进行灵活的灾备部署、切换、管理等能力。
10.8 数据信息管理
数据信息管理需支持分布式架构IT 系统中业务数据和系统数据的统一存储、备份、处理等,具体
内容如下:
a) 应具备业务数据和系统数据的统一高可用存储能力,支持数据多副本、一致性、高可靠存储;
b) 应具备业务数据和系统数据的统一备份能力,支持数据的灾难恢复;
c) 应具备业务数据和系统数据的多类型处理能力,支持数据的高性能查询、分析、展示等;
d) 应具备业务数据和系统数据的安全性保证能力,支持数据的安全存储、传输、使用等;
e) 应具备数据多方式存储,支持块数据、文件数据、对象数据、数据库等的集中式存储和分布式
存储。
评论