中央电视台核心数据库承载着中央电视台所有关键业务的数据平台支撑工作,是cctv it运维业务中关键的关键,所有的关键业务数据都在此平台上面运行。如果核心数据库平台出现任何闪失,都会严重影响中央电视台的正常业务工作,甚至包括电视台节目的正常播出。
以前,承担核心数据库数据存储业务的设备是一台hp va7400,经过多年的运行,此设备已经严重老化,每月都会发生设备硬件故障问题,频发的故障已经成为了it运维工作中最大的技术隐患,严重影响了核心数据库提供服务的可靠性和连续性。为此,台内采购了一台hp eva 4100存储设备作为数据存储平台的替换产品。此次存储平台迁移涵盖的各类型it硬件设备二十余台,包括:高端服务器,光纤交换机,专业存储等;此项目影响了十几家it公司运维的数个it应用系统,包括:行政办公,节目生产,技术资源,sata系统,人事系统,财务系统等;同时,项目涉及多个it专业厂商的软件产品,例如,ibm websphere,ibm wbi,ibm portal,bea weblogic等,他们都会因为核心数据库平台的变化进行相应修正。此次项目影响之广,涉及范围之大在台内it系统中前所未有。
这次存储平台整体迁移涉及的技术架构和具体实现内容也是复杂多样。新数据库平台延续了老平台的rac data guard的高可用性+冗灾构架,但是,伴随存储平台的更换和数据库版本的升级,技术上面还是出现了很多新情况和新变化。rac(real application cluster)是一种在集群的环境下实现共享的一种数据库存储形式,适合于商用的7x24服务。data guard主要的功能是冗灾,根据配置的不同,data guard还可以具备以下特点:高可用、性能提升、数据保护以及故障恢复等。但是,这两种技术在国内很少结合使用,原因是技术复杂性高,成功实施风险大。
项目组准备采用的rac data guard构架是建立在oracle 数据库10g版本之上的。oracle 10g与之前的oracle 9i在此rac构架的具体实现上面有很多不同,包括rac的底层实现机制也发生了改变,并且10g平台增加了很多新的技术功能和操作要求。例如,oracle 9i中,rac=ha oracle,ha(high availability 高可用性)功能采用操作系统自身的cluster软件来实现;oracle 10g中,rac=crs oracle,ha由oracle自己的crs服务来实现,crs现在就是oracle 10g 的ha软件,它跟oracle数据库一起组成rac。所以说,9i rac与10g rac两者的实现基础已经发生了根本性变化。并且,oracle 10g增加了vip资源的概念,这个vip服务可以实现地址的漂移,如果某个节点出现宕机问题,对于终端用户感觉好像没有什么变化,服务可以进行自动的切换,实现数据库服务对用户的透明化。但是,正是这个新增加的vip功能等于是在rac的构架上面又新增加了一个服务层次,这就大大增加了技术的复杂度,也增加了成功实施的难度。还有一个变化是以前的数据库存储平台共享数据方式采用的是裸分区模式,现在采用的是基于sun qfs文件系统的san数据共享2024澳门精准正版的解决方案。sun qfs是一个独立的文件系统,克服了unix和其他商业文件系统的缺点。它不仅具备了san可靠性高,连接带宽大,易于扩展的优点,还结合了nas系统可以实现文件共享的特点。但是,至今为止,在国内还没有哪家公司有过在sun qfs文件系统上面成功实施oracle 10g rac data guard构架的案例,国外的oracle数据库项目中也很少用到这种新型架构,能够参阅的资料很少,甚至是oracle原厂的数据库专家也很少有人有相关经验。而且,还有一个技术细节是主数据库rac和从数据库data guard的文件系统采用了异构方式,一方是qfs文件系统,另一方是传统的nfs文件系统,两方文件系统的差异性,也需要工程师进行技术验证。
此次数据库由oracle 9i升级为oracle 10g,因为两者之间的版本差异较大,对于前端的应用系统还是有很大影响的。核心数据库为台内几十个应用系统提供数据服务,这些应用系统各有各的特点,大部分应用系统的程序都是基于oracle 9i版本进行的应用开发,在程序与数据库的结合过程中,针对9i数据库和应用各自的特点,为了最大程度发挥数据库的性能和应用的效率,同时,也是为了更好的结合他们两者的优势,在系统运行过程中,各个系统都针对自身的特点作了大量的个性化操作,这些个性化操作提高了系统的效率,但是,同时也提升了数据库和应用结合的技术紧密性和复杂性。
这个项目在时间安排上面也可以说是工期紧,任务重。短短的两个月内,项目组人员需要完成的主要任务包括:架构平台的测试,各个应用系统的测试,数据库新版本的测试,原有数据库平台的各类数据库对象整理,过渡平台的搭建,最终平台的搭建,原有设备的复用添加,新平台的试运行等工作内容。并且,此项目是高端技术密集型项目,只有相关领域的专家才能掌控此项目,工程师必须具备高端存储,数据库,操作系统,中间件平台,应用开发等多方面的专业知识。
在项目实施过程中,针对工作的特点和难点,我方的项目团队进行了详尽的前期规划,明确了项目方针和详细的工作安排。在项目执行的过程中,抽调技术骨干,在台内相关部门的协调下,各方加强沟通,密切监控项目的发展情况,随时作出调整,针对各种风险事先制定相应的应对计划,避免平台的迁移造成关键业务的中断。经过各方的努力协作,新构架下的数据库平台顺利迁移完毕,同时也成功完成十几个应用系统过渡到升级后的数据库版本,没有出现技术意外,达到了预定目标:“关键业务不间断,非关键业务对客户使用无影响”。
oracle 10g rac data guard构架的实现为中央电视台核心数据库的稳定、可靠运行提供了有力的技术保障。这个项目充分展示了我公司实施团队深厚的技术功底,他们实现了国内第一个基于qfs文件系统的oracle 10g rac data guard架构,在高可用高冗余数据库架构技术领域收获了国际领先、国内独创的高科技技术成果,引领了oracle数据库新一代高可用高冗余构架的技术潮流。在中国媒体行业it技术领域,此项目的成功实施,为业界同仁树立了崭新的技术标杆。