您的位置首页 >观点 >

民生证券:历史机遇 国产数据库市场迎来十倍空间

炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

原标题 历史机遇,国产数据库市场迎来十倍空间

来源 民生证券

报告摘要

历史机遇,国产数据库市场迎来十倍空间

市场空间:数据库核心软件,国产替换带来十倍以上空间

数据库作为三大基础软件,截至2017年我国市场规模约为120.22亿元,12-17年复合增长率超过17%。考虑未来我国数据量的持续增长和云部署方式的推广,IDC预计到2024年,中国关系型数据库市场规模可达到271亿元,其中采用公有云部署的关系型数据库市场规模可达到178.21亿元。

考虑外部环境和信息安全因素,数据库市场迎来国产替换历史机遇,我们预计替换将于2020年起从政府、事业单位往行业推进。我们根据政府机关、事业单位和国企人数、数据库数量关系、平均采购价格推算出政府机关、事业单位和国有企业的整体需求分别为204亿、290亿、288亿,假设至2024年完成替换,按100%替换计算,则合计市场增量为626亿;若按50%替换计算,则新增空间235亿。

市场现状:国内厂商份额有所上升,但海外四巨头仍占一半以上市场

截至2019年,国外厂商仍占据我国数据库市场80%以上份额,国内厂商市场份额虽有所提升,但仍不是主题。1)整体市场份额:传统关系型数据库中国产数据库市占率从2009年的4.2%提升至2019年的18.9%以上,海外四巨头仍占据65%以上份额;2)部署方式:云部署国内产商占优,传统部署仍是海外厂商优势范围。传统部署方式的关系型数据库市场中,Oracle、IBM、Microsoft、SAP四家厂商共占据市场份额超六成,其中Oracle占据市场中近40%;云部署方式中阿里和腾讯市场份额居国内第一、第二;3)国产数据库情况:国产互联网与跨界数据库厂商份额增长迅速,2019年国内关系型数据库市场中华为、阿里巴巴分别占据6.2%和5.8%,位列第五、六名;传统数据库厂商份额有所下降,南大通用和人大金仓分别以4.2%和2.7%的市场份额排在第七、八位。

非关系型数据库、云数据库、内存式数据库和流数据库成为新方向

考虑当前数据量的爆发、云化趋势、实时反应需求等,我们认为下述四种数据库将成为数据库行业的新方向、新动力:1)非关系型数据库:在互联网背景下比关系型数据库有更好的表现;2)云数据库:降低企业成本的同时为企业提供更加方便的云服务;3)内存数据库:满足当今企业和用户对快速读取的需求,4)流数据库:在内存数据库的基础上加强数据库的实时分析和流量监控能力。

投资建议

国产数据库迎来10倍替换空间的历史机遇,建议关注布局国产数据库市场的上市公司科蓝软件、中国软件、太极股份。

风险提示

信创采购力度不及预期;市场竞争程度加大;云数据库推广不及预期。

1

数据库行业的基本情况

1. 什么是数据库:负责数据存储、维护、获取的管理软件

数据库是对数据存储、维护、获取进行统一管理和控制的系统,主要负责保证数据的安全性、完整性、多用户对数据的并发使用以及发生故障后的系统恢复。数据库和操作系统、中间件一起,是构成计算机设备的三大基础软件。

数据库行业对应的上游是硬件设备供应商,包括存储器、服务器、计算机设备、网络设备等生产商;下游则是广泛运用数据库的各个行业,包括政府、军队、医疗、教育、金融、能源等。

2.数据库的分类:数据结构、使用需求与物理存储方式

数据库常见的分类标准为使用需求、数据结构和物理存储方式。依据数据结构可以分为关系型数据库和非关系数据库,依据使用需求可以分为事务型数据库和分析型数据库,依据物理存储方式可以分为内存型数据库和磁盘型数据库。

数据库基于数据存储结构的差异可以分类为关系型数据库(SQL)和非关系数据库(Not only SQL,NoSQL)。

关系型数据库是指采用关系模型来组织数据的数据库,以行和列组成二维表的形式存储数据,由二维表及其各表之间的联系组成数据库。关系型数据库优点是:通用的SQL语言使得操作关系型数据库非常方便;丰富的完整性(实体完整性、参照完整性和用户定义的完整性)大大减低了数据冗余和数据不一致的概率;二维表结构易于用户理解。关系型数据库同样存在问题:面对用户并发性非常高的情况,磁盘读写速度跟不上;在包含海量数据的二维表中查询,效率低下;关系数据库中的二维表只能存储格式化的数据结构。

非关系数据库一般采用分布式架构,数据之间保持独立不存在关系,使得数据库具有易拓展性和高速读写能力。非关系数据库可以通过增加节点解决关系型数据库扩展不易、迁移难的问题。此外,由于分布式结构,允许系统在节点对数据处理,面对海量数据时依旧能保持高速的读写能力。但是非关系数据库同样存在不足:只适合存储一些较为简单的数据,对于需要进行较复杂查询的数据,关系型数据库更为合适。

非关系型数据库,是区别于关系数据库的其余数据库的统称,其中同样存在差别。常见的非关系数据库有五种:键值数据库、文件数据库、图形数据库、时间序列数据库、列式数据库。不同的数据存储模式使得他们相比关系数据库在不同领域具有优势。键值数据库运用于网络购物、网页访问等方面;文档型数据库广泛用于移动端和网站内容管理系统;图形数据库常用于反诈骗、实时分析、存取管理、网络与IT运营;时间序列数据库多用于IOT设备和传感器;列式数据库广泛存在于商业智能和数据仓库领域。

根据使用需求,数据库又可以分为事务型数据库和分析型数据库。事务型数据库主要用于业务支撑,负责联机事务处理(OLTP),以日常事务以及查询(处理少量数据)为主,响应时间短。分析型数据库主要用于历史数据分析,负责联机分析处理(OLAP),作为公司的单独数据存储,负责利用历史数据对公司各块业务进行统计分析、处理的数据量大、实时性要求不高。

数据物理存储方式的差异,又可以把数据库分为磁盘数据库和内存数据库。磁盘数据库是指数据存储于磁盘中,是数据库常见的存储方式。数据库需要频繁地访问磁盘来进行数据的操作,由于对磁盘读写数据的操作一方面要进行磁头的机械移动,另一方面受到系统调用的影响,当数据量很大,操作频繁且复杂时,读写速度无法满足实时性需求。内存数据库数据处理速度比传统数据库的数据处理速度要快很多,一般都在10倍以上。此外,内存数据库存取时间易于预测,可以定制数据存取方式,满足特殊情况下对数据的实时性需求。

3.数据库的用途:为各行业的业务处理和商业分析提供支持

数据库在各行各业得到广泛运用。数据库在信息系统中用于存储、管理数据,为业务处理、数据挖掘、商业分析、提供数据支持。随着企业数字化与智能化转型需求的上升,越来越多的企业采集与经营、市场相关的数据以便做出精准有效的决策。由此带来的数据爆发式增长让这些企业正视数据存储、管理与安全。处于信息技术核心的数据库,在金融、政务、教育、电信、医疗健康、电力、公安、企业等一系列领域得到广泛运用,为各领域的运营和决策提供支持。

数据库为数据中台的数据管理和数据分析提供支持。数据中台主要提供全量数据的实时在线服务,同时提供对海量数据进行采集、计算、存储、加工以及基于全量数据的数据发掘。随着业务的复杂化以及互联网、移动业务带来的海量数据的增长,数据在治理、挖掘等方面的重要性凸显,因此数据中台就成为了现在金融等大型企业关注的业务重点。数据库帮助用户在管理全量数据的同时对外提供在线查询与分析能力,构建完整的数据中台,实现数据的全生命周期管理。比如在金融领域,数据库支持下的数据中台帮助银行客户在柜台、网银、手机银行上随时随地查询开户以来所有数据记录。同时,多类型的全生命周期数据,帮助银行更好的针对数据进行价值挖掘和建模,为风控、营销和人工智能等业务提供了数据支持。

数据库在大数据中心同样发挥作用,涵盖数据采集、数据管理、数据服务、数据应用四个阶段。数据采集是指实现基础数据、行业数据、产业数据等相关基础数据和业务数据的采集,主要通过数据采集工具按照标准进行转换、抽取;数据管理是指数据库实现数据整合、数据源管理、资源目录管理、数据质量管理、数据资源管理;数据服务是数据库对清洗处理过的数据进行集中服务管理,对外提供报表服务等通用数据服务;数据应用主要是数据库按照业务类别、业务单位的功能需求对数据进行组织、展现和利用,为主要业务应用提供数据支撑。

将使用需求和数据结构结合,可以组成四种数据库类型,满足不同使用场景。四种数据库拥有各自的优缺点,并根据使用场景和用户需求在不同领域服务。关系型+事务型数据库在传 统业务如 CRM 系统、ERP 系统和信用卡交易等仍占据主流;关系型+分析型数据库则多用于商业智能、数据分析;非关系型+事务型数据库在网页和移动端有很大市场份额;非关系型+分析型数据库在海量数据索引与预测分析有优势。

4.数据库的性能:六个方面,一套标准

数据库的性能指标聚焦于 6 个方面:吞吐量、负载均衡、读写速度、分区分片、并发性和可用性。不同类型的数据库由于使用场景的差异,在性能和功能上有不同的偏重,在这六个指标方面同样会有所差异。常见的具体指标有平均每秒响应速度、查询速度、平均每秒吞吐量等。

TPC 是国际上最流行和广泛接受的数据库性能标准测试。TPC(事务处理性能委员会)是 由十几家会员公司创建的非盈利组织,总部设在美国。TPC 的成员主要是计算机软硬件厂家,主要功能是制定商务应用基准程序的标准规范、性能和价格度量,并管理测试结果的发布。针 对不同类型数据库之间的区别,TPC 颁布了对于数据库在线事务处理(OLTP)能力测试的基准 程序 TPC-C 和在线分析处理(OLAP)能力测试的基准程序 TPC-DS。TPC-C 测试中的 tpmC 值 (TPC-C 测试过程的吞吐量,按有效 TPC-C 配置期间每分钟处理的平均交易次数测量),在国 内外被广泛用于衡量数据库系统的事务处理能力。根据 TPC-C 最新排名,蚂蚁金服自研的 OceanBase 数据库 tpmC 值达到 707,351,007,成功超越之前的记录,击败 Oracle 和 IBM 的数据库,登顶榜首。

5.国内数据库市场现状:国产化持续推进,关系型数据库为主导

当前我国数据软件市场具有百亿以上市场规模,持续受益大数据产业发展。根据智研咨询 数据显示,2017 年我国的数据库软件整体市场规模为 120.22 亿元,12-17 年的行业复合增速 超 17%,处于稳健发展期。根据 2019 大数据白皮书,2019 年大数据研发人员超过 8 万人, 研发投入超过 550 亿人民币,同时预计我国 2020 年大数据产业市场达 6600 亿元以上,行业 复合增速超 20%,数据软件细分市场作为产业重要构成持续受益产业发展红利。

传统关系型数据库仍为主流,市占率超 85%。当前数据产业发展下的海量数据导致大量非关联数据分析需求的产生,导致关系型数据库占比的下降。但参考国外数据库的发展和国内 数据库市场当前情况,传统关系型数据库仍占主导,国内市场规模从 2012 年的 46.51 亿元增 长到 2017 年的 102.8 亿元,复合增速为 17%,略高于行业增速,市占率超 85%。

国产化替代持续推进,关系型市场中国产数据库市占率从 2009 年的 4.2%提升至 2019 年 的 18.9%以上,海外四巨头仍占据 65%以上份额,海外厂商整体增长乏力。自 10 年前后提出 “去 IOE”和 13 年棱镜门事件影响后,我国一直在推动国产数据库持续扩张,国产市占率从2009 年的 4.2%提升至 2019 年的 18.9%以上,但近 3 年海外四巨头在国内市占率仍维持在 65%以上份额,因而当前海外巨头的影响力仍在,国产化仍有较大提升空间。

国内数据库市场面临新入跨界巨头的竞争,南大通用、人大金仓和武汉达梦等传统数据库公司份额有所下降。华为、阿里 2019 年起将自研数据库推入市场并进行大力的商业推广,加剧国内数据库市场竞争。根据 IDC 的数据,2019 年国内传统部署的关系型数据库市场中,华为数据库以 6.2%的市场份额位列第五,排在 Oracle、Microsoft、IBM、SAP 之后;阿里巴巴以5.8%的市场份额位列第六;而传统数据库厂商南大通用和人大金仓分别以 4.2%和 2.7%的市场份额排在第七、八位。

当前云部署已成为国内关系型数据库新方式,国内数据库云化率持续上升。根据 IDC 数 据,2019 年中国关系型数据库传统部署模式的市场规模为 7.9 亿美元,公有云模式市场规模为 5.5 亿美元,同比增速 30%。其中,2019 年阿里巴巴在公有云关系型数据库市场中以 48.1%的 市场份额排名第一;腾讯以 20.4%的市场份额排名第二,AWS 以 10.4%的市场份额排名第三;随着企业数智化转型和数据上云的持续,未来 3 年国内数据库采用云部署的市场增速将超过 关系型整体市场 23.2%的行业增速。

2

以史为鉴:行业与巨头发展史

(一)数据库行业发展史:穿孔卡片、关系数据库、非关系数据库到云数据库

数据库行业的发展史可以根据数据库技术运用分为四个阶段:穿孔卡片、关系数据库、非关系数据库和云数据库。当前行业整体的趋势表明数据库已进入云的时代,数据的存储和管理搬到云平台,用户通过终端和云平台连接,在平台上开展便捷的数据存储、查询和管理。云数据库和云计算、人工智能等新兴技术结合在一起,为数据库行业带来新的发展机遇。

阶段一:穿孔卡片数据管理(1960 及以前)

数据库的雏形最早可以追溯到 20 世纪 50 年代的数据管理。那时的数据管理非常简单。通过大量的分类、比较和表格绘制的机器运行数百万穿孔卡片来进行数据的处理其运行结果在纸上打印出来或者制成新的穿孔卡片。而数据管理就是对所有这些穿孔卡片进行物理的储存 和处理。1951 年雷明顿兰德公司推出了一种一秒钟可以输入数百条记录的磁带驱动器从而引 发了数据管理的革命。1956年IBM生产出第一个磁盘驱动器,使得机器可以随机地存取数据,而穿孔卡片和磁带只能顺序存取数据,极大的提升数据管理能力、效率。

阶段二:从网状数据库、层次数据库到关系数据库(1960-2000)

数据库系统的萌芽出现于 20 世纪 60 年代。当时计算机开始广泛地应用于数据管理,对数 据的共享提出了越来越高的要求。能够统一管理和共享数据的数据库管理系统(DBMS)应运而生。最早的数据库系统采用网状数据库和层次数据库,虽然解决了数据集中与共享问题,但 是在数据独立性和抽象级别上仍有很大欠缺。1970 年 IBM 研究员埃德加·弗兰克·科德博士发表题为“大型共享数据库的关系模型”并提出 12 条标准,补足之前数据库在独立性和抽象 性上的缺陷。许多科技公司根据他的论文开始推出采用关系数据库模式的产品,包括 IBM、 Oracle、Ashton Tole、微软、Sybase 等。自此关系数据库兴起并快速发展,到 90 年代成为规模最大、使用最广泛的数据库类型。到了 2000 年,全球数据库产业经过竞争、并购、退出过程, 最终形成 Oracle、Microsoft 和 IBM 三巨头的竞争格局。

阶段三:非关系数据库的兴起(2000-2010)

进入新世纪以后,随着互联网的兴起,传统的关系数据库在应付对海量数据和处理非结构化数据的问题上显得力不从心,暴露了很多难以克服的问题,而非关系型数据库则由于其本身的特点得到了非常迅速的发展。非关系数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题,包括超大规模数据的存储和快速处理海量的不同结构的数据。

阶段四:云数据库出现(2010-至今)

云数据库是高可靠、高可用、可弹性伸缩的云数据库服务。通过云数据库能够快速实现数据库部署,同时云端完全托管,避免数据库运维烦恼。云数据库结合云计算、大数据一起,顺 着互联网的浪潮共同发展。Amazon 率先推出云服务 AWS,成为全球第一个云数据库供应商。随后谷歌、微软、阿里、腾讯等一系列企业各自推出自己的云数据库,推动数据库的云化发展。Gartner 研究报告称,到 2023 年,全球 75%的数据都会出现在云平台上。

(二)Oracle 发展历程:市场领导者是怎样诞生的?

如果回顾上个世纪 70 年代以来全球数据库市场的发展,Oracle 一定是绕不过去的名字。作为最早的数据库企业之一,Oracle 自第一代产品之初就成为整个数据库市场的领导者。哪怕 是在多次技术革新和理念进步之后,Oracle 依旧保持领先地位,从 1987 年开始长期占据最大市场份额。通过研究 Oracle 的发展历程,了解世界数据库行业的变革过程,为接下来中国数据库行业发展趋势提供参考。

1977-1994 年 把握良机,初获成功

1977 年,32 岁的拉里·埃里森和同事爱德华·欧特斯和鲍勃·迈纳尔一起创办 “软件开 发室”公司(SDL)。在看到《大型共享数据库的关系模型》一文后,三个人决定基于论文的 理论开发一款通用关系型数据库。艾里森把这个关系型数据库命名为 Oracle(“神谕”),来自 之前艾里森所在的公司为联邦情报局(FBI)所开发的数据库项目代号。

1979 年,公司发布第一款产品 Oracle V2。同一时期,美国空军希望采购一款关系型数据 库以满足业务需求。IBM 的关系型数据库还在开发中,无法提供令人满意的成品,于是美国空 军转而联系 RSI,并成为 Oracle 数据库的第一位用户。

当时计算机硬件和软件深度绑定,导致同一款软件需要根据不同的平台进行开发,增添许多麻烦。为了满足用户对不同平台上数据库兼容性的需求,创始人之一的迈纳尔负责用当时新 兴的 C 语言编写 Oracle 的核心代码,并于 1983 年发布 Oracle V3。Oracle V3 实现多平台的兼 容性和可移植性,成功获得市场的注意,Oracle 初步获得成功。不久后公司改名为“Oracle”。

1985 年,Oracle 发布 V5 版本。该版本是 Oracle 数据库第一款实现的稳定版本,支持 C/S 架构,使得用户可以直接通过 PC 访问服务器内的数据,实现用户端和服务器端的分离。1987 年,Oracle 成为世界上最大的数据库公司,年销售额超过 1 亿美元,为全球 55 个国家和地区 的4500多位用户提供服务。1992年,Oracle7发布,通过优秀的产品力和完整性击败对手Sybase,再次占据数据库市场最大份额。

1995 年-2010 年 拓展上下游产业链,大规模收购完善产品

最初,公司的主要营收来自于数据库软件的收入。90 年代开始,ERP 系统备受市场 追捧,Oracle 的数据库系统因市场对 ERP 的巨量需求获得快速增长。市场需求使得 Oracle 拓展产业链,开始涉足位于数据库产业下游的应用软件业务。2000 年,Oracle 发布 EBusiness Suite 11i 模块,正式进入应用软件领域。一开始市场主流产品仍是 SAP 的 E/R 3, EBS 11i 推出后只是得到一部分美国企业客户都使用。为了快速提升市场份额与 SAP 对抗,2004 年 Oracle 斥资 105 亿美元收购 ERP 领域厂商仁科公司(PeopleSoft), 接着又在 2006 年 58.5 亿美元收购 CRM 软件公司 Sieble,2007 收购 PLM 软件公司 Agile。据 Oracle 官网显示,在 2005-2010 年之间,一共有 66 家企业被 Oracle 收购。大量收购极大地丰富 了公司的产品模块,到 2009 年 E-Business Suite 12 推出时,Oracle 在应用软件领域形成包 含订单管理、客户关系管理(CRM)、 企业资源管理(ERP)、人力资源管理(HRM)、产 品周期管理(PLM)等高度集成的 300 多个模块,几乎覆盖制造业、商业、金融、政府等 各个行业的全部应用场景。2010 年,Oracle 在 CRM 和 ERP 市场份额分别达到 16.9%和 11.0%,仅次于 SAP18.9%和 18.8%,成为市场第二名。

在发展下游的应用软件领域以外,公司同样把目光放在数据库行业上游的硬件设备行业。2008 年 Oracle 收购中间件厂商 BEA 和当时硬件设备巨头太阳(Sun)公司,成功打造包含从服务器、数据存储器、网络设备到数据库管理系统再到应用软件的全产业链,成为数据库行业内实现全方位覆盖的公司。

2011 年-至今 云时代,传统巨头投入云怀抱

云服务时代,Oracle 的竞争对手逐渐从 SAP、IBM、EMC 转变为亚马逊、微软、Salesforce、 WorkDay 等云服务商。面对新的竞争,Oracle 改变策略,开始发展自己的云数据库。2013 年, 公司发布新一代产品 Oralce 12C,产品名中的“C”是云的意思。整款产品采取云计算设计,考虑到云场景的运用,允许数据库容器存储来自不同数据库系统的数据。此外,12C 加入内存 数据库的概念,允许用户根据情况设置内存容量,提供分析和混合负载 OLTP,不仅提供出色的事务处理性能,还支持实时分析、商务智能和报告。

2018 年,Oracle 发布 18C,相比 12C,添加了更多功能,如多租户架构节省成本;使用内 存列存储提升实时分析能力;数据库分片实现大规模 Web 应用程序的高可用性和增强数据库性能。18C 最大的提升在于自治数据库,利用现有设备优化+数据库自动处理+机器学习提升数据库的性能和可靠性,降低人为失误带来的负面影响。自治数据库的自动化体现在三个方面:1)自我运行:用户完成工作负载设置后,数据库自动实现;2)自我保护:同时防止外部攻击 和内部攻击。3)自我修复:自动修正错误节点并更改数据。结合 Oracle 云平台,自治数据库可以完成以往需要专业操作人员才能完成的事务型工作,降低数据库的运行成本,提升数据库的整体性能。

Oracle 对国内数据库厂商的启示复盘 Oracle 的崛起历程,可以发现技术驱动和行业垂直 整合是 Oracle 发展历程最重要的两个因素。每次行业变革发生时,Oracle 始终走在最前面,成为市场的领导者,凭借自身的技术优势和优秀的产品击败对手。如今,云数据库概念的兴起,行业再次进入到技术变革期。在这次技术浪潮中,中国厂商与国外厂商一起走在前面,抓住云数据库的发展趋势,有机会实现弯道超车,扩大、巩固行业地位。此外,行业通过收购方式打造垂直生态链,提供完整解决方案,更有希望获取优势,击败竞争对手。

3

数据库行业的未来

1.数据库行业的发展方向:云数据库、非关系型数据库、内存数据库与流数据库

云数据库、非关系型数据库、内存数据库、流数据库是当前数据库行业发展方向。云数据库降低企业成本的同时为企业提供更加方便的云服务;非关系型数据库在互联网背景下比关系型数据库有更好的表现;内存数据库更能满足当今企业和用户对快速读取的需求,流数据库在内存数据库的基础上加强数据库的实时分析和流量监控能力。这四种数据库成为数据库行业的新方向、新动力。

云市场快速增长,数据上云成为趋势。云数据库并非是一种全新的数据库模型,而是选择以服务的形式向用户提供数据库功能。不同规模企业对云数据库的需求不同:对于大型企业,云数据库可以满足海量数据存储需求;对于中型企业,云数据库可以满足数据存储动态变化的 需求;对于小型企业,云数据库可以满足低成本数据存储的需求。Gartner 认为,数据库的未来必须云化,目前云数据库已为数据库市场的增收贡献一半以上份额。与传统数据库不断下降 的营收相比,云数据库正在积极地快速增长。到 2022 年,预计有 3/4 的数据库天然部署或迁 移到云上。Gartner 表示,企业正将新应用向云转移,对数据存储和计算分析的能力要求不断加强。相比传统数据库,云数据库天然具备灵活性,能够提供强大的创新能力、丰富多样的产品体系、经济高效的部署方式和按需付费的支付模式。

非关系数据库比重提升,关系数据库保持市场主体地位。近年来,数据增速集中于物联网设备、影音文件、网站日志、社交信息等,这些数据具有海量、低信息密度的特点。非关系据库易于扩展、无序存储、分布式架构的特性,相比传统的关系型数据库,更能满足对这些数据的储存需求。虽然关系数据库的市场份额和增速受到非关系数据库崛起的影响,但关系数据 库成熟的体系和完整的生态将持续为 CRM、REP 和信用卡交易等以结构化数据为主并注重数据安全和一致性的场景提供服务。

数据库行业发展的最新趋势表明,关系数据库和非关系数据库的边界逐渐变得模糊。NewSQL 数据库开始兴起,这类数据库不仅具有非关系数据库对海量数据的存储管理能力、高性 能数据处理和易于扩展的特性,还保持了传统关系数据库支持 ACID 和 SQL 查询等特性,支 持关系数据模型。一些非关系数据库也发生转变,调整数据结构以支持使用 SQL 语言查询。William Blair 认为,数据库未来将是把关系数据库和非关系数据库结合,根据数据结构、使用场景灵活调节,共同为用户服务。

内存数据库得到广泛运用。随着移动互联网发展,信息系统的互动性日益增强、用户规模不断攀升,催生出一大批高并发、低时延的新兴应用。基于磁盘存储的数据库受限于磁盘的读写速度,很难满足低时延与高并发的需求。将数据存储在内存里的内存数据库成为解决传统磁盘数据库问题的主流技术路线。在电子商务、视频直播、电信计费等对响应速度要求极高的场 景下,内存数据库大展身手,进入成熟的商用模式。根据 Research and Market 的报告显示, 2019 年全球内存数据库市场达到 41.6 亿美元,预计到 2025 年将增长至 118.2 亿美元,复合增 长率达到 19%,远超整体市场每年 8%的增长率,市场前景广阔。

流数据库成为新潮流。在内存数据库中,主打事务处理和实时分析结合的流数据库成为新潮流。流数据库是指能实时收集、处理、存储流数据(一组顺序、大量、快速、连续到达的数据序列)的数据库。相比传统数据库分批处理数据,流数据库在对数据完成实时分类、分析、存储等环节,应对海量数据涌入时,仍能保持实时响应和低延迟。流数据库通常采用内存作为数据存储方式,并采用分布式架构,需要高速处理的数据可异步快速加载到处理集群内存中;处理集群可轻易地扩展到数百个物理节点,提升处理速度。流数据库适用于快速响应、实时分析、实时监控等场景。对于企业,依靠流数据库强大的实时数据反馈与商业智能结合,对终端用户数据监控并迅速做出决策,有效提升运营效率并减少决策时间,更好地在商业竞争中取得优势。

开源数据库成为更多企业的选择。开源数据库是指源码完全开放,可供大众下载和修改的 数据库。常见的开源数据库有 MySQL、PostgreSQL、MongoDB 等。面对价格低廉、性能相等、 生态不断完善的开源数据库,昂贵的商业数据库逐渐失去市场优势。根据数据库权威排名 DB Engines 数据显示,截至 2019 年开源数据库和商业数据库已平分秋色,考虑到大部分云数据库采用开源架构,随着开源数据库生态不断完善、功能日益丰富,未来开源数据库的市场份额将进一步提升。商业数据库虽然份额持续下降,但这并不意味着商业数据库会退出市场。对于一些注重数据安全性的企业,如银行、跨国公司,商业数据库依旧是一个让人放心的选择。此外,一些长期使用商业数据库的大型企业,如果从商业数据库转变为开源数据库需要复杂的数据 迁移,这会影响企业的日常业务。此外,开源数据库如 MySQL、Neo4j 等由于协议的开放性,限制了其他企业商用能力;虽然存在社区贡献者和个人开发者,但社区整体生态和服务支持比商用数据库仍相差甚远。综合来看,商业与开源数据库各有优劣:开源数据库在互联网行业和小微企业很有市场;传统行业和大型企业依旧高度依赖商业数据库。

2.国内数据库行业的未来:市场需求、国产替代与云化趋势

国内数据库市场潜力巨大。自 2012 年以来,国内数据库市场迎来蓬勃发展期,进入百花齐放时期。传统数据库厂商和云数据库服务商都在加速产品迭代和推出新的产品。同时,新兴数据库厂商不断涌现,以及其他领域厂商向数据库跨界情况的增多,使中国数据库市场更加繁 荣和活跃。根据 IDC中国的数据显示,2019年中国关系型数据库软件市场规模为 13.4 亿美元。其中,传统数据库市场规模为 7.9 亿美元,公有云数据库市场规模为 5.5 亿美元,整体市场同 比增长 30.8%。IDC 预测,到 2024 年,中国关系型数据库软件市场规模将达到 38.2 亿美元, 公有云关系型数据库软件市场规模将达到 25.1 亿美元。

信息量爆发式增长,数据库需求提升。IDC 在报告指出,全球数据量总和将从 2018 年的 32ZB 增至 2025 年的 175ZB,信息数据呈爆发增长态势。由于中国上网人数的增加以及视频 监控设备的普及,加上大数据、移动互联网、人工智能等技术革新和正式投入商用,IDC 认为 中国将保持 30%的复合增长率,到 2025 年中国将成为世界上数据量最多的地区。

去“IOE”持续推进,本土厂商产品成熟、竞争力提升。“IOE”是指 IBM 的小型机、 Oracle 的数据库系统和 EMC 的存储设备及中间件,这些国外厂商设备占据了国内市场的大部 分份额。目前国内市场上的数据库系统主要产品仍来自 Oracle、IBM、Microsoft 三大国外厂商,国产数据库产品渗透率低。自从数据与信息安全得到政府和企业重视以来,国产产品在关键领 域实现替代成为重中之重。2008 年,阿里率先开始去“IOE”运动,到 2013 年,最后一台 IBM 的小型机下线,阿里巴巴彻底完成去“IOE”的计划。在这之后,许多企业和政府机构开展设备国产化的运动,为国产厂商带来新的增长机遇。经过一段时间成长和磨砺后,从性能和功能来看,国产数据库已能覆盖绝大部分数据库使用的场景,在某些细分领域甚至推出性能超越、价格远低于国外产品的数据库解决方案。未来会有更多企业、政府机构和事业单位选择国产数据库作为替代。

外部环境压力激增,国产替代进程加速。两国关系自 2016 年贸易摩擦以来持续恶化,中 兴通讯、华为、海康威视等企业遭受不同程度的制裁。2020 年 5 月,新一批制裁名单公布,将 33 家机构、企业和个人列入限制名单。随着博弈升级,国家对信息技术创新的支持也逐步公开化、透明化。我们预期信创产业采购将于 2020 年下半年开始落地,我们认为国产数据库的替代需求将释放,国内企业有望持续受益政策和行业双重红利。

我们根据政府机关人数、事业单位人数和国有企业职工人数推算接下来 5 年内国产数据 库的市场情况。假设不考虑民用消费市场,根据《2018 年财政年鉴》、《2018 年国有资产监督 管理年鉴》显示,2017 年我国政府机关人数、事业单位人数、国有企业员工人数分别达到 1300 万、3150 万和 6000 万人,分别按照人均配置 1 台、0.7 台、0.4 台电脑计算,并按照 15 台、 15 台、20 台电脑配置 1 台服务器、5 台服务器配置 1 套数据库,一套数据库采购价分别为 12 万、10 万和 12 万,计算得出政务市场、事业单位和央企国企整体市场规模分别为 208 亿、294 亿、288 亿。考虑当前已有 20%的市场份额为国产数据库,因而若完全全部替代,则整体替换市场空间为 163 亿、233 亿、230 亿,合计 626 亿;保守估计只完成 50%的替换,则新增空间为 61 亿、87 亿、86 亿,合计 235 亿。

我们预计数据库的国产采购于 2020 年开始,到 2024 年完成全部采购,每年采购项目分别 占整体市场规模的 20%、30%、25%、15%、10%,算得2020-2024 市场采购规模分别为 156 亿、235 亿、196 亿、117 亿和 78 亿元。按 100%替换计算,则合计未来 5 年,政府、事业单位和国企采购将为国产数据库市场带来增量 626 亿(已有近乎 20%国产不替换),50%替换则新增空间 235 亿。

云数据库服务得到企业青睐。云数据库作为云服务的核心组成部分,为制造业企业和小微企业提供成本低廉、功能丰富的数据存储服务,企业无需斥资购买商业数据库或者雇佣专业人 员根据开源数据库自行搭建。根据国家统计局数据显示,2019年我国小微企业超过7000万家, 而阿里云、腾讯云、华为云用户数分别为 300 万、200 万、100 万,市场渗透率有待提高。上云已成为趋势,未来会有更多小微企业选择使用云数据库,云数据库规模将继续扩大。

风险提示

信创采购力度不及预期;市场竞争程度加大;云数据库推广不及预期。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。