作者 | 王德清 王刚
编辑 | 王刚
对于日新月异的数据库赛道而言,Snowflake 700亿美元的“史上最大软件IPO”并没有将甲骨文Oracle送进黑暗的深渊,甲骨文最坏的时代还远远没有到来。
国产替代的大浪潮之下,国内阿里、华为、蚂蚁金服的巨头阵营手握最充足的弹药,PingCAP、巨杉网络、柏睿数据等明星数据库厂商在资本以“刷新全球数据库领域融资记录”的野蛮推动下,正一步一步踏入资本和技术涌动交织的沃土。
这是不是几年之前人工智能“造富”的投影?
国产数据库融了巨资后被冠之以独角兽的称号,然后有媒体大肆鼓吹、资本催熟套现的熟悉剧情?
我们在这场关于数据、技术、资本的大讨论中,真正要讨论什么?
对于国产技术的未来,我们是否要缓一节拍,做时间的朋友等一等,步子大了容易扯着蛋?
我们一点一点说起。
数据库赛道,甲骨文是绕不开的大山。一切“中国版的甲骨文”、“去O难”都侧面叙述了这家数据库鼻祖的强大。
数据库是基础软件皇冠上的明珠,几十年来与操作系统齐名,是每一家公司业务系统的核心,以刚需“收割”企业利润。
在1989年正式进入中国后,甲骨文的产品不断进入金融、电信、能源、政府等领域。在2013年前后,信息安全的政策导向倒逼信息基础设施国产化加速,国内“去IOE”的潮水向甲骨文汹涌冲击。
甲骨文创始人兼CEO larry·ellison
只要市场上不出现替代者,它就可以坐享其成,但事实上,甲骨文面临着严重的“腹背受敌”。这里主要是有三个原因:
1)2017年开始,行业互联网化和数字化加速,数据量暴增,近两年数字经济成为国策,高并发数据需要得到处理;
2)技术迭代。分布式、云原生等技术概念出现,变革了云技术发展,云数据库带来了增量创新而不是存量替代,云从基础设施上升到对业务的处理,备受欢迎;
3)国产替代在成本上、性价比和舆论导向上都占尽优势,数据库也成为了火热的“国货”。四面楚歌,甲骨文的“敌人”不断出现。
2014年,亚马逊AWS就发布业内第一个云原生数据库Aurora,阿里云则在2017年重磅推出云原生数据库PolarDB,蚂蚁的OceanBase数据库在2017年对外输出技术服务。中美两国最具代表性的云厂商弃用甲骨文,引发的风潮“一发不可收拾”。
国产力量的“觉醒”,更像是一个新老之争的故事。相当多的受访者都会强调到:很多国产数据库和传统数据库,已经不是一个时代的产物。
甲骨文是上一代产品,单机性能被优化到极致,但是大数据时代的到来,数据爆发式增长,单机版的数据库处理起来开始显得力不从心。在这个背景下,分布式数据库应运而生。分布式数据库单个节点性能不如甲骨文数据库,但堆叠起来性能则很可观,而且能够根据需求弹性伸缩,能处理几乎无限量的数据。
PingCAP联合创始人兼CTO黄东旭对雷锋网表示:“相比于传统单机版的经典数据库,由于其积累的时间更长,国产数据库的成熟度肯定还是会差一些。但是在云数据库领域,我国与国外的同类产品相比,技术上已经没有任何差距,甚至在一些高并发的场景上,国产数据库更具有优势。”
目前,国内以互联网厂商为背景的主流的数据库产品均实现了云化。如PolarDB、OceanBase、TDSQL、TiDB等。伴随着云化、数字化浪潮在全球逐渐蔓延,我国企业打造的云数据库产品也在国际市场与行业头部公司开始了同台竞技,目前也取得了可喜的成绩。
2016年就投资PingCAP的云启资本合伙人陈昱对雷锋网表示,数据库本身是不分国界的,国外市场对于国内数据库厂商来说机会很大。只要产品足够出色,能和国际上的厂商竞争,就能在国外市场拿到单子。
可见,云数据库的发展让国产数据库实现了“变道超车”,而互联网发展带来的增量创新场景无疑已经成为了当前云数据库的重要的市场之一。
从诸多数据库大厂的实践以及客户反馈中,外界不难发现,在一些银行核心业务的替代中,国产数据库在高一致性、高可靠性等核心能力上的表现并不逊色传统的经典数据库,同时在成本上,替换国产数据库也还可为用户降低成本。
尽管“去O”成共识,但大势之下,金融等行业核心业务数据库替代意愿成为我国数据库厂商不得不面对的问题。
此前,腾讯数据库技术负责人潘安群对雷锋网(公众号:雷锋网)表示到:“我们很感谢那些愿意跟我们一起吃螃蟹的客户,因为他们很多人都把自己的职业生涯压在了我们的身上。”
而这背后的原因,也是云启资本合伙人陈昱眼中当前国产数据库仍旧存在不足的地方。
“用户大量的应用都是基于传统的Oracle数据库生长起来的,没有一款国产的数据库可以说100%与Oracle是兼容的,面对这样的问题,国产数据库需要为用户把一些传统的特性补足,或者是基于新的数据库再为用户把应用重新写一遍,但是无论哪种方式都是需要大量的时间。”陈昱提到,“所以银行更多的把国产数据库用在创新业务上,核心系统替换还需要时间。”
同样在行业资深人士看来,工程优化问题是当前国产数据库替代后面临的首要问题,除此之外,“如何避免重度交付”也是我国国产数据库厂商所要面临的又一个课题。
“只要大家愿意放足够多的研发,放足够多的人,现在替代Oracle已经不再是一个问题了。若一个项目的交付动辄就需要两三年的时间才能完成,试想面对银行成百上千的业务系统,这样的重度交付,将所有数据库替代完,可能会需要很多很长的时间,付出很大的成本。
“可见,数据库国产化替代不再是一个能不能的问题,而是谁能够交付的更快投入的人力更少。
自2017年以来,数据库领域的融资就没断档。
“甲骨文打下的江山我们要打,甲骨文打不下的我们也要打。”行业人士此前发出豪言。
这中间,涌现了一批看数据库赛道非常积极的投资机构,比如经纬中国、云启资本、红杉中国、明势资本等。
云启资本合伙人陈昱告诉雷锋网,资本进场的逻辑很简单,就是投技术,谁技术好,我们就投。
“所有商业模式创新的东西都有一定的综合风险,无论教育还是房地产、之前的生鲜电商,随着市场走向成熟,其相对也面临着更严格的监督。而在目前的国策下,国家对于科技创新公司是非常支持的,特别是比较硬核的科技公司,真正为社会创造价值、提升效率的企业,未来不单是数据库,整个硬科技赛道的话市场都比较看好。”
他还提到,数据库赛道以前存在“新瓶装旧酒”的情况,这几年随着互联网基因的厂商进入,每一行代码都是自己重新写的,做到了完全的国产和自主可控,而且用的是业界比较新的一些架构,态度更加认真。资本的进入和关注,很大程度可以帮助这些厂商找到最好的人来做最好的产品。
在陈昱看来,先国内,再国际,类似“农村包围城市”的战法也是可行的,数据库本身是没有国际边界的产品,除了在国内,还可以在海外发展起来,与国际先进产品同台竞争。
资本的钱最终去了哪里?
这是所有人都会关注的一个现实问题。“80%投进了研发招募和产品打磨,剩下20%大概会放在市场化上。”有数据库厂商高管表示。
不可否认,资本的进入为中小数据库厂商赢得了足够多的资源和声量,但是相比巨头,他们更有钱吗?
云启资本合伙人陈昱提到,如果是PK研发工程师的数量,大厂做数据库的团队加起来可能并没有专注数据库领域的PingCAP多。在单点上,创业公司的资源并不比大厂少,因为后者不会把所有的资源倾斜在某一个产品团队上,决策链条也会拉得更长。
巨头环伺下,国产数据库中小公司凭借其“中立”、“跨云”及“资本加持”,可能并不落下风。不过,国产数据库中小公司的快速融资带来了一个新的问题 :数据库工程师的招募成本与日俱增,这种“无序地挖人”其实对资金不是一个特别好的利用。比如,原本35万可以招到的工程师,现在要50万才可以,但竞争对手有可能出60万。
“用人成本越来越高,重度交付投入了大量的研发人员,无形中也增加了国产化替代的成本,而这也会让一些用户望而却步。”业界人士对雷锋网表示。
开源,隐含逻辑是“敢不敢”
国产数据库厂商中,有一个特立独行的派别:开源派。
成长于开源社区,做了很久的“时间的朋友”,在开源场景中训练了自己的技术。PingCAP的TiDB本身就是开源数据库,蚂蚁自研数据库OceanBase在今年6月1日宣布开源300万行代码。
这意味着,开发者在开源社区能够完整使用这些数据库的内核,处理实际业务中的诉求。
开源的隐含逻辑在于,“敢不敢开源”本质上是一个代码可控性的问题。"其实一些国产数据库厂商也有类似的问题,它的数据库虽然不是MySQL(关系型数据库)的,但是由于底层代码里面有一些从Oracle反编译的一些代码,所以不敢开源。不敢开源,尤其是不敢全方位的开源,其实本质是核心技术代码是否具有可控能力的背书。”一位不愿具名的行业人士表示。
因此,这也很好印证了:国产化里面什么是真正的安全?就是代码完全的可控,敢于开源,这对于用户来说才是完全的、真正的可控,就算你这家公司都倒闭了,客户依然能够继续基于你开源版本继续去做演进。
数据库的开源,势必与商业化的命题碰撞。
以PingCAP为例,国外用户对于开源数据库的付费意愿其实很高,所以目前PingCAP在国内国外市场齐头并进,目前在国外市场已经取得了多笔订单的认可,且单一订单金额也较为可观。而在国内,PingCAP采用订阅机制,同时国内的金融机构也都开始了云化进程,所以在这个方面,用户付费也不成问题。
对于资本来说,普遍考虑的点在于商业化速度。譬如数据库产品想进入银行,银行的领导未必放心让你进去,或者在海外推广,若没有建立一个强有力的销售队伍的话,哪怕产品再好,销售速度可能也不如人意。
不过,多家国产数据库背后的投资机构表示,国内的数据库市场繁荣还处在早期,至少目前来看并不担心商业化。
“资本最好在早期孵化(国产数据库团队),就是从0~1或者是从1~10的部分的阶段起到一些作用,资本越到中期以后越应该是一个助力的作用。在中后期,数据库厂商并不是那么依赖资本长期的不断的供给。”资深人士对雷锋网提到。
整体来看,这一轮国产数据库的融资不断,实际上是技术迭代的一种必然,是数字化转型下的刚需体现,与几年前的AI大火并不遵循相同的逻辑。AI本身不是刚需,“拿着锤子找钉子”是一件特别困难的事情,而数据库的国产和开源趋势,恰逢其时。
2020 年,全球数据库市场规模达到 671 亿美元,中国数据库市场规模约为 240.9 亿元, 占比约 5.2%。
在资本的助力下,中国数据库的市场规模将被迅速撬开。
雷锋网原创文章,未经授权禁止转载。详情见转载须知。