国产数据库 OceanBase 二次刷榜 TPC-C,7 亿 tpmC

      最后更新:2020-05-22 11:06:17 手机定位技术交流文章

      作者|马超

      生产| csdn (id: csdnnews)

      5月20日,世界权威数据库评估机构TPC发布了最新的评估清单。由蚂蚁金服开发的分布式关系数据库OceanBase以7.07亿的tpmC评估分数再次赢得冠军,并将之前的记录提高了近11倍。

      2019年10月,海洋基地打破了甲骨文公司9年的“垄断”,登上了TPC的巅峰。业内有许多评论称,阿里的第一名不会持续太久,甲骨文和IBM等老牌数据库制造商将很快打破海洋基地的记录。这次,海洋基地对那些反对者的反应最好,直接提高了11倍。

      除了tmpC之外,TPC-C评估还有另一个重要的指标,就是将系统的总价格除以tmpC得分,得到性价比指标(Price/tpmC)。

      在这个指数中,海洋数据库的价格为3.98元/吨,比甲骨文的Orcale数据库转换后的价格低了近50%。其中最关键的一点是Orcale在TPC-C中使用顶级的专用设备,计算集群使用108个T3 SPARC处理器、1728个物理内核和13824个执行线程,同时使用97个COMSTAR专用存储设备。这些存储设备经过特别优化,使用英特尔服务器作为存储头。

      Oceanbase部署在1557增强型阿里云ECS i2d服务器上,不使用特殊存储。数据库的性能非常依赖于服务器的计算和输入/输出能力。在这一点上,阿里云公司的ECS i2d配备了英特尔至强白金8163处理器和NVMe固态硬盘。同时,其网络性能也达到了25G带宽和400万PPS转发能力,这使得i2d适用于各种数据库应用场景,如OLTP、NoSQL和数据仓库。可以说,阿里获得了冠军,这不仅体现了阿里在数据库研发方面的实力,也体现了阿里云基础设施ECS的高性能和稳定性。

      在200行代码中,作者解释了国内数据库OceanBase的速度来源!如中所述,海洋数据库是一个基于Paxos分布式协议架构的数据库,其设计如布隆过滤器等。所有这些都解决了性能优化问题,这里不再重复。除了性能,海洋基地最大的亮点是其HTAP的混合属性,这使海洋基地能够解决行业中的许多棘手问题。

      HTAP是由Garnter在2014年提出的:混合事务/分析处理(HTAP)是一种新兴的应用架构,可兼容两种业务场景。HTAP混合交易/分析处理(HTAP混合交易/分析处理)不仅保持了原有的在线交易功能,还强调了数据库本地计算和分析的能力。支持混合负载的数据库可以避免传统架构中在线和离线数据库之间的大量数据交互,还可以对最新的业务数据进行实时统计分析。简单地说,TP可以被认为是战斗机的敏捷和快速的属性,而AP相当于一架具有大有效载荷和强大动力的轰炸机。海洋基地是这种混合战斗机的模型。

      原产地HTAP

      HTAP的出现主要是由于今天这个伟大时代的数据与以前相比发生了明显的变化。根据作者在银行业的观察,目前有几种类型的数据生产者:

      第一类是应用程序生成的数据。最早的数据生成机制是应用系统的副产品,也就是说,应用程序生成数据。为了满足业务需求,有必要建立一个业务信息系统。随着信息技术业务系统的不断运行,产生了大量的应用数据。这些数据由ETL处理到数据仓库中,以便为业务应用程序重新处理。这些数据是单个关系数据,数据量为10gb。这些数据可以使用早期的传统关系数据库和数据仓库来处理。

      第二种类型是行为生成数据。随着互联网和电子商务的快速发展,大量由人们的操作和使用行为产生的数据,如谷歌和脸书等数据互联公司,都记录了人的形成所产生的数据。互联网浏览、购买、评论、微博、玩颤音和其他行为会产生大量数据。这些数据不再是单一的结构化数据,而是有大量的文档、音频和视频数据,数据级别为TB级。第三类是机器生成的数据。进入物联网时代,大量机器传感器和物联网设备将产生大量数据。这些设备每天7*24小时以各种格式生成数据,包括日志数据、时间序列数据、网格数据等。数据的数量级是PB。

      由于处理数据的规格、速度和多样性的根本变化,它不仅支持数万亿记录数据库表的处理,还支持分析场景。然而,传统的TP数据库支持事务处理业务,将数据输出会给AP分析报告的使用。不能看到实时的战报结果,不能满足时间要求。传统的关系数据库、数据仓库和大数据Nosql数据库不支持这种变化。因此,以海洋基地为代表的HTAP数据库开始兴起。

      大数据时代的秘密-只有快速且牢不可破

      传统的数据消费者通常是决策层的领导者。业务系统生成数据时,通过ETL处理进入数据仓库,通过数据主题设计和统计汇总形成KPI仪表板,为领导决策者提供服务,领导决策者根据数据分析结果进行宏观决策服务。因此,管理层不仅需要跟踪前一天的数据。传统的纯AP或TP数据库需要适应这种背景下的节奏。

      随着移动互联网时代的到来,产生了大量个性化服务需求,数据分析结果不再推给公司管理层,而是提供给一线营销人员直接使用。

      例如,海洋基地支持阿里母亲的广告报告查询,这大大提高了数据的实时性。另一个例子是,银行的移动开瓶器系统现在需要向财富管理经理实时提供一系列个性化指标,例如利息结算和主要客户的净值,在线用户超过6万,每秒钟至少有500个并发交易。所有这些场景都需要基于实时数据的分析,传统的由TP和AP共享的数据库已经不能满足需求。

      海洋基地让数据变得有价值

      随着数据量的增加,传统的单机IOE计算框架已经转变为分布式计算框架,再次实现了移动数据和移动程序之间的传输。

      在传统的IOE计算框架下,数据在不同的业务系统之间移动。在分布式计算的框架下,数据存储在HDFS文件系统中,磁流变程序根据不同的业务需求进行数据处理。当数据库的计算框架从独立计算框架转变为分布式计算框架时,整个信息技术业务应用系统的架构也发生了根本性的变化。

      在传统业务系统中,数据从核心业务系统迁移到数据仓库系统,然后迁移到模型分析系统。

      在新一代大数据应用系统中,在大数据架构下,数据可以通过实时事务、数据分析和机器学习同时处理,无需迁移,大大提高了数据利用率和工作效率。在大数据架构下,如果您想增加数据的价值,就必须减少不必要的移动。这需要一个全新的数据库架构系统来支持。可以说,只有采用HTAP数据库体系结构的系统才能满足实时数据分析结果的需要,而海洋基地正是在这种背景下构想出来的。

      为了支持上述三种趋势,数据库将不仅处理业务操作,还将有许多场景的数据实时应用于业务实时数据监控、数据报告和决策支持。OLTP和OLAP在传统架构中是完全分离的。二者的隔离导致了整个系统的数据一致性,给数据平台的管理带来了很大的障碍。

      以前,关系数据库管理系统和大数据(Hadoop)是数据处理的两个方面。一旦一个架构选择了一个场景,它就不得不放弃另一个。因此,以海洋数据库为代表的HTAP混合数据库最终将成为数据库发展的新要求,必将成为数据库发展的主流。

      最后,作者认为,海洋基地新的TPC将大大增强中国人对国内基础软件的信心。

      本文由 在线网速测试 整理编辑,转载请注明出处,原文链接:https://www.wangsu123.cn/news/7257.html

          热门文章

          文章分类