“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”-东方汽车时报

9月25日至28日，2021年世界ICV大赛在北京举行。本届大会围绕产业重建、融合应用、共生三个章节展开，设有开幕式、主论坛和7个主题峰会、6个特色专题会场和2个闭门会议，设有图灵奖国际专家1人、国内外院士7人、近150人的国际国内ICV和ICC 以下是北京四维纵横数据技术有限企业ceo姚延栋的演讲实录，请参考。

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

北京四维纵横数据技术有限公司首席执行官姚延栋

语音副本:

你好。我是四维纵横的创始人兼首席执行官姚延栋。我很高兴今天在会议上做了这个报告。我报告的主题是超融合时序数据库软件定义汽车数据库。我不知道你听说过还是知道数据库这个东西，但是越来越多的人可能在掐住脖子的技术中听到了数据库这个词。 it主要有三个基础研究行业，第一个是芯片，第二个是操作系统，第三个是数据库。数据库和汽车有什么关系？现在汽车多与数据库相关，特别是ICV，就像今天大会的主题一样，ICV和数据密切相关，智能从哪里来？智能一定是基于数据的。互联网传达了什么，传达了什么，传达了数据吗？汽车逐渐成为数据的来源。因此，ICV和数据有着非常密切的关系。今天，我们将向您展示如何使用matrix db发现汽车数据，然后使其成为简单的问题而不是复杂的问题。

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

我们的团队全部来自greenplum的工厂，向您介绍greenplum。 greenplum是世界闻名的产品，国内包括海外在内有很多商业客户和开源客户。商业客户涵盖的领域有银行、证券、保险乃至通信制造业等各行各业，开源产品在国内也有很多客户，包括京东、北京东云、北京东云在内的信通院2019年，中国50%的拆解型数据库制造商是开源的green。我们队是greenplum的工厂队。我是greenplum北京研发中心的社长，去年离开企业创业。我们的合作伙伴是greenplum原来的全球产品总监。我们团队也完美地经历了数据库的十年。从数据库的跑者到跑者，我们可以看到数百万行代码，但实际上我们并不擅长，所以只能采取农村包围城市的战略。我们可以建立周边，慢慢得到总部的信任，建立内核的模块。从一个合二为一，到我们离开，整个greenplum内核模块都是中国队做的

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

可以看到greenplum6.0。中70%以上的内核新特点已经是中国队开发的，这也是我们队十年来引以为荣的地方。十年的过程很长，但我们培养了世界级的数据库内核团队。这是我们的企业，我们的企业是沉甸甸的年轻企业，说年轻是因为我们去年开始成立的，到今天也有一年多了。沉甸甸的是，我们整个企业所有团队的成员一直从事数据库内核的开发，至今也是十多年的经验，所以过去的沉淀也是新形势下的下一个结晶。现在是物联网万物互联的时代，在这个时代数据库的诉求与以前的数据库有很大不同，这最大的不同会带来新的挑战。我们为了迎接这个挑战或应对这个挑战，提出了新理念。这是国内的超融合时间序列数据库。我们于去年8月成立，1月推出世界第一个超融合时序数据库，4月完成天使顾客订单。他是个庞大的数据收集点，大致达到了数千级。每个收集点一次收集大约一百个指标，可以计算出总量非常大。达到10秒水平的收集频率，评价了国内外众多产品，最终选择了我们宣传的产品。

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

5月发布了4.0，6月发布了4.1，8月发布了4.2。在这一过程中，我们与麒麟软件等公司进行了战术上的合作，我们的客户数量发展非常迅速，目前成立一年就超过了100家。这里有多个汽车领域的头部企业，后面场景的例子时也会和大家分享。

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

现在，什么是超融合时间序列数据库？说到时间序列数据库，首先必须了解时间序列。首先介绍时间序列的概念。这只是一个例子。以冰箱为例，这里有几个概念。第一，冰箱有企业品牌、有产地、有上市时期等静态属性，被称为标签。冰箱还有温度、湿度、耗电量等动态属性，称为指标。这些指标由各时间点的收集点构成的数字列称为时间序列数据。也就是说，时间序列数据是时间序列的数据，实际上是非常好的结构化数据。这个数据为什么重要？因为在物联网、远程信息技术、产业网络的时代，主体数据成为了时间序列数据，对于这样的数据的解决变得重要起来。

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

一份报告指出，产生全球网络的物联网设备超过了与网络相连的非物联网设备，到2025年，与网络相连的物联网设备将是非物联网设备的3倍以上这个量非常庞大，设备数量迅速增加，意味着数据量的爆炸，这还是数量本身。第二，设备不知道疲倦。和人产生的数据本质上不同。人的行为会带来一点数据，所以是被动的方法，设备产生数据是主动的方法。这两种方法的不同导致了数据量的另一个级别的不同。所以，未来将面临全新的挑战。介绍一个场景。或者，大家可以通过场景感受到。例如，一家企业有10万辆汽车，其规模并不大。如果10万辆汽车每秒采取一千个指标，那么每秒就会采取一亿个指标。事实上，很多汽车远远超过了这一点。我们看到一些制造商采集的数据达到了5000个指标。这样可以进行简单的计算。可以看到，每秒1亿美元，每天24小时365天可以到达8.64万亿美元的数据点。一个月达到2Pb。如果汽车没有全天候运转，有些汽车包括卡车将长期运转。私家车每天产生2、3个小时、3个小时，每天产生1.4万亿美元的数据点。这些数据量大家不一定有一个心情。让我们举一个例子作为对象。虽然数据在银行领域比较大量，但举国内腰以上的银行公司来说，整个数据中心的数据观察业务的主体数据为100-500，10万辆车一个月几百Pb。这是非常大的数据量，新的数据生成模型会带来新的挑战。第一个挑战是数据量这么大。路上实时采集了这么多车，怎么承担？受得了吗？受得了吗？能有效地保存吗？保存和查询效率不够吗？这些既是远程信息技术、物联网面临的挑战，也是数据库行业和大数据行业在新时期面临的问题。

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

矩阵数据库是为解决这一问题而设计的数据库，可以实时收集和实时分解，同时一站式也变得很重要。这个一站式变得很重要。不知道这里有没有接触过大的数据和数据相关的技术站，大数据中有非常多很杂的东西，通常要组合十几个左右的产品来处理一个场景。我们用一个数据库处理时间序列的所有场景。实时采集实现了高吞吐量、低延迟、高并发性，并确保了数据的准确性，准确、沉重、无损。数据进入数据库会变得非常容易，对客户来说会变得非常容易。可以用数据库实现数室业务等各种业务场景，接口也非常简单。为什么叫超融合？这里有三个要点。在第一点上，可以看到数据库中存储了各种类型的数据。这保证了关系数据，包括时间序列数据、地理位置数据和副本数据。二是支持不同的场景，可以支持不同的查询类型。三是在一个数据库中很多数据库diy在一起才能处理的问题，这是超融合的由来。

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

新产品到达顾客时，顾客的首要问题是不可靠。虽然说了不靠谱，但我们找了第三方评估机构，分为两类。可见第一种性能，矩阵数据库特别快。我们有好几个制造商，包括中文社区对我们的产品进行了评价。第二个功能方面，性能好，功能差，功能单一，实际上没有用。为了综合评价我们的功能，我们去了工信部信通院，对两个产品进行了评价。这也是全国唯一一个通过工信部信通院两个评估的产品，一个是分布式分解型数据库的能力评估，共包括27个必备选项、24个选项、共51个选项。我们对第二个时序数据库的能力评估包括26个必备选项、7个选项，全部通过了33个项目。

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

数据库是抽象的，大家平时看不到，可能摸不到。下面介绍几个例子和场景，大家试着感受一下这是为了什么。

第一个场景是新能源汽车制造车的新势力，其业务发展迅速。如果关注最近的新能源汽车，特别是头部汽车的销量，销量现在每年都有200%以上的涨幅，这个量非常大，这样的快速增长让过去的技术站陷入了瓶颈，无法支撑未来的业务增长。我们提供了一个看起来非常简单的计划。底层有很多车在路上跑，通过传感器的技术。这项技术是制造商自己的，采集后可以扔到卡夫卡里，通过卡夫卡实时插入数据库。进入数据库后，剩下的事件只是语言问题，可以支撑智能座舱、图像分解、行为报警等各种业务诉求。整个方案建成后，大致存储了1 Pb的原始数据，新方案比旧的节省了硬件价格的80%。过去使用50个节点的集群现在只需要10个。查询效率提高了100倍以上，从分级下降到秒级。

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

第二个是电池。电池充放电的数据价值非常大，制造商根据电池的充放电数据做了一些业务。过去的体系结构，包括电池的健康检查、警报、流程优化等，都使用了非常缓慢、由来已久的技术体系结构。新方案表明，采用矩阵数据库，结合机器学习的分解套件，可以实现各种分解场景。场景落地后，整体数据量为500tb左右，计算开销比过去节省85%，存储开销节省30%，最重要的是时间。过去进行过一次数据解决，但仅一种就需要10个小时，采用新体系结构后只需要1个小时。数据观察的效率比以前有了很大的提高。

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

这是车队管理的例子，燃料维修和人工费很高。将所有数据整合到matrix db中，包括数量车数据、时序数据、以前流传下来的关系型数据，如任务安排、维修记录、维修记录、采购记录等，通过matrix db强大的存储和计算能力，提供了各种业务支持包括从未维护的备件

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

这是一个产品可追溯的场面，国家要求建立可追溯管理平台，包括电池的生产、销售、采用、回收利用在内收集全过程，采用matrix db，是一个非常简单，可以存储所有数据的数据库。硬件价格节省了30%，性能大幅提高。

这是物流的例子。我是大卡车司机，需要开具收据。这个过程过去非常多和复杂。目前，这项业务被称为网络运输，可以为制造商提供实时定位、位置推送和轨迹查询，实现收据的合法开具。 1天的轨迹数据可以在500毫秒内返回，3天的轨迹可以在1秒内返回。

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”

虽然对几种模式进行了说明，但是不知道大家是否有一致的印象。其实，我说了很多范式。唯一的目的是，大数据或物联网领域的大数据应该这么简单。但是，过去熟悉大数据的人认为这是非常多和复杂的。因为路线错了。所以，我们针对过去数据库十几年的沉淀物，提出了超融合时序数据库的全新概念。也就是说，并不是极简单的数据库本身，而是极简单的因此，过去，客户投入大量的人力和物力，构建大数据平台，构建大数据系统，最终的效果很一般，我们把极简单留给客户的话，

“【2021世界智能网联汽车大会】四维纵横姚延栋：车联网从数据到发现内在的一站式数据平台”