9月25日至28日,2021年世界ICV大赛在北京举行。 本届大会围绕产业重建、融合应用、共生三个章节展开,设有开幕式、主论坛和7个主题峰会、6个特色专题会场和2个闭门会议,设有图灵奖国际专家1人、国内外院士7人、近150人的国际国内ICV和ICC 以下是北京四维纵横数据技术有限企业ceo姚延栋的演讲实录,请参考。
北京四维纵横数据技术有限公司首席执行官姚延栋
语音副本:
你好。 我是四维纵横的创始人兼首席执行官姚延栋。 我很高兴今天在会议上做了这个报告。 我报告的主题是超融合时序数据库软件定义汽车数据库。 我不知道你听说过还是知道数据库这个东西,但是越来越多的人可能在掐住脖子的技术中听到了数据库这个词。 it主要有三个基础研究行业,第一个是芯片,第二个是操作系统,第三个是数据库。 数据库和汽车有什么关系? 现在汽车多与数据库相关,特别是ICV,就像今天大会的主题一样,ICV和数据密切相关,智能从哪里来? 智能一定是基于数据的。 互联网传达了什么,传达了什么,传达了数据吗? 汽车逐渐成为数据的来源。 因此,ICV和数据有着非常密切的关系。 今天,我们将向您展示如何使用matrix db发现汽车数据,然后使其成为简单的问题而不是复杂的问题。
我们的团队全部来自greenplum的工厂,向您介绍greenplum。 greenplum是世界闻名的产品,国内包括海外在内有很多商业客户和开源客户。 商业客户涵盖的领域有银行、证券、保险乃至通信制造业等各行各业,开源产品在国内也有很多客户,包括京东、北京东云、北京东云在内的信通院2019年,中国50%的拆解型数据库制造商是开源的green。 我们队是greenplum的工厂队。 我是greenplum北京研发中心的社长,去年离开企业创业。 我们的合作伙伴是greenplum原来的全球产品总监。 我们团队也完美地经历了数据库的十年。 从数据库的跑者到跑者,我们可以看到数百万行代码,但实际上我们并不擅长,所以只能采取农村包围城市的战略。 我们可以建立周边,慢慢得到总部的信任,建立内核的模块。 从一个合二为一,到我们离开,整个greenplum内核模块都是中国队做的
可以看到greenplum6.0。 中70%以上的内核新特点已经是中国队开发的,这也是我们队十年来引以为荣的地方。 十年的过程很长,但我们培养了世界级的数据库内核团队。 这是我们的企业,我们的企业是沉甸甸的年轻企业,说年轻是因为我们去年开始成立的,到今天也有一年多了。 沉甸甸的是,我们整个企业所有团队的成员一直从事数据库内核的开发,至今也是十多年的经验,所以过去的沉淀也是新形势下的下一个结晶。 现在是物联网万物互联的时代,在这个时代数据库的诉求与以前的数据库有很大不同,这最大的不同会带来新的挑战。 我们为了迎接这个挑战或应对这个挑战,提出了新理念。 这是国内的超融合时间序列数据库。 我们于去年8月成立,1月推出世界第一个超融合时序数据库,4月完成天使顾客订单。 他是个庞大的数据收集点,大致达到了数千级。 每个收集点一次收集大约一百个指标,可以计算出总量非常大。 达到10秒水平的收集频率,评价了国内外众多产品,最终选择了我们宣传的产品。
5月发布了4.0,6月发布了4.1,8月发布了4.2。 在这一过程中,我们与麒麟软件等公司进行了战术上的合作,我们的客户数量发展非常迅速,目前成立一年就超过了100家。 这里有多个汽车领域的头部企业,后面场景的例子时也会和大家分享。
现在,什么是超融合时间序列数据库? 说到时间序列数据库,首先必须了解时间序列。 首先介绍时间序列的概念。 这只是一个例子。 以冰箱为例,这里有几个概念。 第一,冰箱有企业品牌、有产地、有上市时期等静态属性,被称为标签。 冰箱还有温度、湿度、耗电量等动态属性,称为指标。 这些指标由各时间点的收集点构成的数字列称为时间序列数据。 也就是说,时间序列数据是时间序列的数据,实际上是非常好的结构化数据。 这个数据为什么重要? 因为在物联网、远程信息技术、产业网络的时代,主体数据成为了时间序列数据,对于这样的数据的解决变得重要起来。
一份报告指出,产生全球网络的物联网设备超过了与网络相连的非物联网设备,到2025年,与网络相连的物联网设备将是非物联网设备的3倍以上 这个量非常庞大,设备数量迅速增加,意味着数据量的爆炸,这还是数量本身。 第二,设备不知道疲倦。 和人产生的数据本质上不同。 人的行为会带来一点数据,所以是被动的方法,设备产生数据是主动的方法。 这两种方法的不同导致了数据量的另一个级别的不同。 所以,未来将面临全新的挑战。 介绍一个场景。 或者,大家可以通过场景感受到。 例如,一家企业有10万辆汽车,其规模并不大。 如果10万辆汽车每秒采取一千个指标,那么每秒就会采取一亿个指标。 事实上,很多汽车远远超过了这一点。 我们看到一些制造商采集的数据达到了5000个指标。 这样可以进行简单的计算。 可以看到,每秒1亿美元,每天24小时365天可以到达8.64万亿美元的数据点。 一个月达到2Pb。 如果汽车没有全天候运转,有些汽车包括卡车将长期运转。 私家车每天产生2、3个小时、3个小时,每天产生1.4万亿美元的数据点。 这些数据量大家不一定有一个心情。 让我们举一个例子作为对象。 虽然数据在银行领域比较大量,但举国内腰以上的银行公司来说,整个数据中心的数据观察业务的主体数据为100-500,10万辆车一个月几百Pb。 这是非常大的数据量,新的数据生成模型会带来新的挑战。 第一个挑战是数据量这么大。 路上实时采集了这么多车,怎么承担? 受得了吗? 受得了吗? 能有效地保存吗? 保存和查询效率不够吗? 这些既是远程信息技术、物联网面临的挑战,也是数据库行业和大数据行业在新时期面临的问题。
矩阵数据库是为解决这一问题而设计的数据库,可以实时收集和实时分解,同时一站式也变得很重要。 这个一站式变得很重要。 不知道这里有没有接触过大的数据和数据相关的技术站,大数据中有非常多很杂的东西,通常要组合十几个左右的产品来处理一个场景。 我们用一个数据库处理时间序列的所有场景。 实时采集实现了高吞吐量、低延迟、高并发性,并确保了数据的准确性,准确、沉重、无损。 数据进入数据库会变得非常容易,对客户来说会变得非常容易。 可以用数据库实现数室业务等各种业务场景,接口也非常简单。 为什么叫超融合? 这里有三个要点。 在第一点上,可以看到数据库中存储了各种类型的数据。 这保证了关系数据,包括时间序列数据、地理位置数据和副本数据。 二是支持不同的场景,可以支持不同的查询类型。 三是在一个数据库中很多数据库diy在一起才能处理的问题,这是超融合的由来。
新产品到达顾客时,顾客的首要问题是不可靠。 虽然说了不靠谱,但我们找了第三方评估机构,分为两类。 可见第一种性能,矩阵数据库特别快。 我们有好几个制造商,包括中文社区对我们的产品进行了评价。 第二个功能方面,性能好,功能差,功能单一,实际上没有用。 为了综合评价我们的功能,我们去了工信部信通院,对两个产品进行了评价。 这也是全国唯一一个通过工信部信通院两个评估的产品,一个是分布式分解型数据库的能力评估,共包括27个必备选项、24个选项、共51个选项。 我们对第二个时序数据库的能力评估包括26个必备选项、7个选项,全部通过了33个项目。
数据库是抽象的,大家平时看不到,可能摸不到。 下面介绍几个例子和场景,大家试着感受一下这是为了什么。
第一个场景是新能源汽车制造车的新势力,其业务发展迅速。 如果关注最近的新能源汽车,特别是头部汽车的销量,销量现在每年都有200%以上的涨幅,这个量非常大,这样的快速增长让过去的技术站陷入了瓶颈,无法支撑未来的业务增长。 我们提供了一个看起来非常简单的计划。 底层有很多车在路上跑,通过传感器的技术。 这项技术是制造商自己的,采集后可以扔到卡夫卡里,通过卡夫卡实时插入数据库。 进入数据库后,剩下的事件只是语言问题,可以支撑智能座舱、图像分解、行为报警等各种业务诉求。 整个方案建成后,大致存储了1 Pb的原始数据,新方案比旧的节省了硬件价格的80%。 过去使用50个节点的集群现在只需要10个。 查询效率提高了100倍以上,从分级下降到秒级。
第二个是电池。 电池充放电的数据价值非常大,制造商根据电池的充放电数据做了一些业务。 过去的体系结构,包括电池的健康检查、警报、流程优化等,都使用了非常缓慢、由来已久的技术体系结构。 新方案表明,采用矩阵数据库,结合机器学习的分解套件,可以实现各种分解场景。 场景落地后,整体数据量为500tb左右,计算开销比过去节省85%,存储开销节省30%,最重要的是时间。 过去进行过一次数据解决,但仅一种就需要10个小时,采用新体系结构后只需要1个小时。 数据观察的效率比以前有了很大的提高。
这是车队管理的例子,燃料维修和人工费很高。 将所有数据整合到matrix db中,包括数量车数据、时序数据、以前流传下来的关系型数据,如任务安排、维修记录、维修记录、采购记录等,通过matrix db强大的存储和计算能力,提供了各种业务支持 包括从未维护的备件
这是一个产品可追溯的场面,国家要求建立可追溯管理平台,包括电池的生产、销售、采用、回收利用在内收集全过程,采用matrix db,是一个非常简单,可以存储所有数据的数据库。 硬件价格节省了30%,性能大幅提高。
这是物流的例子。 我是大卡车司机,需要开具收据。 这个过程过去非常多和复杂。 目前,这项业务被称为网络运输,可以为制造商提供实时定位、位置推送和轨迹查询,实现收据的合法开具。 1天的轨迹数据可以在500毫秒内返回,3天的轨迹可以在1秒内返回。
虽然对几种模式进行了说明,但是不知道大家是否有一致的印象。 其实,我说了很多范式。 唯一的目的是,大数据或物联网领域的大数据应该这么简单。 但是,过去熟悉大数据的人认为这是非常多和复杂的。 因为路线错了。 所以,我们针对过去数据库十几年的沉淀物,提出了超融合时序数据库的全新概念。 也就是说,并不是极简单的数据库本身,而是极简单的因此,过去,客户投入大量的人力和物力,构建大数据平台,构建大数据系统,最终的效果很一般,我们把极简单留给客户的话,
这是我今天的报告。 谢谢你。
会议副本不断增加。 请点击以下链接查看。
网站: auto.gasgoo/newstopiclive/358
移动终端: m.gasgoo/news /主题直播/ 358
标题:“【2021世界智能网联汽车大会】四维纵横姚延栋:车联网从数据到发现内在的一站式数据平台”
地址:http://www.0317jhgd.com//dfqcxw/11880.html