最近更新时间:2024-05-23 00:30:47
在许多业务场景中,数据的处理需求不是恒定不变的,往往呈现出明显的峰谷变化。在这些场景中数据查询和分析的需求可能会猛增且需求增量难以提前预估。传统的云数据仓库解决方案虽然支持一定程度的弹性,但是却无法做到实时弹性伸缩,导致用户往往需要按照峰值场景订阅更多的云数据仓库资源,造成了 80% 甚至更多的资源浪费。这无疑增加了企业的运营成本。
Relyt 的 DPS 集群支持多种类型、多种规格、按需部署、按需变配、自动启停,具备高度的可扩展性,能够在业务高峰期迅速扩展资源,满足激增业务需求,避免因资源不足而影响业务运行。当业务高峰过去,多余的 DPS 集群能够自动暂停服务,且暂停服务期间不会产生任何费用。此外,Relyt 的特性 AQS(Adaptive Query Scaling) 能够在 DPS 运行时识别出大查询并通过将这些大查询调度到共享计算资源池中进行处理,从而保证了 DPS 集群的正常业务的稳定运行,同时也满足了非预期大查询的执行需求。
在传统数据处理场景中,存储往往是计算之外另一个困扰企业的主要瓶颈。不同的计算引擎和系统可能需要存储多份冗余数据,这不仅增加了存储成本,也使得数据管理变得复杂。这样的问题在需要处理大量数据的企业中尤其突出,如游戏、SaaS、金融、电商和物联网等领域。
Relyt 的向量化计算引擎 DPS 支持行列混存,使得 Relyt 在全局只需维护一份数据,无需冗余备份。此外,Relyt 通过创新性的产品设计,例如 Sort Key 裁剪,显著减少了系统的 I/O 操作,至多可降低 99%。此外,在行列混存基础上,Relyt 支持自适应选择压缩算法和编码方式,保证了 I/O 的高效率,从而实现存储成本最小化。
数据处理是一个复杂的过程,而数据链路的复杂性往往是难点中的难点。通常情况下,数据需要经过多个系统和工具进行 ETL(提取、转换、加载),这不仅使得数据流程变得复杂,也大大增加了运维的难度和成本。尤其是在需要进行试错的情况下,复杂的数据链路可能会使得试错成本极高。
Relyt 数据云支持结构化、半结构化等多种格式的数据,分析型、事务型、数据科学 & AI 等多种数据负载,在 Relyt 数据云上,无需 ETL 即可一站式完成数据存储、数据查询和数据分析等核心业务需求,将数据处理难度降至最小的同时,保证了数据的实时性。
随着业务的发展,数据不断增长,而许多企业的已有数据仓库系统困于资源、性能等瓶颈,无法满足企业随着业务发展所带来的数据存储、计算、分析等相关需求,亟需一套能够快速根据业务变化进行敏捷调整的系统,业务的变化带来数据分析的稳定性问题。例如新增业务 SQL 影响正在运行的业务,导致“不敢用”的问题。
Relyt 提供了卓越的实时性、弹性和可靠性,采用“存算分离 + SHARED-DATA”架构, 计算资源实例 DPS 集群支持按需部署、按需扩展、自动启停,以及以查询为粒度的自适应计算资源扩展,灵活应对业务变化的敏捷需求。
随着企业业务的发展,数据量呈现出爆炸性的增长。新的业务SQL查询可能需要扫描大量的数据,这将消耗大量的数据仓库系统计算资源。如果系统资源分配不当或者处理能力不足,可能会影响到线上正在运行的业务,导致系统运行不稳定。预留足够的资源往往又意味着高额的资源成本。
其次,随着业务并发量的增加,数据写入并发和数据查询并发也会相应增大。这同样会消耗大量的数据仓库系统计算资源。如果系统无法有效地处理高并发请求,也可能会影响到线上正在运行的业务,导致系统运行不稳定。因此,数据仓库系统需要具备高并发处理能力,能够在高并发情况下,保持系统的稳定运行。
随着AI的技术发展,尤其是大语言模型的横空出世,非结构化数据分析成为可能。Relyt 提供结构化数据和非结构化数据(向量)的融合检索与分析,使用SQL接口就可以快速的搭建起视频、音频、图片、文本等非结构化数据与结构化数据混合检索等功能。
纯净模式