欧博在线
热门标签

香港六合彩娱乐城网站忘记密码找回_在 Apache Cassandra 中界说和优化数据分区

时间:2023-10-30 08:51    点击次数:72
香港六合彩娱乐城网站忘记密码找回

[[430514]]

速率和可扩张性是 Apache Cassandra 不变的追求;来学习一下若何充分施展它的专长吧。

Apache Cassandra 是一个数据库,但又不是一个简便的数据库;它是一个复制数据库,专为可扩张性、高可用性、低延长和精致性能而设想和谐。Cassandra 不错帮你的数据在区域性中断、硬件故障时,以及许多管制员觉得数据量过多的情况下避免于难。

赌博网上在线娱乐场

全面掌抓数据分区常识,你就能让 Cassandra 集群收场精致的设想、极高的性能和可扩张性。在本文中,我将沟通若何界说分区,Cassandra 若何使用这些分区,以及一些你应该了解的最好试验决策和已知问题。

爆发力

基本主见是这么的: 供数据库要津函数(如数据分发、复制和索引化)使用的原子单位,单个这么的数据块即是一个分区。散播式数据系统频繁会把传入的数据分拨到这些分区中,使用简便的数学函数(举例 identity 或 hashing 函数)实行分区历程,并用得到的 “分区键” 对数据分组,进一步再造要素区。举例,假定传入数据是处事器日记,使用 “identity” 分区函数和每个日记的时辰戳(四舍五入到小时值)看成分区键,咱们不错对这些数据进行分区,收场每个分区各保存一小时的日记的主张。

Cassandra 中的数据分区

Cassandra 看成散播式系统启动,何况合乎前述数据分区原则。使用 Cassandra,数据分区依赖于在集群级别配置的算法和在表级别配置的分区键。

 

Cassandra data partition

皇冠客服飞机:@seo3687

Cassandra 查询言语(CQL)使用民众很闇练的 SQL 表、行、列等术语。在上头的示例图中,表配置的主键中包含了分区键,具体规律为:主键Primary Key = 分区键Partition Key + [聚簇列Clustering Columns] 。

皇冠官网

Cassandra 中的主键既界说了唯独的数据分区,也包含着分区内的数据陈设依据信息。数据陈设信息取决于聚簇列(非必需项)。每个唯独的分区键代表着处事器(包括其副本场所的处事器)中管制的些许行。

在 CQL 中界说主键

接下来的四个示例演示了若何使用 CQL 语法线路主键。界说主键会让数据行分到不同的纠合里,频繁这些纠合即是分区。

皇冠正规足球 界说神志 1(分区键:log_hour,聚簇列:无)
CREATE TABLE server_logs(   log_hour TIMESTAMP PRIMARYKEY,   log_level text,   message text,   server text   )

这里,有疏导 log_hour 的扫数行齐会参加兼并个分区。

界说神志 2(分区键:log_hour,聚簇列:log_level)
CREATE TABLE server_logs(   log_hour TIMESTAMP,   log_level text,   message text,   server text,   PRIMARY KEY (log_hour, log_level)   )

此界说神志与神志 1 使用了疏导的分区键,但此神志中,每个分区的扫数行齐会按 log_level 升序陈设。

网站忘记密码找回 界说神志 3(分区键:log_hour,server,聚簇列:无)
CREATE TABLE server_logs(   log_hour TIMESTAMP,   log_level text,   message text,   server text,   PRIMARY KEY ((log_hour, server))   )

在此界说中,server 和 log_hour 字段齐疏导的行才会参加兼并个分区。

www.royalcrownbetzonehomehub.com太阳城赌博网站 界说神志 4(分区键:log_hour,server,聚簇列:log_level)
CREATE TABLE server_logs(   log_hour TIMESTAMP,   log_level text,   message text,   server text,   PRIMARY KEY ((log_hour, server),log_level)   )WITH CLUSTERING ORDER BY (column3 DESC);

此界说神志与神志 3 分区疏导,但分区内的行会依照 log_level 降序陈设。

今年的WCG采用的是中韩对抗赛的形式,WCG2019冠军Infi和WCG2020双冠王Fly(个人赛+团队赛)将代表中国队,迎战Moon和FoCuS(两人均为WCG2020团队赛冠军)领衔的韩国队。比赛将进行2场1v1比赛和1场2v2比赛(均为BO3),获得2场胜利(或以上)的队伍取得最后的胜利。

Cassandra 若何使用分区键

Cassandra 依靠分区键来敬佩在哪个节点上存储数据,以及在需要时定位数据。Cassandra 通过检察表中的分区键来实行这些读取和写入操作,并使用令牌tokens(一个 -2^{63}−263 到 +2^{63}-1+263−1 范围内的 long 类型值)来进行数据散播和索引。这些令牌通过分区器映射到分区键,分区器使用了将分区键搬动为令牌的分区函数。通过这种令牌机制,Cassandra 集群的每个节点齐领有一组数据分区。然后分区键在每个节点上启用数据索引。

 

对于喜欢皇冠体育博彩的人来说,只有拥有足够的知识和技巧,才能在激烈的竞争中获得优势。

Cassandra cluster with 3 nodes and token-based ownership

皇冠体育hg86a

图中裸露了一个三节点的 Cassandra 集群以及相应的令牌范围分拨。这仅仅一个简便的线路图:具体收场历程使用了 Vnodes。

数据分区对 Cassandra 集群的影响

用心的分区键设想对于收场用例的理思分区大小至关进击。合理的分区不错收场均匀的数据散播和弘大的 I/O 性能。分区大小对 Cassandra 集群有些许需要着重的影响:

皇冠信用盘搭建 读取性能 —— 为了在磁盘上的 SSTables 文献中找到分区,Cassandra 使用缓存、索引和索引纲目等数据结构。过大的分区会镌汰这些数据结构的珍重后果,从而对性能产生负面影响。Cassandra 新版块在这方面取得了长足的卓绝:相配是 3.6 偏激以上版块的 Cassandra 引擎引入了存储阅兵,针对大型分区,不错提供更好的性能,以及更强的鄙俗内存问题和崩溃的弹性。 内存使用 —— 大分区会对 JVM 堆产生更大的压力,同期分区的增大也镌汰了垃圾网络机制的后果。 Cassandra 建树 —— 大分区使 Cassandra 实行建树珍重操作(通过跨副本比较数据来保持数据一致)时愈加费劲。 “墓碑”删除 —— 听起来可能有点骇东说念主,Cassandra 使用称为“墓碑tombstones”的私有标志来纪录要删除的数据。若是莫得合适的数据删除形状和压缩计谋,大分区会使删除历程变得愈加费劲。

天然这些影响可能会让东说念主更倾向于简便地设想能产生小分区的分区键,但数据探访形状对理思的分区大小也有很大影响(干系更多信息,请阅读对于 Cassandra 数据建模 的长远莳植)。数据探访形状不错界说为表的查询神志,包括表的扫数 select 查询。 理思情况下,CQL 聘请查询应该在 where 子句中只使用一个分区键。也即是说,当查询不错从单个分区,而不是许多较小的分区取得所需数据时,Cassandra 是最有后果的。

分区键设想的最好试验

罢职分区键设想的最好试验原则,这会帮你得到理思的分区大小。字据训诫,Cassandra 中的最大分区应保持在 100MB 以下。理思情况下,它应该小于 10MB。天然 Cassandra 3.6 偏激以上版块能更好地扶植大分区,但也必须对每个责任负载进行仔细的测试和基准测试,以确保分区键设想约略扶植所需的集群性能。

具体来说,这些最好试验原则适用于任何分区键设想:

分区键的筹算必须是将理思数目的数据放入每个分区,以扶植其探访形状的需求。 分区键应谢却无界分区:那些大小可能跟着时辰无尽增长的分区。举例,在上头的 server_logs 示例中,跟着处事器日记数目的欺压增多,使用处事器列看成分区键就会产生无界分区。比拟之下,使用 log_hour 将每个分区收场为一个小时数据的决策会更好。 分区键还应避免产陌生区歪斜,即分区增长不均匀,有些分区可能跟着时辰的推移而不受收场地增长。在 server_logs 示例中,在一台处事器生成的日记远多于其他处事器的情况下使用处事器列会产陌生区歪斜。为了避免这种情况,不错从表中引入另一个属性来强制均匀散播,即使要创建一个凭空列来这么作念,亦然值得的。 使用时辰元素和其他属性的组合分区键,这对时辰序列数据分区很有匡助。这种神志不错驻扎无界分区,使探访形状约略在查询特定数据时使用时辰属性,而且约略对特定时辰段内的数据进行删除。上头的每个示例齐使用了 log_hour 时辰属性来演示这小数。

还有一些器具可用于匡助测试、分析和监控 Cassandra 分区,以搜检所选形状是否高效。通过仔细设想分区键,使处分决策的数据和需求保持一致,并罢职最好试验原则来优化分区大小,你就不错充分行使数据分区welcome诚博手机版app,更好地施展 Cassandra 的可扩张性和性能后劲。 



上一篇:火博体育官网博彩篮球 | 安全东说念主员走漏iOS粗心:阁下HomeKit让iPhone瘫痪
下一篇:uG环球三公博彩平台游戏改进建议_输不起! 国度德比遭绝杀后, 哈维说输球不公谈, 莱万说皇马不配赢

网友评论