Cassandra中的Primary Key、Partition Key、Clustering Key都是什么?
Cassandra中的Key有如下三种类型
- Primary Key
- Partitioning Key
- Clustering Key
Primary Key 主键
每张表都需要有主键。主键可以是一个字段或者多个字段的组合。每条记录的主键必须唯一。举个例子
1 | CREATE TABLE player ( |
这个数据表的主键有多个字段,称做复合主键。
分区键
Cassandra根据分区键,使用一致性哈希算法,把数据分配到集群的各个机器上。一个机器可以包含多个分区。Cassandra保证同一分区键的数据都在一台机器上。通过合理的设置分区键,可以让你的查询让尽量少的机器处理,提升查询的效率
对于单主键字段来说,分区键和主键是同一个字段。
对于复合主键字段来说,默认情况下,分区键是复合主键的第一个字段。如上例中,分区键是club字段
可以通过括号来将分区键指定为多个字段,如将上面CQL的11行修改为
1 | PRIMARY KEY ((name, club), league, kit_number, position, goals) |
Clustering Key
Clustering Keys决定了分区内数据的排序。让我们再看一下最初的例子
1 | CREATE TABLE player ( |
在主键中的字段,除了分区键外都是clustering key。既然club是主键,那么league name kit_number position goals是Clustering key。你可以定义clustering key中每个字段的升降序。可以将kit_number降序、goals升序
排序顺序与主键中字段的顺序相同。因此,在上面的例子中,数据是按照如下布局的
- 所有相同
club的运动员都将分在同一个分区 - 在分区内,按照
leauge排序 - 然后按照
name排序 - 然后按照
kit_number排序 - …
定义不同字段升降序的语法如下(默认为升序)
1 | CREATE TABLE player ( |