NoSQL: Apache Cassandra快速上手[1]介绍_apache cassandra 使用实例

作者：我家小花儿 | 2024-02-21 20:48:43

踩

apache cassandra 使用实例

0. 介绍

在这里插入图片描述

1. 和MongoDB的区别

在这里插入图片描述

2. key feature

在这里插入图片描述

3. 应用场景

在这里插入图片描述

4. cassandra架构

分布式系统。由节点组成，每个node都平等。共同构成一到多个ring 或者cluster

节点读写操作中的组成部分：

memtable
commitLog
SSTables

单个节点的写入操作：
在这里插入图片描述
单个节点的读取操作：

5. data model

logical entities：tables and keyspaces
我们会在之后教程中详细说明tables和keyspaces的含义与操作。链接如下
Apache Cassandra：数据结构，keyspaces，table相关操作
在这里插入图片描述

执行create, drop, alter等操作，并不会影响在证运行的update 或者查询操作。

本部分说明的例子按照按照如下所示的代码创建。分别创建一个名字为intro_cassandra的keyspace和groups的table.

在这里插入图片描述

上图中最后一行我们需要解释一下：

PRIMARY KEY ((groupid), username)

其中

groupid列被称为Patition key
usernamecolumn 被称作Clustering Key

primary key

primary key 包含两种key，partition key 和 clustering key
1. partition key： mandatory 必须有
2. clustering key(s): optional
与传统关系数据库一样，primarykey需要在创建table的时候申明。
一旦被定义，无法更改
两个主要作用：
1. 优化读取数据的速度：query driven table design(把最常用的query列作为primary key)
2. uniqueness to the entries (这个功能跟之前SQL一样)

插入操作的时候，必须将所有primary key指定col的value填写进去。

partition keys

数据写入的时候，需要按照partition分组进而分布到cluster上的nodes中。这就是partition key的作用。
partition key的hash值被用来决定哪个node来存储写入的数据。也就是说，它决定了数据在cluster中的分布。
partition key -> hash(token) -> Node

拥有相同的patition key的entries存储在唯一的相同的node中。

用图示范一下：

在这里插入图片描述