赞
踩
本文是《SQL必知必会》一书的精华总结,帮助读者快速入门SQL或者MySQL,主要内容包含:
下面的思维导图中记录了这本书的整体目录结构,包含内容有:
个人增加了一章:Python操作游标
本章中主要是介绍了数据库和SQL相关的基本知识和术语。
数据库是一个以某种有组织的方式存储的数据集合。数据库是一个保存有组织的数据容器,通常是一个文件或者一组文件
表示一种结构化的文件,可以用来存储某种特定的数据类型。表是某种特定类型数据的结构化清单。
存储在表中的数据是同一种类型的数据或者清单
数据库中的每个表都有自己的名字,并且这个表是唯一的。
表是由列组成的,列存储表中某部分的信息。列是表中的某个字段。所有的表都是由一个或者多个列组成的。
数据库中的每个列都应该是具有的相同数据类型datatype。数据类型定义了列可以存储哪些数据类型。
表中的数据是按照行来进行存储的,所保存的每个记录存储在自己的行内。如果把表想象成一个网格,那么网格中垂直的列则为表列,水平则为表行。
行表示的是一个记录。行有时候也称之为记录。
表中每一行都应该都有一列或者几列来唯一标识自己。主键用来表示一个特定的行。
主键:一列或者几列,其值能够标识表中每行。
如果表中的列可以作为主键,则它必须满足:
首先我们看一段来自百度百度的解释:
结构化查询语言(Structured Query Language)简称SQL,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。
SQL是一种专门和数据库沟通的语言
1、SQL不是某个特定数据库供应商专有的语言,几乎所有的DBMS都是支持SQL
2、SQL简单易学。它的语句都是由简单的、具有描述性的英文单词组成的
3、SQL虽然简单,但是实际上是一种很强有力的语言,灵活使用去语言元素,可以进行复杂和高级的数据库操作
本章中介绍的是如何使用select语句从表中检索一个或者多个数据列。
每个SQL语句多有一个或者多个关键字组成,最经常使用的就是select关键字。它的用途是从一个或者多个表中检索出来信息。为了使用select检索数据,必须至少给出两个信息:
SELECT prod_name -- 检索什么
FROM Products; -- 从哪里检索
下面关于SQL的语句做几点笔记:
;
结尾;如果是单条不加分号也是可以的,但是最好加上SELECT
和select
是相同的。但是一般规范的写法是:SQL关键字进行大写,列名和表名是小写的-- 写法1 SELECT prod_name -- 检索什么 FROM Products; -- 从哪里检索 -- 写法2 SELECT prod_name FROM Products; -- 写法3 SELECT prod_name FROM Products; -- 写法:个人习惯写法 SELECT prod_name FROM Products;
SELECT pro_id,prod_name,prod_price
FROM Products;
-- 个人写法
SELECT
pro_id,
prod_name,
prod_price
FROM Products;
SELECT * -- *代表所有列
FROM Products;
SELECT DISTINCT vend_id
FROM products;
SQL中的DISTINCT
关键字表示的是去重,只返回不同的值。它必须放在列的前面。
不能部分使用DISTINCT
关键字。它是作用于所有的列
SELECT DISTINCT vend_id, prod_price -- DISTINCT作用于所有的列,并不仅仅是后面的列
如果不加限制条件,SQL返回的是全部数据。如果我们想只显示部分数据,该如何实现?
1、SQL Server 和 Access
SELECT TOP 5 prod_name -- 最多返回5行
FROM Products;
2、DB2
SELECT prod_name
FROM Products
FETCH FIRST 5 ROWS ONLY; -- 字面意思:显示前5行
3、Oracle
SELECT prod_name
FROM Products
WHERE ROWNUM <= 5;
4、MySQL、MariaDB、PostgreSQL、SQLite
使用关键字limit
SELECT prod_name
FROM Products
LIMIT 5; -- 使用LIMIT5
关于LIMIT的笔记:
SELECT prod_name
FROM Products
LIMIT 4 OFFSET 5; -- 第5行开始显示4行数据
-- 简化版本
SELECT prod_name
FROM Products
LIMIT 5,4 -- 效果同上
SQL中的注释分为两种:单行注释和多行注释
单行注释使用—
符号,后面跟上注释的内容:
SELECT prod_name -- 这里是一条注释,你可以写点注释
FROM Products
LIMIT 4 OFFSET 5;
多行注释使用一对/*
,符号之间的内容就是注释:
/*
注释1:SQL语句的作用是什么
注释2:SQL语句谁在什么时候写的
*/
SELECT prod_name
FROM Products
LIMIT 4 OFFSET 5;
本节中介绍的是如何利用order by子句来对select检索的结果进行排序。为了明确地排序用select语句检索出来的数据,可使用order by子句取一个或者多个列的名字,来对输出结果进行排序。
SELECT prod_name
FROM Products
ORDER BY prod_name; -- 根据产品名称的字母进行排序
笔记:我们需要注意order by子句的位置,一定要保证它是select语句的最后一条子句。如果它不是最后的子句,那么就会报错。
在实际的需求中,我们经常会遇到根据多个列进行排序。比如根据员工的姓名排序,如果姓相同,再根据名字进行排序。
要按多个列进行排序,指定列名即可,列名之间使用逗号隔开。
SELECT prod_id,prod_price,prod_name -- 选择3个列
FROM Products
ORDER BY prod_price,prod_name; -- 先根据价格排序,如果有相同的价格再根据姓名排序
笔记:只有当prod_price有相同的值,才会根据prod_name进行排序
除了可以使用列名指出排序顺序外,order by还支持使用相对位置进行排序。
SELECT
prod_id,
prod_price,
prod_name -- 选择3个列
FROM Products
ORDER BY 2,3; -- 2,3就是相对位置
如果想在多个列上进行降序排列,则对每个列都要指定DESC关键词:
-- 正确写法
SELECT
prod_id,
prod_price,
prod_name
FROM Products
ORDER BY prod_price DESC, prod_name DESC; -- 每个列都指定DESC
-- 错误写法!!!
SELECT
prod_id,
prod_price,
prod_name
FROM Products
ORDER BY prod_price, prod_name DESC; -- DESC只对最近的prod_name起作用,那么prod_price仍然是升序排列的
本节中讲解的是使用where关键词来过滤数据。数据库中一般存在大量的数据,一般我们只需要检索表中少量的行。只检索所需数据需要指定搜索条件,搜索条件也称之为过滤条件。
SELECT prod_name, prod_price
FROM Products
WHERE prod_price=5; -- 指定条件
笔记:当ORDER BY 和WHERE子句同时存在的时候,ORDER BY子句应该位于WHERE子句之后。
常用的where子句操作符:
操作符 | 说明 | 操作符 | 说明 | |
---|---|---|---|---|
= | 等于 | > | 大于 | |
<> | 不等于 | >= | 大于等于 | |
!= | 不等于 | !> | 不大于 | |
< | 小于 | BETWEEN…AND… | 在指定的两个值之间 | |
> | 大于 | IS NULL | 为NULL值 | |
!< | 不小于 |
注:上面表格中的某些操作符是等价的。
SELECT prod_name, prod_price
FROM Products
WHERE prod_price <= 5; -- 指定1个条件
SELECT vend_id, prod_name, prod_price
FROM Products
WHERE vend_id <> 'DLL01' -- 指定不等于条件
笔记:
1、上面where子句中,可以看到有的只会在单引号内,但是有的没有括起来。
2、单引号用来限定字符串。如果将值和字符串类型的比较,需要使用限定符号
3、用来与数值列进行比较的值,则不用括号。
SELECT vend_id, prod_name, prod_price
FROM Products
WHERE vend_id <> 'DLL01' -- 不匹配检查条件
要检查某个范围的值,可以使用BETWEEN操作符。BETWEEN操作符要搭配AND同时使用,指定范围的最大值和最小值:
SELECT vend_id, prod_name, prod_price
FROM Products
WHERE prod_price BETWEEN 100 AND 600 -- BETWEEN ... AND...联合使用
当我们创建表的时候,可以指定其中的列是否包含空值。在一个列不包含值时,称其包含空值NULL。
注:NULL(无值,no value),它和字段包含0、空字符串或仅仅包含空格是不同的。
SELECT中一个特殊的WHERE子句用来检查具有NULL值的列:
SELECT prod_name, prod_price
FROM Products
WHERE prod_price IS NULL; -- 找出价格为NULL的数据
本节中介绍的是如何组合WHERE子句以建立功能更强、更高级的搜索条件
操作符operator
:用来联结或改变WHERE子句中的子句的关键字,也称之为逻辑操作符logical operator
。
同时满足AND操作符两边的条件
SELECT vend_id, prod_name, prod_price
FROM Products
WHERE vend_id >= 'DLL01' AND prod_price <= 20; -- AND操作符指定2个条件
满足OR操作符两边的一个条件即可
SELECT vend_id, prod_name, prod_price
FROM Products
WHERE vend_id >= 'DLL01' OR prod_price <= 20; -- AND操作符指定2个条件
注:当第一个条件满足的时候,第二个条件便不会执行了。
在WHERE子句中同时使用AND和OR操作符:
⚠️:AND操作符的优先级是高于OR操作符
⚠️:AND操作符的优先级是高于OR操作符
⚠️:AND操作符的优先级是高于OR操作符
SELECT prod_name,prod_price
FROM Products
WHERE vend_id = 'DLL01' OR vend_id = 'BRS01' AND prod_price >= 10;
上面的语句原本表达的含义是先挑选满足两个vend_id的条件;但是SQL在执行的时候,AND操作符先处理。如果我们想先执行AND前面的部分,可以加上括号:
SELECT prod_name,prod_price
FROM Products
WHERE (vend_id = 'DLL01' OR vend_id = 'BRS01') AND prod_price >= 10;
括号具有比AND或者OR更高的优先级,能够消除歧义。
IN操作符用来指定条件范围,范围中的每个条件都可以进行匹配。
SELECT prod_name,prod_price
FROM Products
WHERE vend_id IN ('DLL01','BRS01') -- 功能类似于OR操作符
ORDER BY name:
笔记:IN操作符的主要优点
1、IN操作符的语法更清楚、更直观
2、使用了IN操作符更容易管理求值顺序
3、IN操作符一般比OR操作符执行的更快
4、在IN操作符中可以包含其他SELECT子句,能够动态地建立where子句
NOT操作符只有一个功能:就是否定后面所跟的任何条件。
SELECT prod_name
FROM Products
WHERE NOT vend_id = 'DLL01' -- 找出不是DLLO1名字的数据
ORDER BY prod_name
上面的语句的功能也可以用<>
来实现:
SELECT prod_name
FROM Products
WHERE vend_id <> 'DLLO1' -- 不等于,效果同上
ORDER BY prod_name
通配符wildcard是用来匹配值的一部分的特殊字符;利用通配符,可以创建比较特定数据的搜索模式。
笔记:由字面值、通配符或者两者组合构成的搜索条件。
为了在搜索子句中使用通配符,必须使用LIKE操作符
⚠️通配符搜索只能用于文本字段(字符串),对于非文本数据类型不能使用通配符搜索。
功能:匹配任意字符出现的任意次数,即任意内容
SELECT prod_id, prod_name
FROM Products
WHERE prod_name LIKE "Fish%" -- 找出所有Fish开头的产品,不管后面是什么内容
通配符可以在任意位置使用,可以使用多次:
SELECT prod_id, prod_name
FROM Products
WHERE prod_name LIKE "%bean bag%" -- 匹配名字中包含bean bag的任意名字的数据,不管前后
通配符出现在中间:
SELECT prod_name
FROM Products
WHERE prod_name LIKE 'F%y' -- 找出F开头y结尾的数据
⚠️:百分号%
能够匹配任意位置的0个、1个或者多个字符,但是不能匹配NULL
下划线通配符的用途和百分号类似,但是它只能匹配一个字符,百分号是匹配多个字符,这是二者的区别。
SELECT prod_id, prod_name
FROM Products
WHERE prod_name LIKE '__ inch teddy bear' -- 前面是两个下划线_
-- 结果
prod_id prod_name
------- ---------
BR02 12 inch teddy bear -- 12或者18刚好是两个字符
BR03 18 inch teddy bear
一个下划线刚好只能匹配一个字符,不能多也不能少
方括号[]
通配符用来指定一个字符集,它必须匹配指定位置的一个字符。
SELECT cust_contact
FROM Customers
WHERE cust_contact LIKE '[JM]%' -- 匹配JM当中一个字母开头,后面是任意字符的内容
ORDER BY cust_contact
%
:匹配任意内容使用取反符号^
来否定内容:
SELECT cust_contact
FROM Customers
WHERE cust_contact LIKE '[^JM]%' -- 匹配不是JM开头的任意内容
ORDER BY cust_contact;
使用NOT操作符可以得到类似上面的结果:
SELECT cust_contact
FROM Customers
WHERE NOT cust_contact LIKE '[JM]%' -- 匹配不是JM开头的任意内容;NOT表示取反,否定内容
ORDER BY cust_contact;
⚠️通配符使用的几点注意事项:
存储在数据库表中的字段一般不是应用程序中所需要的格式。我们需要直接从数据库中检索出来进行转换、计算或者格式化过的数据。计算字段并不实际存在于数据库表中。计算字段是运行时在select语句内创建的。
将多个字段联结在一起构成单个字段。根据不同的DBMS,使用+
或者||
来进行联结。但是在MySQL中必须使用特殊的函数来进行操作。
拼接字段函数Concat的使用:
SELECT
Concat(vend_name, ' (', vend_country, ')')
FROM Vendors
ORDER BY vend_name;
代码解释:
小知识:MySQL中如何去掉空格?
RTRIM(col) -- 去掉值右边的所有空格
LTRIM(col) -- 去掉值左边的所有空格
TTRIM(col) -- 去掉字符串左右两边的所有空格
别名(alias)是一个字段或者值的替换明,别名是使用关键词AS来赋予的。
SELECT
Concat(vend_name, ' (', vend_country, ')') AS vend_title -- 使用别名
FROM Vendors
ORDER BY vend_name;
笔记:AS关键词语是可选的,但是最好使用
计算字段的另一个常见运算是对检索出来的数据进行算术运算。
SELECT
prod_id
,quantity
,item_price
,quantity * item_price AS expanded_price -- 计算字段执行算术运算,并使用别名
FROM OrderItems
WHERE order_num = 2008;
SQL中支持的算术操作符:
操作符 | 说明 |
---|---|
+ | 加 |
- | 减 |
* | 乘 |
/ | 除 |
与其他计算机语言一样,SQL中也提供函数来处理数据。
函数 | 说明 |
---|---|
LEFT() | 返回字符串左边的字符 |
LENGTH() | 返回字符串的长度 |
LOWER() | 将字符串转换为小写 |
LTRIM() | 去掉值左边的所有空格 |
RIGHT() | 返回字符串右边的字符 |
RTRIM() | 去掉值右边的所有空格 |
SOUNDEX() | 返回字符串的SOUNDEX值 |
UPPER() | 将字符串转换为大写 |
SOUNDE(X)
是一个将任何文本串转成描述其语音表示的字母数字模式的算法。
SELECT
cust_name
,cust_contact
FROM Customers
WHERE SOUNDEX(cust_contact) = SOUNDEX('Michael Green') -- 转化成对应的值
日期和时间采用相应的数据类型存储在表中,以特殊的格式来存储。
SELECT
order_num
FROM Orders
WHERE YEAR(order_date) = 2012; -- 提取年份
MySQL中常用的数值处理函数:
函数 | 说明 |
---|---|
ABS() | 返回一个数的绝对值 |
COS() | 返回一个角度的余弦值 |
EXP() | 返回一个数的指数值 |
PI() | 返回圆周率 |
SIN() | 返回一个角度的正弦 |
SQRT() | 返回一个数的平方根 |
TAN() | 返回一个角度的正切值 |
聚集函数指的是对某些行运行的一个函数,并且返回一个值,常用的聚集函数有:
函数 | 作用 |
---|---|
AVG() | 返回列的平均值 |
COUNT() | 返回列的函数 |
MAX() | 返回列的最大值 |
MIN() | 返回列的最小值 |
SUM() | 返回某列值之和 |
1、AVG()函数
SELECT AVG(prod_price) AS avg_price -- 求平均值
FROM Products;
上面求解的是所有行各自的平均值,也可以指定某个特定的行来求解:
SELECT AVG(prod_price) AS avg_price -- 求平均值
FROM Products
WHERE vend_id = 'DLLO1'; -- 指定特定的行
笔记:AVG()函数会忽略掉值NULL的行
2、COUNT()函数
COUNT()函数进行计数,可以使用它来确定表中的函数或者符合特定条件的行的数目,两种使用情况:
SELECT COUNT(*) AS num_cust
FROM Customers;
num_cust
--------
5
SELECT COUNT(cust_email) AS num_cust
FROM Customers;
num_cust
--------
3
笔记:如果指定列名,则COUNT()函数会忽略指定列的值为空的行,但是如果COUNT()函数使用的是星号,则不会忽略
3、MAX()/MIN()函数
返回指定列中的最大值或者最小值
SELECT MAX(prod_price) AS MAX_price -- 求最大值
SELECT MAX(prod_price) AS MIN_price -- 求最小值
FROM Products;
笔记:上面的两个最值函数会自动忽略掉值为NULL的行
4、SUM()函数
返回指定列值的和(总计)
SELECT SUM(quantity) AS items_ordered
FROM OrderItems
WHERE order_num = 20005;
SUM()函数也可以用来合计计算值:
SELECT SUM(item_price * quantity) AS total_price -- 返回所有物品的价钱之和
FROM OrderItems
WHERE order_num = 20005;
笔记:SUM()函数会自动忽略值为NULL的行
上面的5个聚集函数都可以如下使用:
笔记:ALL参数不需要指定,是默认行为
SELECT AVG(DISTINCT prod_price) AS avg_price -- 去重之后再求平均值
FROM Products
WHERE vend_id = 'DLLO1'; -- 指定特定的行
笔记:
1、DISTINCT不能用于COUNT(*);如果指定列名,则DISTINCT只能用于COUNT()
2、DISTINCT必须使用列名,不能用于计算或者表达式
3、DISTINCT用于MAX()和MIN()意义不大,因为最值不管是否考虑去重,都是一样的
在SELECT子句中是可以包含多个聚集函数
SELECT
AVG(prod_price) AS avg_price -- 求平均值
,MAX(prod_price) AS max_price -- 求最大值
,MIN(prod_price) AS min_price -- 求最小值
,COUNT(*) AS num_items -- 物品的数目
FROM Products;
分组使用的是两个子句:
分组是使用SELECT子句的GROUP BY子句建立的,看个例子:
SELECT
vend_id
,COUNT(*) AS num_prods
FROM Products
GROUP BY vend_id; -- 分组的列
GROUP BY子句使用时候的常见规定:
在WHERE子句中指定过滤的是行而不是分组;实际上WHERE种并没有分组的概念。在SQL使用HAVING来实现过滤分组;
笔记:WHERE过滤行,HAVING过滤分组
SELECT
cust_id
,COUNT(*) AS orders
FROM Orders
GROUP BY cust_id
HAVING COUNT(*) >= 2; -- 过滤分组
WHERE和HAVING的区别:
SELECT
vend_id
,COUNT(*) AS num_prods
FROM Products
WHERE prod_price >= 4 -- 分组前先执行,找出符合条件的数据
GROUP BY vend_id
HAVING COUNT(*) >= 2; -- 分组后再执行,找出数目大于2的数据
ORDER BY 和GROUP BY的差异:
ORDER BY | GROUP BY |
---|---|
对产生的输出排序 | 对行分组,但输出可能不是分组的顺序 |
任意列都可以使用(非选择的列也可以使用) | 只可能使用选择列或者表达式列,而且必须使用每个选择列表达式 |
不一定需要 | 如果和聚集函数一起使用列,则必须使用 |
SELECT
order_num
,COUNT(*) AS items
FROM OrderItems
GROUP BY order_num
HAVING COUNT(*) >= 3
ORDER BY items, order_num; -- 先分组再过滤,最后排序输出
在这里总结一下SELECT子句的相关顺序:
子句 | 说明 | 是否必须使用 |
---|---|---|
SELECT | 要返回的列或者表达式 | 是 |
FROM | 从中检索数据的表 | 仅在从表选择数据时使用 |
WHERE | 行级过滤 | 否 |
GROUP BY | 分组说明 | 仅在按照组计算聚集时使用 |
HAVING | 组级过滤 | 否 |
ORDER BY | 输出排序顺序 | 否 |
任何SELECT语句都是查询,SQL还允许在查询中嵌套查询。
SELECT cust_id -- 再根据子查询中的order_num找出符合要求的cust_id
FROM Orders
WHERE order_num IN (SELECT order_num -- 先根据WHERE条件找出满足符合要求的order_num
FROM OrderItems
WHERE prod_id = 'RGAN01');
笔记:子查询总是从内向外处理
SELECT Customers -- 最后根据找出的cust_id查询Customers
FROM cust_id IN(SELECT cust_id -- 再根据子查询中的order_num找出符合要求的cust_id
FROM Orders
WHERE order_num IN (SELECT order_num -- 先根据WHERE条件找出满足符合要求的order_num
FROM OrderItems
WHERE prod_id = 'RGAN01'));
使用子查询的另一个方法是创建计算字段
SELECT
cust_name
,cust_state
,(SELECT COUNT(*) -- 将子查询作为一个计算字段输出:统计每个cust_id的数量
FROM Orders
WHERE Orders.cust_id = Customers.cust_id) AS orders -- Orders.cust_id = Customers.cust_id 使用完全限定列名来避免歧义
FROM Customers
ORDER BY cust_name;
SQL最强大的功能就是数据查询的过程中使用联结表(join)。
通过指定要联结的表和它们的联结方式即可创建联结。
SELECT
vend_name,
prod_name,
prod_price
FROM Vendors, Products
WHERE Vendors.vend_id = Products.vend_id; -- 指定联结条件
如果上面的代码中没有WHERE子句来指定联结条件,则返回的是笛卡尔积,返回出来数的行就是第一个表中的行乘以第二个表中的行。
笔记:返回笛卡尔积的联结,也称做叉联结cross join
使用最广泛的联结是等值联结,也称之为内联结inner join。实现上面语句的内联结代码:
SELECT
vend_name,
prod_name,
prod_price
FROM Vendors
INNER JOIN Products -- 内联结
ON Vendors.vend_id = Products.vend_id; -- 指定联结条件
SELECT
vend_name,
prod_name,
prod_price
FROM OrderItems, Products, Vendors
WHERE Products.vend_id = Vendors.vend_id -- 多个表的联结
AND OrderItems.prod_id = Products.prod_id
AND order_num = 20007;
我们通过联结方式来实现子查询的结果:
-- 子查询 SELECT Customers -- 最后根据找出的cust_id查询Customers FROM cust_id IN(SELECT cust_id -- 再根据子查询中的order_num找出符合要求的cust_id FROM Orders WHERE order_num IN (SELECT order_num -- 先根据WHERE条件找出满足符合要求的order_num FROM OrderItems WHERE prod_id = 'RGAN01')); -- 内联结 SELECT cust_name, cust_contact FROM Customers, Orders, OrderItems WHERE Customers.cust_id = Orders.cust_id -- 多个表联结查询 AND OrderItems.order_num = Orders.order_num AND prod_id = 'RGAN01'
在SQL语句中可以给表取别名:
SELECT
cust_name,
cust_contact
FROM Customers AS C, Orders AS O, OrderItems AS OI -- 取别名,看上去更简洁
WHERE C.cust_id = O.cust_id -- 多个表联结查询
AND OI.order_num = O.order_num
AND prod_id = 'RGAN01'
介绍3种不同的联结:
1、自联结self join
-- 子查询
SELECT cust_id,cust_name,cust_contact
FROM Customers
WHERE cust_name = (SELECT cust_name
FROM Customers
WHERE cust_contact = 'Jim Jones');
-- 内联结
SELECT c1.cust_id, c2.cust_name, c1.cust_contact
FROM Customers AS c1, Customers AS c2 -- 相同的表使用两次
WHERE c1.cust_name = c2.cust_name
AND c2.cust_contact = 'Jim Jones';
上面使用了Customers表两次,为了避免歧义,必须使用不同的别名加以区分。
2、自然联结
无论何时对表进行联结,应该至少有一列不止出现在一个表中(被联结的列)。自然联结排除多次出现,是每一列只返回一次。
SELECT
C.*
,O.order_num
,O.order_date
,OI.prod_id
,OI.quantity
,OI.item_price
FROM Customers AS C, Orders AS O, OrderItems AS OI
WHERE C.cust_id = O.cust_id -- 多个表联结查询
AND OI.order_num = O.order_num
AND prod_id = 'RGAN01'
3、外联结
有时候我们需要将一个表中的行和另一个表中行相关联,但是有时候也需要包含那些没有关联行的行记录,比如下面的场景中:
当联结中包含了那些在相关表中没有关联行的行,这种联结称之为外联结。比如:检索出包括没有订单顾客在内的所有顾客。
SELECT
C.cust_id
,O.order_num
FROM Customers AS C
LEFT OUTER JOIN Orders AS O -- 外连接
ON Customers.cust_id = Orders.cust_id
上面的代码中表示包含左边所有行的记录;如果是右边,使用RIGHT OUTER。因此外联结实际上有两种形式,它们之间可以互换
还有一种比较特殊的外联结,叫做全外联结full outer join,它检索的是两个表中的所有行并关联那些可以关联的行。全外联结包含两个表的不关联的行
SELECT
C.cust_id
,O.order_num
FROM Customers AS C
FULL OUTER JOIN Orders AS O -- 外连接
ON Customers.cust_id = Orders.cust_id
检索所有顾客及每个顾客所有的订单数:
SELECT
C.cust_id
,COUNT(O.order_num) AS num_ord -- 使用聚集函数统计订单数
FROM Customers AS C
INNER JOIN Orders
ON C.cust_id = O.cust_id -- 关联两个表
GROUP BY Customers.cust_id -- 分组
总结一下联结和使用要点:
SQL允许执行多个查询(多条SELECT语句),并将结果作为一个查询结果集返回,这些组合通常称为并union或者复合查询;通常两种情况下需要使用组合查询:
可以用UNION操作符来组合数条SQL查询。
-- 语句1
SELECT cust_name, cust_contact,cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI');
-- 语句2
SELECT cust_name, cust_contact,cust_email
FROM Customers
WHERE cust_name = 'Fun4ALL';
通过组合查询将上面两个查询组合在一起:
-- 组合查询
SELECT cust_name, cust_contact,cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
UNION -- 关键字
SELECT cust_name, cust_contact,cust_email
FROM Customers
WHERE cust_name = 'Fun4ALL';
我们也可以使用多个WHERE条件来实现:
-- 语句1
SELECT cust_name, cust_contact,cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
AND cust_name = 'Fun4ALL';
总结UNION使用规则:
SELECT语句的输出用ORDER BY子句排序。
-- 组合查询
SELECT cust_name, cust_contact,cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
UNION -- 关键字
SELECT cust_name, cust_contact,cust_email
FROM Customers
WHERE cust_name = 'Fun4ALL'
ORDER BY cust_name, cust_contact; -- 组合之后再进行排序
INSERT用来将行插入(或者添加)到数据库表中,3种插入方式:
下面通过实际的例子来说明:
1、插入完整的行
INSERT INTO Customers
VALUES('1000000006',
'Tony',
'123 Any Street',
'New York',
'NY',
'1111',
'USA',
NULL,
NULL
)
将上面的数据插入到Customers表中,每列对应一个值。如果值不存在,则用NULL代替。同时插入数据的顺序必须和表中定义的相同。
安全写法:列出每个字段名称
INSERT INTO Customers(cust_id, -- 明确列出列名 cust_name, cust_address, cust_city, cust_state, cust_zip, cust_country, cust_contact, cust_email ) VALUES('1000000006', -- 和上面的列名一一对应 'Tony', '123 Any Street', 'New York', 'NY', '1111', 'USA', NULL, NULL )
上面列名和下面插入的数据必须一一对应,我们改变插入顺序:
INSERT INTO Customers(cust_id, -- 明确列出列名 cust_zip, cust_country, cust_contact, cust_email, cust_name, cust_address, cust_city, cust_state ) VALUES('1000000006', -- 和上面的列名一一对应 '1111', 'USA', NULL, NULL, 'Tony', '123 Any Street', 'New York', 'NY' )
2、插入部分数据
上面的例子中我们插入的是全部列名的数据,现在指定部分列名进行插入:
INSERT INTO Customers(cust_id, -- 明确列出列名 cust_zip, cust_country, cust_name, cust_address, cust_city, cust_state ) VALUES('1000000006', -- 和上面的列名一一对应 '1111', 'USA', 'Tony', '123 Any Street', 'New York', 'NY' )
3、插入检索出来的数据
INSERT的另一种使用是将SELECT检索出来的结果插入到表中,使用INSERT SELECT语句
INSERT INTO Customers(cust_id, -- 2、将SELECT检索的结果插进来 cust_zip, cust_country, cust_contact, cust_email, cust_name, cust_address, cust_city, cust_state ) SELECT cust_id, -- 1、SELECT先检索结果 cust_zip, cust_country, cust_contact, cust_email, cust_name, cust_address, cust_city, cust_state FROM CustNew;
INSERT SELECT中SELECT语句也是可以包含WHERE子句,以便过滤插入的数据。
还有一种数据插入不需要使用INSERT语句,要将一个表的内容复制到另一个表,可以使用SELECT INSERT语句
SELECT *
INTO CustCopy
FROM Customers;
需要注意4点:
更新(修改)表中的数据,可以使update语句。常见的有两种update方式:
update语句的3个组成部分:
UPDATE Customers -- 1、待更新的表
SET cust_email = '28173497@gmail.com' -- 2、需要更细的列名和它的新值
WHERE cust_id = '10000000005'; -- 3、过滤条件
同时更新多个值:
UPDATE Customers -- 1、待更新的表
SET -- 2、同时更新多个值
cust_email = '28173497@gmail.com',
cust_contact = 'Sam Roberts'
WHERE cust_id = '10000000005'; -- 3、过滤条件
在更新多个列的值时,只需要使用提交SET命令,每个列=值
对之间通过逗号隔开,最后一个列不同。
如果想删除某个列的值,可以将其设置成NULL(假如表定义允许NULL值)。
''
表示,是一个值UPDATE Customers
SET cust_email = NULL
WHERE cust_id = '100000000005';
从表中删除数据使用DELETE语句。有两种删除方式:
DELETE FROM Customers
WHERE cust_id = '011111111116';
DELETE是删除整行而不是删除列。要删除列请使用UPDATE语句
SQL中一般有两种创建表的方法:
CREATE TABLE Products -- 创建表
(
prod_id CHAR(10) NOT NULL,
vend_id CHAR(10) NOT NULL,
prod_name CHAR(254) NOT NULL,
prod_price DECIMAL(8,2) NOT NULL,
prod_desc VARCHAR(1000) NULL
);
上面代码的解释:
NULL值就是没有值或者缺失值。每个表中的列要么是NULL列,要么是NOT NULL列。
主键是其值唯一标识表中每一行的列。只有不允许NULL值的列可作为主键,允许NULL值的列不能作为唯一标识。
笔记:NULL是默认设置。如果不指定NOT NULL,则认为指定的就是NULL。
注意NULL和空字符串的区别:
SQL中创建表的时候可以指定通过关键字DEFAULT来指定:
CREATE TABLE OrderItems
(
order_num INTEGER NOT NULL,
order_item INTEGER NOT NULL,
prod_id CHAR(10) NOT NULL,
quantity INTEGER NOT NULL DEFAULT 1, -- 指定默认值
item_price DECIMAL(8,2) NOT NULL
);
默认值一般是用于日期或者时间戳列。
更新表中的数据使用关键词ALTER TABLE。
ALTER TABLE Vendors
ADD vend_phone CHAR(20);
删除整个表而不是其内容,使用DROP TABLE。
DROP TABLE CustCopy; -- 执行这条语句将会永久删除该表
通过关键字RENAME来实现
RENAME TABLE old_name TO new_name;
旧表(old_name
)必须存在,新表(new_name
)必须不存在。 如果新表new_name
存在,则该语句将失败。
视图是虚拟的表,与包含数据的表不一样,视图只包含使用时动态检索数据的查询。之前的例子:检索订购了某种产品的顾客
SELECT
cust_name,
cust_contact
FROM Customers AS C, Orders AS O, OrderItems AS OI
WHERE C.cust_id = O.cust_id -- 多个表联结查询
AND OI.order_num = O.order_num
AND prod_id = 'RGAN01'
现在我们将上面的结果包装成一个名ProductsCustomers的虚拟表,可以得到相同的数据:
SELECT cust_name, cust_contact
FROM ProductsCustomers
WHRE prod_id = 'RGAN01'
ProductsCustomers并不是一个表,只是一个视图,它不包含任何列或者数据,包含的是一个查询。
总结以下几点使用视图的原因:
笔记:视图本身不包含数据,使用的是从别处检索出来的数据。
关于视图创建和使用的一些常见规则和限制:
1、利用视图简化复杂的联结
CREATE VIEW ProductsCustomers AS -- 创建视图
SELECT cust_name, cust_contact
FROM Customers AS C, Orders AS O, OrderItems AS OI
WHERE C.cust_id = O.cust_id
AND OI.order_num = O.order_num
上面 代码创建了一个名为ProductsCustomers的视图,我们查询一条信息:
SELECT cust_name, cust_contact
FROM ProductsCustomers
WHRE prod_id = 'RGAN01'
2、利用视图重新格式化检索出的数据
CREATE VIEW VendorLocations AS -- 创建视图
SELECT RTRIM(vend_name) + ' (' + RTRIM(vend_country) + ')' AS vend_title
FROM Vendors;
-- 从视图中检索数据
SELECT *
FROM VendorLocations;
3、使用视图过滤数据
CREATE VIEW CustomerEmailList AS
SELECT cust_id, cust_name, cust_email
FROM Customers
WHERE cust_email IS NOT NULL;
-- 检索数据
SELECT *
FROM CustomerEmailList;
4、使用视图和计算字段
CREATE VIEW OrderItemExpanded AS -- 创建视图
SELECT
order_num,
prod_id,
quantity,
item_price,
quantity * item_price AS expanded_price
FROM OrderItems;
-- 使用视图查询数据
SELECT *
FROM OrderItemExpanded
WHERE order_num = 2008;
存储过程(Stored Procedure)是一种在数据库中存储复杂程序,以便外部程序调用的一种数据库对象。
存储过程是为了完成特定功能的SQL语句集,经编译创建并保存在数据库中,用户可通过指定存储过程的名字并给定参数(需要时)来调用执行。
笔记:简答来说,存储过程就是为以后使用而保存的一条或者多条SQL语句。
笔记:总结存储过程的3个优点:简单、安全、高性能
MySQL中创建存储过程:
CREATE [DEFINER = { user | CURRENT_USER }] PROCEDURE sp_name ([proc_parameter[,...]]) [characteristic ...] routine_body proc_parameter: [ IN | OUT | INOUT ] param_name type characteristic: COMMENT 'string' | LANGUAGE SQL | [NOT] DETERMINISTIC | { CONTAINS SQL | NO SQL | READS SQL DATA | MODIFIES SQL DATA } | SQL SECURITY { DEFINER | INVOKER } routine_body: Valid SQL routine statement [begin_label:] BEGIN [statement_list] …… END [end_label]
MYSQL 存储过程中的关键语法
声明语句结束符,可以自定义:
DELIMITER $$
或
DELIMITER //
声明存储过程:
CREATE PROCEDURE demo_in_parameter(IN p_in int)
存储过程开始和结束符号:
BEGIN .... END
变量赋值:
SET @p_in=1
变量定义:
DECLARE l_int int unsigned default 40000;
创建MySQL存储过程、存储函数:
CREATE procedure 存储过程名(参数)
存储过程体:
CREATE function 存储函数名(参数)
创建一个实际的存储过程:
mysql> delimiter $$ -- 将语句的结束符号从分号;临时改为两个$$(可以是自定义)
mysql> CREATE PROCEDURE delete_matches(IN p_playerno INTEGER)
-> BEGIN
-> DELETE FROM MATCHES
-> WHERE playerno = p_playerno;
-> END$$
Query OK, 0 rows affected (0.01 sec)
mysql> delimiter; -- 将语句的结束符号恢复为分号
EXECUTE AddNewProduct('JS01',
'Stuffed Eiffel Tower',
9.83,
'Plush stuffed toy with the text La Tour Tower'
)
EXECUTE
,后面紧跟的是存储过程的名字这一章介绍的是MySQL中事务的相关知识点,包含什么是事务处理,怎样利用COMMIT 和 ROLLBACK语句管理事务处理
事务Transaction
,一个最小的、不可再分的工作单元,通常一个事务对应一个完整的业务。InnoDB
引擎是支持事务的,MyISAM
不支持事务。事务是针对数据库中DML
数据操作语言的。
事务处理(transaction processing)是一种机制,用来管理必须成批执行的SQL操作。利用事务处理,可以保证一组操作不会中途停止,要么完全执行,要么完全不执行,来维护数据库的完整性。
DML(insert、update、delete)
语句来共同完成。只有DML
数据操作语句才有事务。SQL
语句要么全部执行成功,要么全部失败,以此来维护数据库的完整性。比如在两个表中,A(原有400)给B(原有200)转200块钱,包含两个过程:
update user set fee=200 where id=1; # 语句1
-- 由于断网、安全限制、超出磁盘空间等不可控制原因,下面的语句可能无法成功执行
update user set fee=400 where id=2; # 语句2
事务处理相关的术语:
CREATE DATABASE IF NOT EXISTS employees; -- 创建数据库 USE employees; CREATE TABLE `employees`.`account` ( -- 数据库中创建表account `id` BIGINT (11) NOT NULL AUTO_INCREMENT, `p_name` VARCHAR (4), `p_money` DECIMAL (10, 2) NOT NULL DEFAULT 0, PRIMARY KEY (`id`) -- 设置主键 ) ; INSERT INTO `employees`.`account` (`id`, `p_name`, `p_money`) VALUES ('1', 'tim', '200'); -- 插入两条记录 INSERT INTO `employees`.`account` (`id`, `p_name`, `p_money`) VALUES ('2', 'bill', '200'); START TRANSACTION; -- 开启事务 SELECT p_money FROM account WHERE p_name="tim"; -- 三条语句必须完整执行 UPDATE account SET p_money=p_money-100 WHERE p_name="tim"; UPDATE account SET p_money=p_money+100 WHERE p_name="bill"; COMMIT TRANSACTION; -- 显式提交
事务具有四大特点,简称为ACID
:
Atomicity
:一个事务中的语句,要么全部成功,要么全部失败。不存在只执行了部分的情况。Consistency
:在事务开始之前或者结束之后,必须保持数据库的一致性。比如上面的栗子中,A减掉200,那么相应的,B一定要加上200。否则数据库中的数据不一致。Isolation
:当多个用户并发访问数据库,操作同一张表时,数据库为每一个用户开启的事务,不能被其他事务的操作所干扰,多个并发事务之间要相互隔离。用户的操作之间存在独立性。事务A和B之间具有隔离性。Durability
:事务一旦被提交,对数据库中的数据的改变就是永久性的,即便是在数据库系统遇到故障的情况下也不会丢失提交事务的操作。事务的成功,是硬盘数据上的更改,不仅是内存上的变化。持久性是事务的保证,是事务结束的标志。隔离级别 | 脏读(Dirty Read) | 不可重复读(NonRepeatable Read) | 幻读(Phantom Read) | 加锁读Locked Read |
---|---|---|---|---|
未提交读(Read uncommitted) | Y | Y | Y | N |
已提交读(Read committed) | N | Y | Y | N |
可重复读(Repeatable read) | N | N | Y | N |
可串行化(Serializable ) | N | N | N | Y |
commit
),事务中的操作不会被其他会话可见。解决了脏读问题,但是会对其他session
产生两次不一样的读取结果-- 查看系统隔离级别:
select @@global.tx_isolation;
-- 查看当前会话隔离级别
select @@tx_isolation;
-- 设置当前会话隔离级别
SET session TRANSACTION ISOLATION LEVEL serializable; -- serializable 级别
-- 设置全局系统隔离级别
SET GLOBAL TRANSACTION ISOLATION LEVEL READ UNCOMMITTED; -- READ UNCOMMITTED 可读未提交级别
开始标志:任何一条DML语句的执行,标志事务开始
结束的标志分为两种:成功结束的标识和失败结束的标识
1、成功结束的标志
DML
语句的操作历史记录和底层硬盘中的数据进行了同步。2、 失败结束的标识
DML
语句的操作记录进行全部清空。本章节中讲解的是什么是游标,以及如何使用游标。
SQL检索操作返回一组称为结果集的行,这组返回的行都是与SQL语句相匹配的行(零行或者多行)。
简单地使用SELECT语句,没有办法得到第一行、下一行或者前10行的数据。但是实际中,我们需要在检索出来的行中前进或者后退一行甚至多行,这时候便可以使用游标。
游标是一个存储在DBMS服务器上的数据库存查询,它不是一条SELECT语句,而是被该语句检索出来的结果集。
使用游标的几个步骤:
declare
:在使用游标之前,必须先进行声明open:一旦声明了游标,就必须打开游标
close
:在结束的时候,必须关闭游标;有的DBMS
还需要释放游标DECLARE关键词来定义和命名游标
DECLARE CustCursor CURSORVB -- 声明游标
FOR
SELECT * FROM Customers
WHERE cust_email IS NULL;
1、OPEN CURSOR语句来打开游标
OPEN CURSOR CustCursor -- 打开游标
2、打开游标之后我们可以使用FETCH语句来访问游标数据了。FETCH指出要检索哪些行?从什么地方开始检索?将它们放于何处?
关闭游标的关键词是close
。
游标一旦关闭,如果不再次打开,将无法使用;第二次使用的时候,不需要声明,直接open
即可
CLOSE Custcursor
下面的内容是个人增加部分,讲解的是如何通过Python的第三方库pymysql
操作游标。
使用的是pymysql
模块,需要先进行导入
import pymysql
IP
地址3306
user
账户登录mysql
的密码charset="utf8"
使用模块的connect()
方法进行连接
import pymysql
conn = pymysql.connect(
host=“localhost”, # 主机名
port=3306, # 端口
user="root", # 用户名
passwd="123456", # 密码
db="bookdb", # 数据库名字
charset="utf8") # 指定字符集
Python
建立了和数据库的连接,实际上就是建立了一个pymysql.connect()
的实例对象
,或者称之为连接对象
。
Python
就是通过连接对象和数据库进行对话。pymysql.connect()
实例对象的方法有:
commit
:提交数据rollback
:如果有权限,取消当前的操作,否则会报错cursor([cursorclass])
:返回连接的游标对象,执行SQL
语句close()
:关闭连接名称 | 描述 |
---|---|
close | 关闭游标 |
execute | 执行一条SQL语句,可以带上参数; 执行之后需要conn.commit(),数据库中才会真正建立 |
fetchone | 返回一条语句 |
fetchall | 返回所有的语句 |
fetchmany | 返回many条语句 |
nextset() | 移动到下一个结果 |
import pymysql # 导入模块
conn = pymysql.connect(host=“localhost”, # 建立python和数据库的连接
port=3306,
user="root",
passwd="123456",
db="bookdb",
charset="utf8")
cur = conn.cursor() # 建立游标对象cur
cur.execute("insert into users (username, passwd, email) values (%s, %s, %s)", ("python", "123456", "python@gmail.com"))
conn.commit() # 需要再执行conn.commit()
# 同时执行插入多条信息:多条信息用元组的形式表示
cur.executemany("insert into users (username, passwd, email) values (%s, %s, %s)", (("python", "123456", "python@gmail.com"), ("java", "456789", "java@gmail.com"), ("php", "123789", "php@gmail.com")))
conn.commit() # 需要再执行conn.commit()
>>cur.execute("select * from users")
>>lines = cur.fetchall() # 返回所有的查询结果
>>for line in lines: # 遍历返回所有的结果
print(line)
# 只想返回一条结果
>>cur.execute("select * from users where id=1") # 查询id=1
>>cur.execute("select * from users")
>>cur.fetchone() # 返回一条结果;游标会跟着移动,直到将所有的数据取完
>>cur.fetchone()
>>cur.fetchone()
scroll
到指定位置>>cur.scroll(2) # 相对于当前位置移动2个单位
>>cur.fetchone() # 显示数据
>>cur.scroll(2, "absolute") # 加上参数,实现“绝对移动”,到第三条
绝对移动的数字不能是负数,相对移动可以是负数
Python
的连接对象的游标方法中提供一个参数,将读取到的数据保存成字典形式:
>>cur = conn.cursor(pymysql.cursors.DictCursor)
>>cur.execute("select * from users")
>>conn.commit() # 需要再执行conn.commit()
>>cur.fetchall()
更新
>>cur.execute("update users set username=s% where id=2", ("mypython")) # 更新第二条语句
>>cur.execute("select * from users where id=2")
>>conn.commit() # 需要再执行conn.commit()
>>cur.fetchone()
在最后的一章中简单的介绍了SQL的3个高级特性:
约束是管理如何插入或者处理数据库数据的规则。DBMS通过在数据库表上施加约束来实施引用完整性。
1、主键
主键是一种特殊的约束,用来保证一列(或者一组列)中的值是唯一的。主键必须满足的4个条件:
-- 方式1
CREATE TABLE Vendors(
vend_id char(10) NOT NULL primary key, -- 添加主键
vend_name char(50) NOT NULL,
vend_address char(50) NULL,
vend_city char(50) NULL,
vend_state char(5) NULL,
vend_zip char(10) NULL,
vend_country char(50) NULL
);
-- 方式2
ALTER TABLE Vendors
ADD CONSTRAINT PRIMARY KEY (vend_id);
2、外键
外键值表中的一列,其值必须列在另一表的主键中。外键是保证引用完整性的重要部分。
通过订单信息表Orders表中的顾客ID和顾客信息表Customers的顾客ID进行关联。
CREATE TABLE Orders
(
order_num INTEGER NOT NULL PRIMARY KEY, -- 主键:订单号唯一
order_date DATETIME NOT NULL,
cust_id CHAR(10) NOT REFERENCES -- 外键:顾客id不唯一,一个顾客可能有多个订单
)
3、唯一约束
唯一约束用来保证一列中的数据是唯一的,可以通过关键词UNIQUE
来定义。它和主键的区别在于:
4、检查约束
检查约束用来保证一列(或者一组列)中的数据满足一组指定的条件,常见的用途有:
CREATE TABLE OrderItems
(
order_num INTEGER NOT NULL,
order_item INTEGER NOT NULL,
prod_id CHAR(10) NOT NULL,
quantity INTEGER NOT NULL CHECK (quantity>0), -- 设置检查约束,保证大于0
item_price MONEY NOT NULL
)
索引用来排序数据以加快搜索和排序操作的速度。创建索引前记住几点:
CREATE INDEX prod_name_ind
ON Products (prod_name);
触发器(trigger):监视某种情况,并触发某种操作,它是提供给程序员和数据分析员来保证数据完整性的一种方法,它是与表事件相关的特殊的存储过程,它的执行不是由程序调用,也不是手工启动,而是由事件来触发。
触发器可以与特定表上INSERT、UPDATE、DELETE操作相关联。触发器的常见用途:
触发器创建语法四要素:
笔记:触发器只能创建在永久表上,而不能对临时表创建触发器
触发器创建的基本语法如下
CREATE TRIGGER trigger_name
AFTER/BEFORE INSERT/UPDATE/DELETER ON table_name
FOR each row -- 固定语句
begin
sql语句;
end;
《SQL必知必会》一本非常经典的数据库书籍,也可以说是自己入门数据库的书。算上本次万字精华整理,应该是第三次系统的阅读本书,本书主要有几个特点:
本书中涉及到的5张表及其字段含义:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。