SQL

SQL构成¶

数据库管理系统(DBMS)中的操作通常分为三大类:

数据定义语言, DDL, 主要用于定义和管理数据库结构, 常见的操作包括CREATE, ALTER, DROP等等...
数据操作语言, DML, 主要用于查询和修改数据库中的数据, 常见的操作包括SELECT, INSERT等等...
数据控制语言, DCL, 主要用于控制对数据库的访问权限, 常见的操作包括GRANT, REVOKE等等...

DDL, DML和DCL都是SQL的子集或组成部分.

基础SQL查询¶

关键字¶

基础SQL查询的常用关键字有:

SELECT: 列出所有从查询中返回的列
FROM: 指明查询数据的来源的表
WHERE: 指明包含在查询结果中元组的条件
ORDER BY: 指明查询结果的排序

Select-From-Where (SFW) 查询¶

SFW查询的格式为:

SELECT <attributes> FROM <one or more tables> WHERE <conditions>

列出所有学生的姓名: SELECT name FORM Student
列出所有中国学生的名字: SELECT name FROM Student WHERE country="CN"
列出所有的属性: SELECT * FROM Student

SFW查询语句背后执行的是下列关系代数表达式: πA1,A2,...,An(σΘ(R1×R2×...×Rm)).

SELECT对应的是投影π
FROM对应的是笛卡尔积R1×R2×...×Rm
WHERE对应的是选择σ

Tip

SQL语句对大小写不敏感
对于字符串使用单引号
字符串对大小写是敏感的
SFW返回的结果也是关系/表
SFW返回的结果表中可以包含重复元组, 事实上, RDBMS在任何表中都可以允许存在重复值的. SFW返回的结果会保留原始数据中重复的元组, 如果要使返回的表中不含有任何的重复元组的话, 可以使用DISTINCT命令, 如SELECT DISTINCT country FROM Student
可以包含算数运算, 如SELECT uos_code, title, points*2 FROM UnitOsStudy
WHERE语句后面包含条件, 可以使用逻辑运算符, 如>, AND等
SQL包含了一个字符串匹配机制, 类似于正则表达式. 我们可以使用LIKE来实现字符串的匹配. 如列出所有包含COMP的课程SELECT title FROM UnitOfStudy WHERE uos_code LIKE 'COMP%'. %表示匹配任何子字符串, _表示匹配任何单字符
SQL支持不少的字符串操作, 如||表示拼接字符串, 可以将字符串从大写转化为小写, 取出字符串长度, 切片等等
SQL支持对属性进行重命名, 注意, 这只是对结果表生效, 无法改变原表的属性名称. 使用AS来实现. 如SELECT a.uos_code AS course_code, a.credit_points FROM UnitOfStudy a WHERE a.uos = 'COMP5318'
SQL支持对某一列进行排序, 使用ORDER BY语句.. 如SELECT name FROM Student WHERE country='CN' ORDER BY name. 注意有两个方向, 一个是ASC, 表示升序(默认), 一个是DESC, 表示降序. 可以在ORDER BY语句后面声明是降序还是升序, 如ORDER BY country DESC, name ASC
SQL支持使用表的别名, 如SELECT L.name, M.name FROM Lecturer L, Lecturer M, L.manager = M.empid, 在这种情况下, L和M表示的其实是同一张表, 可以将其想象为Lecturer表的不同的两份副本
FROM子句如果不加任何JOIN的话默认使用的是笛卡尔积

连接查询¶

连接在SQL语句中分为隐式连接和显式连接.

隐式连接¶

隐式连接使用到的是FROM和WHERE语句, FROM语句用于列出参与到查询中的表, 对应的是笛卡尔积中的表, 连接的条件在WHERE语句中列出. 如选出Student表和UnitOfStudy的笛卡尔积: SELECT * FROM Student, UnitOfStudy. 如图.

显式连接¶

默认连接用到的是内连接, 关于四种连接的区别, 请见这里. 显式连接用到的是FROM, JOIN和ON关键字.

集合操作¶

SQL语句中, UNION, INTERSECT, EXCEPT对应的是集合操作中的∪, ∩和−.

Tip

要注意的是, 上述这几种操作会自动去除重复, 内部的原理是在操作之前会消除掉输入表的重复行, 然后再做集合操作. 如, 假设一个元组在R中出现了3次, 在S中出现了1次, 那么R-S这个操作之后的结果中将不含有这个元组. 若要保留所有的重复行, 则分别需要用到UNION ALL, INTERSECT ALL和EXCEPT ALL. 如, 假设一个元组在R中出现了m次, 在S中出现了n次, 那么:

在R UNION ALL S的结果中会出现m+n次
在R INTERSECT ALL S的结果中会出现min(m, n)次
在R EXCEPT ALL S的结果中会出现max(0, m-n)次

例子如图1, 图2.

ED-Lessons专题¶

请见这里

SQL