SQL 应用教程

第一部分 SQL 语法及注意事项


1. 在有group by的语句中,select中搜索的字段应该是在group by中出现的,或者是字段的聚合函数计算值,例如:  
SELECT co,c3,c5,c11 FROM ST12509_main WHERE c4='帕克' GROUP BY co,c3; 这种写法是不合理的,,c5和c11的值存在不确定性,正确的应该为  
SELECT co,c3 FROM ST12509_main WHERE c4='帕克' GROUP BY co,c3;或者有聚合函数的 
SELECT co,c3,SUM(c5*c11),AVG(c5) FROM ST12509_main WHERE c4='帕克' GROUP BY co,c3;
 
基本的Sql编写注意事项(Oracle)


尽量少用IN操作符,基本上所有的IN操作符都可以用EXISTS代替。
 不用NOT IN操作符,可以用NOT EXISTS或者外连接+替代。
 Oracle在执行IN子查询时,首先执行子查询,将查询结果放入临时表再执行主查询。而EXIST则是首先检查主查询,然后运行子查询直到找到第一个匹配项。NOT EXISTS比NOT IN效率稍高。但具体在选择IN或EXIST操作时,要根据主子表数据量大小来具体考虑。
 不用"<>"或者"!="操作符。对不等于操作符的处理会造成全表扫描,可以用"<" or ">"代替。
 Where子句中出现IS NULL或者IS NOT NULL时,Oracle会停止使用索引而执行全表扫描。可以考虑在设计表时,对索引列设置为NOT NULL。这样就可以用其他操作来取代判断NULL的操作。
 当通配符"%"或者"_"作为查询字符串的第一个字符时,索引不会被使用。
 对于有连接的列"||",最后一个连接列索引会无效。尽量避免连接,可以分开连接或者使用不作用在列上的函数替代。
 如果索引不是基于函数的,那么当在Where子句中对索引列使用函数时,索引不再起作用。
 Where子句中避免在索引列上使用计算,否则将导致索引失效而进行全表扫描。
 对数据类型不同的列进行比较时,会使索引失效。
 用">="替代">"。
 UNION操作符会对结果进行筛选,消除重复,数据量大的情况下可能会引起磁盘排序。如果不需要删除重复记录,应该使用UNION ALL。
 Oracle从下到上处理Where子句中多个查询条件,所以表连接语句应写在其他Where条件前,可以过滤掉最大数量记录的条件必须写在Where子句的末尾。
 Oracle从右到左处理From子句中的表名,所以在From子句中包含多个表的情况下,将记录最少的表放在最后。(只在采用RBO优化时有效,下文详述)
 Order By语句中的非索引列会降低性能,可以通过添加索引的方式处理。严格控制在Order By语句中使用表达式。
 不同区域出现的相同的Sql语句,要保证查询字符完全相同,以利用SGA共享池,防止相同的Sql语句被多次分析。
 多利用内部函数提高Sql效率。
 当在Sql语句中连接多个表时,使用表的别名,并将之作为每列的前缀。这样可以减少解析时间。
需要注意的是,随着Oracle的升级,查询优化器会自动对Sql语句进行优化,某些限制可能在新版本的Oracle下不再是问题。尤其是采用CBO(Cost-Based Optimization,基于代价的优化方式)时。
我们可以总结一下可能引起全表扫描的操作:


在索引列上使用NOT或者"<>";
 对索引列使用函数或者计算;
 NOT IN操作;
 通配符位于查询字符串的第一个字符;
 IS NULL或者IS NOT NULL;
 多列索引,但它的第一个列并没有被Where子句引用;




Oracle优化器
Oracle优化器(Optimizer)是Oracle在执行SQL之前分析语句的工具。Oracle的优化器有两种优化方式:基于规则的(RBO)和基于代价的(CBO)。


RBO:优化器遵循Oracle内部预定的规则。
 CBO:依据语句执行的代价,主要指对CPU和内存的占用。优化器在判断是否使用CBO时,要参照表和索引的统计信息。统计信息要在对表做analyze后才会有。Oracle8及以后版本,推荐用CBO方式。
 Oracle优化器的优化模式主要有四种:
 Rule:基于规则;
 Choose:默认模式。根据表或索引的统计信息,如果有统计信息,则使用CBO方式;如果没有统计信息,相应列有索引,则使用RBO方式。
 First rows:与Choose类似。不同的是如果表有统计信息,它将以最快的方式返回查询的前几行,以获得最佳响应时间。
 All rows:即完全基于Cost的模式。当一个表有统计信息时,以最快方式返回表所有行,以获得最大吞吐量。没有统计信息则使用RBO方式。
 设定优化模式的方式
 Instance级别:在init<SID>.ora文件中设定OPTIMIZER_MODE;
 Session级别:通过SQL> ALTER SESSION SET OPTIMIZER_MODE=;来设定。
 语句级别:通过SQL> SELECT /ALL _ROWS/ ……;来设定。可用的HINT包括/+ALL_ROWS/、/+FIRST_ROWS/、/+CHOOSE/、/+RULE/ 等。
要注意的是,如果表有统计信息,则可能造成语句不走索引的结果。可以用SQL>ANALYZE TABLE table_name DELETE STATISTICS; 删除索引。对列和索引更新统计信息的SQL:SQL> ANALYZE TABLE table_name COMPUTE STATISTICS;SQL> ANALYZE INDEX index_name ESTIMATE STATISTICS;?

 

第二部分 常用SQL语句

 

第一章 

 

(1) 数据记录筛选: 
sql="select * from 数据表 where 字段名=字段值 order by 字段名 " 
sql="select * from 数据表 where 字段名 like ‘%字段值%‘ order by 字段名 " 
sql="select top 10 * from 数据表 where 字段名 order by 字段名 " 
sql="select * from 数据表 where 字段名 in (‘值1‘,‘值2‘,‘值3‘)" 
sql="select * from 数据表 where 字段名 between 值1 and 值2" 


(2) 更新数据记录: 
sql="update 数据表 set 字段名=字段值 where 条件表达式" 
sql="update 数据表 set 字段1=值1,字段2=值2 …… 字段n=值n where 条件表达式" 


(3) 删除数据记录: 
sql="delete from 数据表 where 条件表达式" 
sql="delete from 数据表" (将数据表所有记录删除) 


(4) 添加数据记录: 
sql="insert into 数据表 (字段1,字段2,字段3 …) valuess (值1,值2,值3 …)" 
sql="insert into 目标数据表 select * from 源数据表" (把源数据表的记录添加到目标数据表) 


(5) 数据记录统计函数: 
AVG(字段名) 得出一个表格栏平均值 
COUNT(*|字段名) 对数据行数的统计或对某一栏有值的数据行数统计 
MAX(字段名) 取得一个表格栏最大的值 
MIN(字段名) 取得一个表格栏最小的值 
SUM(字段名) 把数据栏的值相加 


引用以上函数的方法: 
sql="select sum(字段名) as 别名 from 数据表 where 条件表达式" 
set rs=conn.excute(sql) 


用 rs("别名") 获取统的计值,其它函数运用同上。 


(5) 数据表的建立和删除: 


CREATE TABLE 数据表名称(字段1 类型1(长度),字段2 类型2(长度) …… ) 


例:CREATE TABLE tab01(name varchar(50),datetime default now()) 


DROP TABLE 数据表名称 (永久性删除一个数据表) 


(6) 记录集对象的方法: 
rs.movenext 将记录指针从当前的位置向下移一行 
rs.moveprevious 将记录指针从当前的位置向上移一行 
rs.movefirst 将记录指针移到数据表第一行 
rs.movelast 将记录指针移到数据表最后一行 
rs.absoluteposition=N 将记录指针移到数据表第N行 
rs.absolutepage=N 将记录指针移到第N页的第一行 
rs.pagesize=N 设置每页为N条记录 
rs.pagecount 根据 pagesize 的设置返回总页数 
rs.recordcount 返回记录总数 
rs.bof 返回记录指针是否超出数据表首端,true表示是,false为否 
rs.eof 返回记录指针是否超出数据表末端,true表示是,false为否 
rs.delete 删除当前记录,但记录指针不会向下移动 
rs.addnew 添加记录到数据表末端 
rs.update 更新数据表记录 


判断所填数据是数字型 


if not isNumeric(request("字段名称")) then 
response.write "不是数字" 
else 
response.write "数字" 
end if

第二章

两张关联表,删除主表中已经在副表中没有的信息 
delete from table1 where not exists ( select * from table2 where table1.field1=table2.field1 )


四表联查问题:
select * from a left inner join b on a.a=b.b right inner join c on a.a=c.c inner join d on a.a=d.d where .....


日程安排提前五分钟提醒 
SQL: select * from 日程安排 where datediff('minute',f开始时间,getdate())>5


一条sql 语句搞定数据库分页
select top 10 b.* from (select top 20 主键字段,排序字段 from 表名 order by 排序字段 desc) a,表名 b where b.主键字段 = a.主键字段 order by a.排序字段
具体实现:
关于数据库分页:

declare @start int,@end int
   @sql  nvarchar(600)
   set @sql=’select top’+str(@end-@start+1)+’+from T where rid not in(select top’+str(@str-1)+’Rid from T where Rid>-1)’
   exec sp_executesql @sql




注意:在top后不能直接跟一个变量,所以在实际应用中只有这样的进行特殊的处理。Rid为一个标识列,如果top后还有具体的字段,这样做是非常有好处的。因为这样可以避免 top的字段如果是逻辑索引的,查询的结果后实际表中的不一致(逻辑索引中的数据有可能和数据表中的不一致,而查询时如果处在索引则首先查询索引)


前10条记录
select top 10 * form table1 where 范围


选择在每一组b值相同的数据中对应的a最大的记录的所有信息(类似这样的用法可以用于论坛每月排行榜,每月热销产品分析,按科目成绩排名,等等.)
select a,b,c from tablename ta where a=(select max(a) from tablename tb where tb.b=ta.b)


包括所有在 TableA 中但不在 TableB和TableC 中的行并消除所有重复行而派生出一个结果表
(select a from tableA ) except (select a from tableB) except (select a from tableC)


随机取出10条数据
select top 10 * from tablename order by newid()


随机选择记录
select newid()


删除重复记录
1),delete from tablename where id not in (select max(id) from tablename group by col1,col2,...)
2),select distinct * into temp from tablename
  delete from tablename
  insert into tablename select * from temp
 这种操作牵连大量的数据的移动,这种做法不适合大容量但数据操作
3),例如:在一个外部表中导入数据,由于某些原因第一次只导入了一部分,但很难判断具体位置,这样只有在下一次全部导入,这样也就产生好多重复的字段,怎样删除重复字段


alter table tablename
--添加一个自增列
add  column_b int identity(1,1)
 delete from tablename where column_b not in(
select max(column_b)  from tablename group by column1,column2,...)
alter table tablename drop column column_b


写一条SQL查询语句将表中年纪为空的值更新为25
select isnull(age,25) from TableName

 

第三章 各种实用SQL语句

 

写出一条Sql语句:取出表A中第31到第40记录(SQLServer,以自动增长的ID作为主键,注意:ID可能不是连续的。

解1: select top 10 * from A where id not in (select top 30 id

from A)

解2: select top 10 * from A where id >(select max(id) from (select

top 30 id from A )as A)