如何等距抽样oracle,等距抽样什么意思

请教大神，查询SQL等间距抽样如何实现（数据库oracle）

撰写存储过程，定义变量i每次加10,1作为一个特殊的id来进行处理，

专注于为中小企业提供网站设计制作、成都网站建设服务,电脑端+手机端+微信端的三站合一,更高效的管理,为中小企业宁晋免费做网站提供优质的服务。我们立足成都，凝聚了一批互联网行业人才，有力地推动了1000多家企业的稳健成长，帮助中小企业通过网站建设实现规模扩充和转变。

如果不写存储过程，建议创建一个步长为10的序列，建立一个临时表a，插入序列值，然后用业务表关联a表。

oracle 多表查询抽样

这里有个博主的文章写的比较适合你

一、多表查询的基本概念

在之前所使用的查询操作之中，都是从一张表之中查询出所需要的内容，那么如果现在一个查询语句需要显示多张表的数据，则就必须应用到多表查询的操作，而多表查询的语法如下：

SELECT [DISTINCT] * | 字段 [别名] [,字段 [别名] ,…]

FROM 表名称 [别名], [表名称 [别名] ,…]

[WHERE 条件(S)]

[ORDER BY 排序字段 [ASC|DESC] [,排序字段 [ASC|DESC] ,…]];

但是如果要进行多表查询之前，首先必须先查询出几个数据 —— 雇员表和部门表中的数据量，这个操作可以通过COUNT()函数完成。

范例：查询emp表中的数据量 ——返回了14条记录

SELECT COUNT(*) FROM emp;

范例：查询dept表中的数据量 ——4条记录

SELECT COUNT(*) FROM dept;

额外补充一点：何为经验？

在日后的开发之中，很多人都肯定要接触到许多新的数据库和数据表，那么在这种时候有两种做法：

做法一：新人做法，上来直接输入以下的命令：

SELECT * FROM 表名称;

如果此时数据量较大的话，一上无法浏览数据，二有可能造成系统的死机；

做法二：老人做法，先看一下有多少条记录：

SELECT COUNT(*) FROM 表名称;

如果此时数据量较小，则可以查询全部数据，如果数据量较大则不能直接使用SELECT查询。

现在确定好了emp和dept表中的记录之后，下面完成一个基本的多表查询：

SELECT * FROM emp, dept;

但是现在查询之后发现一共产生了56条记录 = 雇员表的14条记录 * 部门表的4条记录，之所以会造成这样的问题，主要都是由数据库的查询机制所决定的，例如，如下图所示。

本问题在数据库的操作之中被称为笛卡尔积，就表示多张表的数据乘积的意思，但是这种查询结果肯定不是用户所希望的，那么该如何去掉笛卡尔积呢？

最简单的方式是采用关联字段的形式，emp表和dept表之间现在存在了deptno的关联字段，所以现在可以从这个字段上的判断开始。

当在查询之中，不同的表中有了相同字段名称的时候，访问这些字段必须加上表名称，即“表.字段”。

SELECT * FROM emp

WHERE emp.deptno=dept.deptno;

此时的查询结果之中已经消除了笛卡尔积，但是现在只属于显示上的消除，而真正笛卡尔积现在依然存在，因为数据库的操作机制就属于逐行的进行数据的判断，那么如果按照这个思路理解的话，现在假设两张表的数据量都很大的话，那么使用这种多表查询的性能。

范例：以sh用户的大数据表为例

SELECT COUNT(*) FROM sales, costs

WHERE sales.prod_id=costs.prod_id;

这两张表即便消除了笛卡尔积的显示，但是本身也会有笛卡尔积的问题，所以最终的查询结果会很慢显示，甚至是不显示，所以通过这道程序一定要记住，多表查询的性能是很差的，当然，性能差是有一个前提的：数据量大。

但是以上的程序也存在一个问题，在之前访问表中字段的时候使用的是“表.字段”名称，那么如果说现在假设表名称很长，例如

“yinhexi_diqiu_yazhou_zhongguo_beijing_xicheng_ren”，所以一般在进行多表查询的时候往往都会为表

起一个别名，通过别名.字段的方式进行查询。

SELECT * FROM emp e, dept d

WHERE e.deptno=d.deptno;

范例：查询出每一位雇员的编号、姓名、职位、部门名称、位置

1、确定所需要的数据表：

emp表：可以查询出雇员的编号、姓名、职位；

dept表：可以查询出部门名称和位置；

2、确定表的关联字段：emp.deptno=dept.deptno；

第一步：查询出每一位雇员的编号、姓名、职位

SELECT e.empno, e.ename, e.job

FROM emp e;

第二步：为查询中引入部门表，同时需要增加一个消除笛卡尔积的条件

SELECT e.empno, e.ename, e.job, d.dname, d.loc

FROM emp e, dept, d

WHERE e.deptno=d.deptno;

以后遇到问题，发现没有解决问题的思路，就按照上面的步骤进行，慢慢的分析解决，因为多表查询不可能一次性全部写出，需要逐步分析的。

范例：要求查询出每一位雇员的姓名、职位、领导的姓名。

现在肯定要准备出两个emp表，所以这个时候可以称为emp表的自身关联，按照之前的分析如下：

1、确定所需要的数据表：

emp表（雇员）：取得雇员的姓名、职位、领导编号；

emp表（领导）：取得雇员的姓名（领导的姓名）；

2、确定关联字段：emp.mgr=memp.empno（雇员的领导编号 = 领导（雇员）的雇员编号）

第一步：查询每一位雇员的姓名、职位

SELECT e.ename, e.job

FROM emp e;

第二步：查询领导信息，加入自身关联

SELECT e.ename, e.job, m.ename

FROM emp e, emp m

WHERE e.mgr=m.empno;

此时的查询结果之中缺少了“KING”的记录，因为KING没有领导，而要想解决这个问题，就需要等待之后讲解的左、右连接的问题了。

范例：查询出每个雇员的编号、姓名、基本工资、职位、领导的姓名、部门名称及位置。

1、确定所需要的数据表：

emp表：每个雇员的编号、姓名、基本工资、职位；

emp表（领导）：领导的姓名；

dept表：部门的名称及位置。

2、确定已知的关联字段：

雇员和部门：emp.deptno=dept.deptno;

雇员和领导：emp.mgr=memp.empno;

第一步：查询出每个雇员的编号、姓名、基本工资、职位

SELECT empno, ename, sal, job

FROM emp;

第二步：加入领导的信息，引入自身关联，同时增加消除笛卡尔积的条件

SELECT e.empno, e.ename, e.sal, e.job, m.ename

FROM emp e, emp m

WHERE e.mgr=m.empno;

第三步：加入部门的信息，引入dept表，既然有新的表进来，则需要继续增加消除笛卡尔积的条件

SELECT e.empno, e.ename, e.sal, e.job, m.ename, d.dname, d.loc

FROM emp e, emp m, dept d

WHERE e.mgr=m.empno AND e.deptno=d.deptno;

所以以后的所有类似的问题最好都能够按照如上的方式编写，形成自己的思路。

思考题：现在要求查询出每一个雇员的编号、姓名、工资、部门名称、工资所在公司的工资等级。

1、确定所需要的数据表：

emp表：雇员的编号、姓名、工资；

dept表：部门名称；

salgrade表：工资等级；

2、确定已知的关联字段：

雇员和部门：emp.deptno=dept.deptno;

雇员和工资等级：emp.sal BETWEEN salgrade.losal AND salgrade.hisal;

第一步：查询出每一个雇员的编号、姓名、工资

SELECT e.empno, e.ename, e.sal

FROM emp e;

第二步：引入部门表，同时增加一个消除笛卡尔积的条件

SELECT e.empno, e.ename, e.sal, d.dname

FROM emp e, dept d

WHERE e.deptno=d.deptno;

第三步：引入工资等级表，继续增加消除笛卡尔积的条件

SELECT e.empno, e.ename, e.sal, d.dname, s.grade

FROM emp e, dept d, salgrade s

WHERE e.deptno=d.deptno AND e.sal BETWEEN s.losal AND s.hisal;

如果现在有如下的进一步要求：将每一个工资等级替换成具体的文字信息，例如：

1 替换成第五等工资、2 替换成第四等工资、3 替换成第三等工资，依次类推 -- 依靠DECODE()实现

SELECT e.empno, e.ename, e.sal, d.dname

DECODE(s.grade,1,’第五等工资’,2,’第四等工资’,3,’第三等工资’,4,’第二等工资’,5,’第一等工资’) gradeinfo

FROM emp e, dept d, salgrade s

WHERE e.deptno=d.deptno AND e.sal BETWEEN s.losal AND s.hisal;

以后的所有的题目都按照类似的方式分析，只要是表关联，肯定有关联字段，用于消除笛卡尔积，只是这种关联字段需要根据情况使用不同的限定符号。

二、左、右连接

关于左、右连接指的是查询判断条件的参考方向，例如，下面有如下查询：

SELECT * FROM emp e, dept d WHERE e.deptno=d.deptno;

EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO DEPTNO DNAME LOC

---------- ---------- --------- ---------- -------------- ---------- ---------- ---------- ---------

7782 CLARK MANAGER 7839 09-6月 -81 2450 10 10 ACCOUNTING NEW YORK

7839 KING PRESIDENT 17-11月-81 5000 10 10 ACCOUNTING NEW YORK

7934 MILLER CLERK 7782 23-1月 -82 1300 10 10 ACCOUNTING NEW YORK

7369 SMITH CLERK 7902 17-12月-80 800 20 20 RESEARCH DALLAS

7876 ADAMS CLERK 7788 23-5月 -87 1100 20 20 RESEARCH DALLAS

7902 FORD ANALYST 7566 03-12月-81 3000 20 20 RESEARCH DALLAS

7788 SCOTT ANALYST 7566 19-4月 -87 3000 20 20 RESEARCH DALLAS

7566 JONES MANAGER 7839 02-4月 -81 2975 20 20 RESEARCH DALLAS

7499 ALLEN SALESMAN 7698 20-2月 -81 1600 300 30 30 SALES CHICAGO

7698 BLAKE MANAGER 7839 01-5月 -81 2850 30 30 SALES CHICAGO

7654 MARTIN SALESMAN 7698 28-9月 -81 1250 1400 30 30 SALES CHICAGO

7900 JAMES CLERK 7698 03-12月-81 950 30 30 SALES CHICAGO

7844 TURNER SALESMAN 7698 08-9月 -81 1500 0 30 30 SALES CHICAGO

7521 WARD SALESMAN 7698 22-2月 -81 1250 500 30 30 SALES CHICAGO

已选择14行。

部门一共有四个，但是现在只返回了三个部门的信息，缺少40部门，因为在雇员表之中没有一条记录是属于40部门的，所以现在不会显示40部门的信息，即：现在的查询以emp表为参考，那么如果说现在非要显示40部门呢？就必须改变这种参考的方向，就需要用使用左、右连接。

SELECT * FROM emp e, dept d WHERE e.deptno(+)=d.deptno;

EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO DEPTNO DNAME LOC

---------- ---------- --------- ---------- -------------- ---------- ---------- ---------- ---------

7782 CLARK MANAGER 7839 09-6月 -81 2450 10 10 ACCOUNTING NEW YORK

7839 KING PRESIDENT 17-11月-81 5000 10 10 ACCOUNTING NEW YORK

7934 MILLER CLERK 7782 23-1月 -82 1300 10 10 ACCOUNTING NEW YORK

7369 SMITH CLERK 7902 17-12月-80 800 20 20 RESEARCH DALLAS

7876 ADAMS CLERK 7788 23-5月 -87 1100 20 20 RESEARCH DALLAS

7902 FORD ANALYST 7566 03-12月-81 3000 20 20 RESEARCH DALLAS

7788 SCOTT ANALYST 7566 19-4月 -87 3000 20 20 RESEARCH DALLAS

7566 JONES MANAGER 7839 02-4月 -81 2975 20 20 RESEARCH DALLAS

7499 ALLEN SALESMAN 7698 20-2月 -81 1600 300 30 30 SALES CHICAGO

7698 BLAKE MANAGER 7839 01-5月 -81 2850 30 30 SALES CHICAGO

7654 MARTIN SALESMAN 7698 28-9月 -81 1250 1400 30 30 SALES CHICAGO

7900 JAMES CLERK 7698 03-12月-81 950 30 30 SALES CHICAGO

7844 TURNER SALESMAN 7698 08-9月 -81 1500 0 30 30 SALES CHICAGO

7521 WARD SALESMAN 7698 22-2月 -81 1250 500 30 30 SALES CHICAGO

40 OPERATIONS BOSTON

已选择15行。

现在发现40部门出现了，所以发现参考的方向已经改变了，而“(+)”就用于左、右连接的更改，这种符号有以下两种使用情况：

(+)=：放在了等号的左边，表示的是右连接；

=(+)：放在了等号的右边，表示的是左连接；

但是不用去刻意的区分是左还是右，只是根据查询结果而定，如果发现有些需要的数据没有显示出来，就使用此符号更改连接方向。

范例：查询每个雇员的姓名和领导的姓名

SELECT e.ename, e.job, m.ename

FROM emp e, emp m

WHERE e.mgr=m.empno(+);

可是这种符号是Oracle数据库自己所独有的，其他数据库不能使用。

三、SQL:1999语法

除了以上的表连接操作之外，在SQL语法之中，也提供了另外一套用于表连接的操作SQL，格式如下：

SELECT table1.column,table2.column

FROM table1 [CROSS JOIN table2]|

[NATURAL JOIN table2]|

[JOIN table2 USING(column_name)]|

[JOIN table2 ON(table1.column_name=table2.column_name)]|

[LEFT|RIGHT|FULL OUTER JOIN table2 ON(table1.column_name=table2.column_name)];

以上实际上是属于多个语法的联合，下面分块说明语法的使用。

1、交叉连接（CROSS JOIN）：用于产生笛卡尔积

SELECT * FROM emp CROSS JOIN dept;

笛卡尔积本身并不是属于无用的内容，在某些情况下还是需要使用的。

2、自然连接（NATURAL JOIN）：自动找到匹配的关联字段，消除掉笛卡尔积

SELECT * FROM emp NATURAL JOIN dept;

但是并不是所有的字段都是关联字段，设置关联字段需要通过约束指定；

3、JOIN…USING子句：用户自己指定一个消除笛卡尔积的关联字段

SELECT * FROM emp JOIN dept USING(deptno);

4、JOIN…ON子句：用户自己指定一个可以消除笛卡尔积的关联条件

SELECT * FROM emp JOIN dept ON(emp.deptno=dept.deptno);

5、连接方向的改变：

左（外）连接：LEFT OUTER JOIN…ON;

右（外）连接：RIGHT OUTER JOIN…ON;

全（外）连接：FULL OUTER JOIN…ON; -- 把两张表中没有的数据都显示

SELECT * FROM emp RIGHT OUTER JOIN dept ON(emp.deptno=dept.deptno);

在Oracle之外的数据库都使用以上的SQL:1999语法操作，所以这个语法还必须会一些（如果你一直使用的都是Oracle就可以不会了）。

再次强调：多表查询的性能肯定不高，而且性能一定要在大数据量的情况下才能够发现。

四、统计函数及分组查询

1、统计函数

在之前学习过一个COUNT()函数，此函数的功能可以统计出表中的数据量，实际上这个就是一个统计函数，而常用的统计函数有如下几个：

COUNT()：查询表中的数据记录；

AVG()：求出平均值；

SUM()：求和；

MAX()：求出最大值；

MIN()：求出最小值；

范例：测试COUNT()、AVG()、SUM()

统计出公司的所有雇员，每个月支付的平均工资及总工资。

SELECT MAX(sal),MIN(sal) FROM emp;

注意点：关于COUNT()函数

COUNT()函数的主要功能是进行数据的统计，但是在进行数据统计的时候，如果一张表中没有统计记录，COUNT()也会返回数据，只是这个数据是“0”。

SELECT COUNT(ename) FROM BONUS;

如果使用的是其他函数，则有可能返回null，但是COUNT()永远都会返回一个具体的数字，这一点以后在开发之中都会使用到。

ORACLE怎么做随机抽样

VALUE 函数的第一种形式返回一个大于或等于 0 且小于 1 的随机数;第二种形式返回一个大于或等于 LOW ，小于 HIGH 的随机数。下面是其用法的一个示例:

SQL select dbms_random.value, dbms_random.value(0,18) from dual;

VALUE DBMS_RANDOM.VALUE(0,18)

---------- -----------------------

0.05863200 12.9840987851451

当前名称：如何等距抽样oracle,等距抽样什么意思
本文URL：http://cdxtjz.cn/article/hsdgjs.html

如何等距抽样oracle,等距抽样什么意思

请教大神，查询SQL等间距抽样如何实现（数据库oracle）

oracle 多表查询 抽样

ORACLE怎么做随机抽样

其他资讯

oracle 多表查询抽样