首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >检测在日期间隔之外的重复项

检测在日期间隔之外的重复项
EN

Stack Overflow用户
提问于 2011-08-24 20:21:44
回答 3查看 283关注 0票数 2

我搜索了一下,但找不到直接的答案。

有病人、医院、医疗分支(急诊科、泌尿外科、骨科、内科等)、医疗手术规范(检查、外科手术、MRI、超声等)。其他的)和病人探视日期。

病人看医生,医生开处方,并要求再来做对照检查。如果病人在 10天后返回,他必须向同一家医院支付另一笔检查费。医院可在10天后指定日期,告知今后10天内没有空位,以获得体检费。

表结构类似于:

代码语言:javascript
复制
Patient id.no   Hospital    Medical Branch     Medical Op. Code      Date
  1                 H1             M0                P1            01/05/2011
  5                 H1             M1                P9            03/05/2011
  3                 H2             M0                P2            09/05/2011
  1                 H1             M0                P1            14/05/2011 
  3                 H1             M0                P2            20/05/2011
  5                 H1             M2                P9            25/05/2011
  1                 H1             M0                P3            26/05/2011

在这里,探视三号及五号病人并不构成问题,因为第三号病人会探访不同的医院,而第五号病人则会探访不同的医疗科。他们即使在10天内来访,也要支付考试费。

然而,第一名病人在2005年1月1日和14日接受同样的检查(P1:检查),并在同一医院、同一分支机构就诊。

26/05不算,因为这不是体检。

我要标出的是同一个病人、同一家医院、同一个分支机构和相同的医疗操作代码(即专门的体检: P1 ),日期范围超过10天。

表的格式:

代码语言:javascript
复制
HOSPITAL        TOTAL NUM. of PATIENTS      NUM. of PATIENTS OUT OF DATE RANGE
  H1                        x                              a
  H2                        y                              b
  H3                        z                              c

谢谢。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2011-08-24 21:13:18

再一次,这是救援的分析功能。

该查询使用the ()函数将YOUR_TABLE中的记录与表中的前一个(按日期定义)匹配记录(由PATIENT_ID定义)链接起来。

代码语言:javascript
复制
select hospital_id
       , count(*) as total_num_of_patients      
       , sum (out_of_range) as num_of_patients_out_of_range
from (
    select patient_id
           , hospital_id
           , case
                   when hospital_id_1 = hospital_id_0
                   and  visit_1 > visit_0 + 10
                   and  med_op_code_1 = med_op_code_0
                   then 1
                   else 0
              end as out_of_range
    from (
            select patient_id
                   , hospital_id as hospital_id_1
                   , date as visit_1
                   , med_op_code as med_op_code_1
                   , lag (date) over (partition by patient_id order by date) as visit_0
                   , lag (hopital_id) over (partition by patient_id order by date) as hopital_id_0
                   , lag (med_op_code) over (partition by patient_id order by date) as med_op_code_0
            from your_table
            where med_op_code = 'P1'
        )
    )
group by hospital_id
/

注意:我还没有测试过这段代码,所以它可能包含语法错误。下次访问Oracle数据库时,我将检查它。

票数 2
EN

Stack Overflow用户

发布于 2011-08-24 21:38:26

这有点粗糙,因为我手头没有Oracle DB,但关键特性是相同的:分析函数延迟()。除了它的伴生函数LEAD()之外,它们还能很好地帮助处理诸如活动周期之类的事情。

下面是我对代码的尝试:

代码语言:javascript
复制
select n.hospital, COUNT(n.patient_id) as patients_out_of_date_range
from (
    select *
    from (
        select d.*, lag(date, 1) over (partition by d.patient_id, d.hospital, d.medical_branch, d.medical_op_code order by d.date) as prev_date
        from datatable d inner join
            (
                select d.patient_id, d.hospital, d.medical_branch, d.medical_op_code
                from datatable d
                where d.medical_op_code = 'P1'
                group by d.patient_id, d.hospital, d.medical_branch, d.medical_op_code
                having COUNT(d.date) > 1
            ) t on d.patient_id  = t.patient_id and d.hospital = t.hospital and d.medical_branch = t.medical_branch and d.medical_op_code = t.medical_op_code
        ) m
    where date - prev_date > 10
    ) n
group by n.hospital

就像我说的,这是没有测试的,但它至少应该让你从正确的方向开始。

参考文献:http://www.adp-gmbh.ch/ora/sql/analytical/lag.html

http://www.oracle-base.com/articles/misc/LagLeadAnalyticFunctions.php

票数 1
EN

Stack Overflow用户

发布于 2011-08-24 21:42:29

我想这就是你想要的:

代码语言:javascript
复制
WITH Patient_Visits (Patient_Id, Hospital_Id, Branch_Id, Visit_Date, Visit_Order) as ( 
                     SELECT Patient_Id, Hospital_Id, BranchId, Visit_Date, 
                            ROW_NUMBER() OVER(PARTITION BY Patient_ID, Hospital_Id, Branch_Id, 
                                              ORDER_BY Patient_Id, Hospital_Id, Branch_Id, Visit_Date)
                    FROM Hospital_Visits
                    WHERE Procedure_Id = 'P1'),
     Hospital_Recent_Visits (Hospital_Id, Recent_Visitor_Count) as (
                             SELECT a.Hospital_Id, COUNT(DISTINCT a.Patient_Id)
                             FROM Patient_Visits as a
                             JOIN Patient_Visits as b
                               ON b.Hospital_Id = a.Hospital_Id
                                  AND b.Branch_Id = a.Branch_Id
                                  AND b.Patient_Id = a.Patient_Id
                                  AND b.Visit_Order = a.Visit_Order - 1
                                  AND b.Visit_Date + 10 > a.Visit_Date
                             GROUP BY a.Hospital_Id, a.Patient_Id),
     Hospital_Patient_Count (Hospital_Id, Patient_Count) as (
                             SELECT Hospital_Id, COUNT(DISTINCT Patient_Id)
                             FROM Hospital_Visits
                             GROUP BY Hospital_Id, Patient_Id)
SELECT a.Hospital_Id, b.Patient_Count, c.Recent_Visitor_Count
FROM Hospitals as a
LEFT JOIN Hospital_Patient_Count as b
ON b.Hospital_Id = a.Hospital_Id
LEFT JOIN Hospital_Recent_Visits as c
ON c.Hospital_id = a.Hospital_Id

请注意,这是在DB2系统上编写和测试的。我认为Oracle数据库具有相关的功能,所以查询仍然应该像编写的那样工作。然而,DB2似乎缺少Oracle所具有的一些OLAP功能(至少我的版本),这对于剔除一些CTE可能是有用的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7181783

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档