数据相当大,每次运行它只需要几分钟,所以调试这个问题需要花费大量的时间。当我在较小的数据上运行like concat('%',T.item,'%')时,它似乎正确地标识了项。但是,当我在主DB上运行它(所显示的代码)时,它仍然显示了许多(甚至所有)异常。
编辑:当我添加NOT时,它似乎停止了标识项。
select distinct T.comment
from (select comment, source, item from data, non_informative where ticker != "O" and source != 7 and source != 6) as T
where T.comment not like concat('%',T.item,'%')
order by T.comment;comment和source在data,item在non_informative
来自T.item的一些项目:
“股票分析”、“内部交易”、“IIROC交易”
应该删除的示例注释
‘#内部交易#4 # MACNAB (董事、干事、首席执行官):为$NNN (国家注册会计师协会)提交的表格4
似乎搞不懂为什么要显示所有的物品
发布于 2012-12-13 16:33:02
(删除旧的查询)
试试这个查询-
SELECT comment FROM data, non_informative
WHERE ticker != 'O' AND source != 7 AND source != 6
GROUP BY comment
HAVING COUNT(IF(comment LIKE CONCAT('%', item, '%'), 1, NULL)) = 0发布于 2012-12-13 16:57:12
我没有明确的答案,但我可以建议一些可能的步骤来调查这个案件。
https://stackoverflow.com/questions/13863959
复制相似问题