文章/答案/技术大牛

发布

社区首页 >问答首页 >从文本文件中的选项卡分隔列中对文本进行分类

问从文本文件中的选项卡分隔列中对文本进行分类
EN

Stack Overflow用户

提问于 2017-03-14 12:30:26

回答 2查看 93关注 0票数 0

我有一个类似于这的文本文件

        Education June 2007 Bachelors of Science in
Business Administration ORGANIZATION    ,
University of Phoenix   ORGANIZATION    .

        June 2005 Associate of Arts in
Liberal Arts    ORGANIZATION    ,
Victor Valley Junior College    ORGANIZATION    ,
Victorville LOCATION    ,
CA  LOCATION    .

我想检索分隔开的前两列的选项卡，所以我使用了以下方法：

cut -f 1-2 input.txt > output.txt

真是太棒了！

现在，我希望第二列中有组织的行，并在第一列中包含特定的单词，即对于每一行，如果第二列表示组织，请检查第一列中是否有"University“、"School”、"College“等字，如果是，则在输出文件中写入。

是否可以通过修改以下代码或在python中编写新代码来实现这一目标?：

cut -f 2-3 input.txt > output.txt

输出应该如下所示：

University of Phoenix   ORGANIZATION
Victor Valley Junior College    ORGANIZATION

classification

python

bash

python-3.x

filter

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-03-14 12:54:07

 awk -F"/t" '$1 ~ /University|Business/ && $(NF-1) ~ /ORGANIZATION/' as
Business Administration ORGANIZATION    ,
University of Phoenix   ORGANIZATION    .

如果第一列包含大学或业务和最后一列包含组织，则打印该行。在这里，它的最后一列，但它的第二列，实际的最后一列是逗号/句号。

*在这里，您可以更改列号以获得所需的结果。这只是awk的方式或写作条件。

票数 2

Stack Overflow用户

发布于 2017-03-14 12:48:05

您可以使用sed

cut -f 1-2 file.txt | sed -n '/(Business|University).*ORGANIZATION/p' > output.txt

这应该匹配包含业务、大学和组织的所有行，并打印它们(p)。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/42786078

复制

相似问题

问从文本文件中的选项卡分隔列中对文本进行分类
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从文本文件中的选项卡分隔列中对文本进行分类EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从文本文件中的选项卡分隔列中对文本进行分类
EN