首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从文本文件中的选项卡分隔列中对文本进行分类

从文本文件中的选项卡分隔列中对文本进行分类
EN

Stack Overflow用户
提问于 2017-03-14 12:30:26
回答 2查看 93关注 0票数 0

我有一个类似于的文本文件

代码语言:javascript
复制
        Education June 2007 Bachelors of Science in
Business Administration ORGANIZATION    ,
University of Phoenix   ORGANIZATION    .

        June 2005 Associate of Arts in
Liberal Arts    ORGANIZATION    ,
Victor Valley Junior College    ORGANIZATION    ,
Victorville LOCATION    ,
CA  LOCATION    .

我想检索分隔开的前两列的选项卡,所以我使用了以下方法:

代码语言:javascript
复制
cut -f 1-2 input.txt > output.txt

真是太棒了!

现在,我希望第二列中有组织的行,并在第一列中包含特定的单词,即对于每一行,如果第二列表示组织,请检查第一列中是否有"University“、"School”、"College“等字,如果是,则在输出文件中写入。

是否可以通过修改以下代码或在python中编写新代码来实现这一目标?:

代码语言:javascript
复制
cut -f 2-3 input.txt > output.txt

输出应该如下所示:

代码语言:javascript
复制
University of Phoenix   ORGANIZATION
Victor Valley Junior College    ORGANIZATION
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-03-14 12:54:07

代码语言:javascript
复制
 awk -F"/t" '$1 ~ /University|Business/ && $(NF-1) ~ /ORGANIZATION/' as
Business Administration ORGANIZATION    ,
University of Phoenix   ORGANIZATION    .

如果第一列包含大学业务最后一列包含组织,则打印该行。在这里,它的最后一列,但它的第二列,实际的最后一列是逗号/句号。

*在这里,您可以更改列号以获得所需的结果。这只是awk的方式或写作条件。

票数 2
EN

Stack Overflow用户

发布于 2017-03-14 12:48:05

您可以使用sed

代码语言:javascript
复制
cut -f 1-2 file.txt | sed -n '/(Business|University).*ORGANIZATION/p' > output.txt

这应该匹配包含业务、大学和组织的所有行,并打印它们(p)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42786078

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档