我有一个类似于这的文本文件
Education June 2007 Bachelors of Science in
Business Administration ORGANIZATION ,
University of Phoenix ORGANIZATION .
June 2005 Associate of Arts in
Liberal Arts ORGANIZATION ,
Victor Valley Junior College ORGANIZATION ,
Victorville LOCATION ,
CA LOCATION .我想检索分隔开的前两列的选项卡,所以我使用了以下方法:
cut -f 1-2 input.txt > output.txt真是太棒了!
现在,我希望第二列中有组织的行,并在第一列中包含特定的单词,即对于每一行,如果第二列表示组织,请检查第一列中是否有"University“、"School”、"College“等字,如果是,则在输出文件中写入。
是否可以通过修改以下代码或在python中编写新代码来实现这一目标?:
cut -f 2-3 input.txt > output.txt输出应该如下所示:
University of Phoenix ORGANIZATION
Victor Valley Junior College ORGANIZATION发布于 2017-03-14 12:54:07
awk -F"/t" '$1 ~ /University|Business/ && $(NF-1) ~ /ORGANIZATION/' as
Business Administration ORGANIZATION ,
University of Phoenix ORGANIZATION .如果第一列包含大学或业务和最后一列包含组织,则打印该行。在这里,它的最后一列,但它的第二列,实际的最后一列是逗号/句号。
*在这里,您可以更改列号以获得所需的结果。这只是awk的方式或写作条件。
发布于 2017-03-14 12:48:05
您可以使用sed
cut -f 1-2 file.txt | sed -n '/(Business|University).*ORGANIZATION/p' > output.txt这应该匹配包含业务、大学和组织的所有行,并打印它们(p)。
https://stackoverflow.com/questions/42786078
复制相似问题