首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >snakemake shell I/O重定向和使用脚本访问snakemake变量

snakemake shell I/O重定向和使用脚本访问snakemake变量
EN

Stack Overflow用户
提问于 2018-02-08 12:37:26
回答 2查看 669关注 0票数 1

问题很简单:

我想从一条规则中调用一个脚本,我希望这条规则两者兼而有之:

  • 执行stdout和stderr重定向
  • 从脚本访问snakemake变量(变量可以是列表和文本)

如果我使用shell:,我可以执行I/O重定向,但不能在脚本中使用snakemake变量。

注意:当然,可以将变量作为shell中的参数传递给脚本。但是,通过这样做,脚本不能区分文字变量和列表变量。

如果我使用script:,那么我可以访问我的snakemake变量,但是我不能执行I/O重定向和许多其他shell工具。

举一个例子来说明这个问题:

1)使用shell:

代码语言:javascript
复制
rule create_hdf5:
    input:
        genes_file = OUTPUT_PATH+'/{sample}/outs/genes.tsv'
    params:
        # frequencies is a list!!!
        frequencies = config['X_var']['freqs']
    output:
        HDF5_OUTPUT+'/{sample}.h5'
    log:
        out = LOG_FILES+'/create_hdf5/sample_{sample}.out',
        err = LOG_FILES+'/create_hdf5/sample_{sample}.err'
    shell:
        'python scripts/create_hdf5.py {input.genes_file} {params.frequencies} {output} {threads} 2> {log.err} 1> {log.out} '

问题1):很自然,python脚本认为频率列表中的每个元素都是一个新的参数。但是,脚本无法访问snakemake变量。

2)使用script:

代码语言:javascript
复制
rule create_hdf5:
    input:
        genes_file = OUTPUT_PATH+'/{sample}/outs/genes.tsv'
    params:
        # frequencies is a list!!!
        frequencies = config['X_var']['freqs']
    output:
        HDF5_OUTPUT+'/{sample}.h5'
    log:
        out = LOG_FILES+'/create_hdf5/sample_{sample}.out',
        err = LOG_FILES+'/create_hdf5/sample_{sample}.err'
    script:
        'scripts/create_hdf5.py'

问题2):我可以访问脚本中的snakemake变量。但是现在我不能使用bash工具,比如I/O重定向。

我想知道是否有办法实现这两者(也许我在snakemake文档中遗漏了什么)?提前感谢!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-02-12 11:59:12

如果可能的话,我建议您使用argparse解析模块来解析脚本的输入,以便它可以使用nargs="*"选项解析这样的参数列表:

代码语言:javascript
复制
def main():
    """Main function of the program."""
    parser = argparse.ArgumentParser(
        description=__doc__,
        formatter_class=argparse.ArgumentDefaultsHelpFormatter)
    parser.add_argument(
        "-g", "--genes_file",
        required=True,
        help="Path to a file containing the genes.")
    parser.add_argument(
        "-o", "--output_file",
        required=True,
        help="Path to the output file.")
    parser.add_argument(
        "-f", "--frequencies",
        nargs="*",
        help="Space-separated list of frequencies.")
    parser.add_argument(
        "-t", "--threads",
        type=int,
        default=1,
        help="Number of threads to use.")
    args = parser.parse_args()
    # then use args.gene_file as a file name and args.frequencies as a list, etc.

你可以这样称呼它:

代码语言:javascript
复制
shell:
    """
    python scripts/create_hdf5.py \\
        -g {input.genes_file} -f {params.frequencies} \\
        -o {output} -t {threads} 2> {log.err} 1> {log.out}
    """
票数 1
EN

Stack Overflow用户

发布于 2020-03-13 20:32:03

您可以使用snakemake.log varaibale访问python脚本中的日志文件名,这是一个包含两个文件名的列表:

代码语言:javascript
复制
snakemake.log = [ LOG_FILES+'/create_hdf5/sample_1.out', LOG_FILES+'/create_hdf5/sample_1.err' ]

因此,您可以在脚本中使用它来创建日志文件以进行日志记录。

代码语言:javascript
复制
import logging
mylogger = logging.getLogger('My logger')
# create file handler
fh = logging.FileHandler(snakemake.log[0])
mylogger.addHandler(fh)
mylogger.error("Some error")
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48685715

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档