我试图使用Python索引切片从变量中提取特定字符。我有以下变量
myvar =
'https://mystorageacct.blob.core.windows.net/testcontainer/29112013 FDD_Exec Summary 29 Nov 2013.pdf'我试着提取
29112013 FDD_Exec摘要2013年11月29日
我试过这样的索引
抓取= myvar:10,但结果并没有给出我2013年11月29日的29112013 FDD_Exec摘要。
有什么想法吗?
发布于 2022-06-07 15:03:18
myvar = 'https://mystorageacct.blob.core.windows.net/testcontainer/29112013 FDD_Exec Summary 29 Nov 2013.pdf'
# Split the string by '/' and you get a list of
# ['https:', '', 'mystorageacct.blob.core.windows.net', 'testcontainer','29112013 FDD_Exec Summary 29 Nov 2013.pdf']
# [-1] index is to pick the last one
# .replace('.pdf','') is to remove the '.pdf'
extract = myvar.split('/')[-1].replace('.pdf','')
print(extract)
>>> 29112013 FDD_Exec Summary 29 Nov 2013发布于 2022-06-07 14:36:04
我可能建议使用str.rpartition,这样您就不需要单独完成确定要分割哪些索引的工作了:
>>> myvar = 'https://mystorageacct.blob.core.windows.net/testcontainer/29112013 FDD_Exec Summary 29 Nov 2013.pdf'
>>> myvar.rpartition("/")[2]
'29112013 FDD_Exec Summary 29 Nov 2013.pdf'
>>> myvar.rpartition("/")[2].rpartition(".")[0]
'29112013 FDD_Exec Summary 29 Nov 2013'发布于 2022-06-07 14:38:02
我建议在任何与文件相关的事情中使用内置的pathlib。对于URL,似乎运行良好:
import pathlib
filename = pathlib.Path(myvar).name输出:
'29112013 FDD_Exec Summary 29 Nov 2013.pdf'https://stackoverflow.com/questions/72533065
复制相似问题