下面的代码昨天工作了,现在它挂在终端上,给出了错误的list index out of range,但是当我使用IDE运行相同的代码时,它工作得很好。
我不明白这是怎么回事。不,网址不是无效的。
import requests
import bs4
import webbrowser
import csv
def CheckStock(url):
'''checks for shoes in stock'''
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
RawHTML = requests.get(url, headers=headers)
Page = bs4.BeautifulSoup(RawHTML.text, "lxml")
ListOfRawSizes = Page.select('.size-dropdown-block')
Sizes = str(ListOfRawSizes[0].getText()).replace('\t', '')
Sizes = Sizes.replace('\n\n', ' ')
Sizes = Sizes.split()
Sizes.remove('Select')
Sizes.remove('size')
return Sizes 发布于 2017-06-05 02:37:19
问题是,如果您的页面不包含带有.size-dropdown-block类的任何元素,则ListOfRawSizes[0]索引将超出范围。如果列表为空,则不能请求列表中的第一项,这将引发index out of range错误。这很可能是因为页面与前一天有所不同,直到您现在尝试它时为止。
在尝试索引列表之前,您需要检查ListOfRawSizes中是否有任何项。幸运的是,python可以方便地检查列表是否为空,如果列表中至少有一项,则if ListOfRawSizes:将为真。
ListOfRawSizes = Page.select('.size-dropdown-block')
# check to see if the list of raw sizes is not empty
if ListOfRawSizes:
# we have at least one size so get the first item and do our work
Sizes = str(ListOfRawSizes[0].getText()).replace('\t', '')
Sizes = Sizes.replace('\n\n', ' ')
Sizes = Sizes.split()
Sizes.remove('Select')
Sizes.remove('size')
return Sizes
# if we hit the else clause, our list must be empty
else:
# ...so return an empty list
return []此外,你真的不应该用大写字母来命名变量。这很容易与类名发生冲突。Python中的变量遵循"snake大小写“的约定;所有小写都带有下划线以分隔单词。(如:this_is_snake_case)。
https://stackoverflow.com/questions/44360577
复制相似问题