腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
如何限制非谷歌搜索引擎机器人的爬行速度,使它们不会使我超过外部API请求限制?
我正在为一个客户建立一个
亚马逊
附属网站,使用
亚马逊
产品API从他们的目录中获取数据。我需要关于如何去对待其他搜索引擎
爬虫
机器人的建议。有什么好方法可以尽可能地避免由于机器人爬行而超过
亚马逊
的API速率限制?
浏览 17
提问于2016-09-16
得票数 1
1
回答
我应该使用什么数据存储来存储来自
爬虫
程序的临时数据?
我的
爬虫
正在抓取所有网站并从中获取元数据信息。然后,我将运行一个脚本来清理URL并将它们存储在Amazon RDS中。我不希望
爬虫
击中
亚马逊
RDS,这会减慢它的速度。 我应该使用
亚马逊
SimpleDB吗?然后,我可以读取SimpleDB,对网址进行杀毒,然后将其移动到Amazon RDS。
浏览 1
修改于2012-03-22
得票数 3
回答已采纳
1
回答
在两个ASP.NET核心API之间传输数据结构的最佳方法
API-1生成一个巨大的数据集,类似于我的最终目标是找到最有效的方法将这些数据传输到
API
我发现了两种方法:有没有办法像字节一样
浏览 4
修改于2022-01-27
得票数 0
回答已采纳
1
回答
从本地主机和外部ips访问robots.txt
我使用
亚马逊
云托管我的网站。在过去的三个月里,我收到了来自
亚马逊
团队的邮件,说网络流量很高。在收到邮件后,我们正在使我们的实例更安全,代码更清晰。当我检查这个的时候,我可以看到一个像这样的帖子,上面说谷歌
爬虫
可能导致了攻击。当我检查访问日志时,我可以看到已经从bot本地主机(127.0.0.1)和外部ip访问了robots.txt。谁能让我确定这个附件是由于谷歌
爬虫
或不?
浏览 1
提问于2015-01-01
得票数 0
1
回答
如何确保web crawler适用于托管在
亚马逊
S3上的网站并使用AJAX
谷歌网站管理员指南解释说,web服务器应该处理包含_escaped_fragment_的url请求(
爬虫
将www.example.com/ajax.html#!mystate修改为url 我的网站位于
亚马逊
S3上,我没有web服务器来处理此类请求。我如何才能确保
爬虫
获得提要,我的网站获得索引?
浏览 0
提问于2012-10-09
得票数 6
1
回答
如何在点击链接时发送cookie?
使用我从API-1获得的两个cookie,然后我需要调用下一个API (让我们称它为
API-2
)来获得zip文件。当我尝试调用API-1来获取Postman rest client中的cookie,然后键入Chrome上
API-2
的URL时,我能够开始下载zip文件。这里没有身份验证错误,因为我在运行
API-2
之前运行API-1时已经得到了存储在Chrome中的cookie。现在我的问题是,如何确保可以创建一个链接(
API-2
的URL),并在用户单击该链接时传递cookie。我希望用户能够下载压缩文件后,他点击了链接。需要
浏览 1
提问于2016-04-19
得票数 0
2
回答
MassTransit:为多个API实例配置队列
然后我有另一个API (#
API-2
),它存储实体的内存中副本。这个#
API-2
必须订阅这些事件才能更新其本地缓存。#
API-2
将有多个正在运行的实例,比方说3。如何配置#
API-2
,使所有实例都接收相同的消息 services.AddMassTransit(x => x.UsingRabbitMq();消费者配置(#
API-2
): services.AddMas
浏览 4
提问于2020-12-02
得票数 0
回答已采纳
1
回答
如何在剃刀页面(Blazor WebAssembly)中访问launchSettings.json文件中的属性?
"APIs": { "
API-2
": "http://localhost现在我需要访问Student.razor页面中的API-1和
API-2
值。我试着这样使用它..
浏览 12
修改于2020-07-04
得票数 1
回答已采纳
1
回答
如何在使用
亚马逊
S3时将
爬虫
请求重定向到预呈现的页面?
问题我需要的是用about.html文件的预呈现版本来回答这个请求。我已经用Phantom.js完成了这个预呈现,但是我不能为
爬虫
提供正确的文件,因为S3没有重写规则。.*)$ /snapshots/$1.html break; } 但在
亚马逊
S
浏览 3
提问于2015-09-07
得票数 6
回答已采纳
3
回答
从Amazon抓取客户评论
我想知道是否有任何方法,我可以抓取客户评论的特定产品从
亚马逊
,而不被封锁。现在,我的
爬虫
几次就被堵住了。任何想法都会感激的。
浏览 0
提问于2017-05-25
得票数 2
1
回答
如何处理超时错误并确保只执行一次请求
在其中一轮中,我被问到了以下问题: 如果有一个服务(API-1)调用另一个服务
API-2
(它与DB交互并更新数据)。例如,如果API-1将$500作为请求传递给
API-2
,以在DB金额中进行某些扣除(考虑cashapp或paypal的用例),并且
API-2
由于某种原因而失败(可能是网络错误、超时错误或任何其他原因)。API-1还是
API-2
?我们该如何处理呢?
浏览 21
提问于2021-03-26
得票数 0
1
回答
处理Azure逻辑应用程序动作输出
我需要把这个输出作为
API-2
的输入。 我使用了这个@body('My_Action_Name')和@{body('Action_Name')}。但是它只是作为输出返回给我的
API-2
。
浏览 3
提问于2016-04-28
得票数 0
回答已采纳
1
回答
如何禁用NestJs缓存API响应
I hit
API-2
... it gives me the response plus the previous response.提前谢谢。这是
API-2
,它返回上一个API-1的响应。
浏览 0
修改于2020-05-05
得票数 1
1
回答
将JWT令牌从一个SPRING API传递到另一个API的最佳方法
FE通过其BFF调用API 上面的API-1和
API-2
是两个spring API,对于这个问题,我假设BFF将jwt令牌传递给API-1,API-1也遵循建议的过程来验证令牌。我的问题是,建议API-1获取请求标头中的令牌,并使用spring特性将其传递给
API-2
。(目前,我使用线程-局部变量来促进这一点,即在请求筛选器中,我将接收到的头添加到线程本地,然后执行其逻
浏览 3
修改于2021-08-04
得票数 2
1
回答
使用多个EC2实例爬行
我用python编写了一个爬行过程,它运行在
亚马逊
上的一个ec2实例上。我已经编写了这个
爬虫
,这样它就可以用它的结果向一个单独的"hub“实例报告。集线器处理
爬虫
的结果,
爬虫
可以自由地继续爬行。我在这个爬行实例中想到的是,克隆
爬虫
的几个实例很容易,每个实例都要向中心报告以便处理。 有冗余,所以如果一个
爬虫
被挂断,其余的
爬虫
可以继续工
浏览 2
修改于2015-01-08
得票数 0
回答已采纳
2
回答
防止恶意
爬虫
/刮板和DDoS攻击的方法
基本上,
爬虫
在网站上运行的频率很高,导致负载增加。这会导致带宽消耗,从而给其他人带来糟糕的用户体验。我想知道像谷歌、
亚马逊
和电子海湾这样的网站是如何防止这些事情的: 它们如何区分有用的
爬虫
(google/yahoo/msn)和不遵循robots.txt和其他规则的恶意
爬虫
?
浏览 0
修改于2011-10-14
得票数 0
1
回答
Python Scrapy代理在几轮之后就死了?
我想建立一个与scrapy
亚马逊
爬虫
。我不明白为什么..。rotating_proxies.middlewares.RotatingProxyMiddleware': 610,} 我有1000个代理,大多数都没有死,几乎都在另一个
爬虫
上工作,但几轮后就不在<
浏览 18
提问于2019-11-07
得票数 1
1
回答
如何从网站的多个无关部分刮取数据(使用Scrapy)
我做了一个抓取网络
爬虫
,可以刮
亚马逊
。它可以通过使用关键字列表搜索项目,并从结果页面中刮取数据。有谁知道如何以这种方式刮一个网站吗?谢谢。
浏览 4
提问于2020-12-14
得票数 0
回答已采纳
1
回答
当我使用job glue时,
亚马逊
S3中的数据是否会出现在公共互联网上?
我正在使用
亚马逊
网络服务创建一条数据传输线,我的数据存储在
亚马逊
S3存储桶中,我计划使用胶水
爬虫
在前缀下抓取数据以提取元数据,并在胶水作业之后执行ETL并将数据保存到另一个存储桶中。有没有可能通过公共互联网将数据从
亚马逊
S3移动到胶水? 是否有任何指向aws文档的链接,用于解释AWS服务在它们之间传输数据时使用哪些网络?
浏览 18
修改于2021-06-29
得票数 1
2
回答
用.NET核心进行异步编程?
立即调用
API-2
提交从API-1接收的数据。 假设
API-2
需要20秒,API-1也在20秒后被调用.如何使
API-2
调用异步,使其不必等待
API-2
响应?public class SomeData publi
浏览 4
修改于2016-08-12
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券