腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
使用AWS Glue Crawler创建列名时删除/重命名特殊字符
我正在使用AWS
爬虫
爬行S3桶,它在雅典娜中创建表模式。据我所知,雅典娜不支持具有特殊字符的列名,比如(
反
斜杠)等等。这是一种可以在
爬虫
从S3桶中爬行时排除/重命名这些列名的方法。
浏览 3
修改于2021-10-14
得票数 2
回答已采纳
1
回答
在数据库中查找和替换URL,而不尾随URL末尾的斜杠
但是,一些放置内容的人在<a href""></a> URL的末尾没有添加
反
斜杠(尾斜杠)的情况下就生成了URL。它会自动添加一个
反
斜杠到末尾,这可以算作谷歌
爬虫
的重定向。TL;博士 如何在没有
反
斜杠的情况下替换WordPress内容中的所有URL,使用(https://test.com/testpage)并添加
反
斜杠(https://test.com/testpage/
浏览 0
修改于2020-10-16
得票数 0
0
回答
使用Python
爬虫
,怎么处理
反
爬机制?
python
、
爬虫
、
验证码
、
requests
、
数据
我用Python requests来请求数据,但经常出现bug,要没ip无效,要么需要验证码,怎么处理呢?
浏览 184
提问于2025-07-19
2
回答
在它们的真实符号中变成utf
我刚刚自己做了第一个网络
爬虫
,它上了维基百科,下载了整个页面的html。我设法获得了一个列表的内容。列表中的值包含正数或负数。但它给了我一个'\xe2\x88\x922',而不是打印出一个'-2'。我尝试了string.replace("\xe2\x88\x92","-"),但由于
反
斜杠的原因,这似乎不起作用。你知道我怎样才能把这些utf东西转换成它们真正的符号吗?
浏览 18
修改于2020-07-04
得票数 3
1
回答
如何抓取Vue构建的基于组件的web应用程序并作出反应?
javascript src=/static/js/app.335a9e9866cb7dc6a517.js></script> </html>我使用Abot框架爬行建议
浏览 7
提问于2022-03-06
得票数 0
回答已采纳
1
回答
爬虫
/SEO友好/Mod重写/它没有任何意义
它看起来很漂亮,链接最糟糕的是后面跟着一个
反
斜杠。 我的客户发行的。他想知道为什么管理员和用户的后端界面仍然显示那些巨大的丑陋链接。这些是非常非常丑陋的链接,我说的是三到四个
反
斜杠,后面跟着不同的get序列等等,所以你可能会理解MOD_REWRITING背后的复杂性。一时冲动,我说我让它保持原样是为了确保后端接口不会被任何
爬虫
嗅探到。但我不确定这是否一定是真的。
爬虫
在哪里停下来?他们什么时候会放弃尝试解析链接呢?我知道我可以使用.robot文件来指定规则。
浏览 1
提问于2012-03-16
得票数 1
回答已采纳
2
回答
在Service Fabric服务之间移动大型数据是一种
反
模式吗?
我正在使用Service Fabric开发一个web数据
爬虫
。我已经将爬行过程划分为无状态服务管道。第一个服务加载HTML。(S1)第二个函数解析其中的数据。本身就是大量的数据,我不得不设置这种设计是
反
模式吗
浏览 0
修改于2017-10-01
得票数 0
2
回答
木偶人爬行器大规模爬行
我们正在使用Puppeteer编写一个网络
爬虫
。我们写的木偶
爬虫
执行和爬行网站的网址没有问题的网页,如约1,500 -
5
,000,但是,当我们执行的网站超过
5
,000,如果它在中间由于一些错误或崩溃而中断,那么它需要重新开始。如果出现任何错误,如何使基于Puppeteer的网络
爬虫
从爬行的最后状态恢复?在Puppeteer中有没有内置的函数?如何让这个木偶手无头的chrome web爬行通过一个队列系统?
浏览 14
提问于2020-12-05
得票数 2
1
回答
每隔
5
分钟向作为POST请求参数传递的URL发送统计数据
我需要将
爬虫
统计信息发送到作为
爬虫
参数传递的URL。我需要每隔
5
分钟定期发送一次POST请求。我该怎么做呢?
浏览 0
提问于2019-02-15
得票数 0
4
回答
HTML
5
语义标记在intranet应用程序中的用途是什么?
据我所知,HTML
5
语义标记的唯一真正优势是搜索引擎和web
爬虫
能够更好地解释文档。 由于内部网应用程序与搜索引擎或网络
爬虫
无关,在HTML
5
中使用语义标记有哪些优点?
浏览 5
修改于2017-06-08
得票数 2
回答已采纳
2
回答
PHP:无法使用CURL解析特定站点
下面是我的代码:function get_data($url) { $timeout =
5
;这就是有问题的URL: 这个页面上是否有某种
反
爬虫
代码在运行?
浏览 0
提问于2012-02-18
得票数 0
回答已采纳
2
回答
反
斜杠在C程序初始化中的作用是什么?
无
反
斜杠 无符号字符a=\
5
; 假设两者的工作原理相同,那么
反
斜杠的实际用途是什么?
浏览 4
修改于2020-11-16
得票数 1
1
回答
在http代理上curl .onion url不返回预期的源。
输出看起来像垃圾:背景chunkHighMark = 67108864 socksProxyType = socks
5
= truedisableV
浏览 0
修改于2013-08-09
得票数 1
1
回答
在C#中添加延迟的最佳方法
我目前正在建立一个网络
爬虫
,并希望增加一个延迟的请求,这样我就不会击中网络服务器硬。另外,
爬虫
的适当延迟量是多少?我在想.
5
-1秒。 谢谢
浏览 2
提问于2013-03-28
得票数 0
回答已采纳
3
回答
在使用JSON.stringify时,如何在字符串中保留
反
斜杠?
所以我得到了一个带
反
斜杠的字符串。"kIurhgFBOzDW
5
il89\/lB1ZQnmmY="。我尝试添加额外的'\',但JSON.stringify( "kIurhgFBOzDW
5
il89\\/lB1ZQnmmY=")返回的字符串有两个
反
斜杠而不是一个
反
斜杠。有没有办法使用JSON.stringify保留
反
斜杠?
浏览 8
修改于2014-03-12
得票数 10
回答已采纳
1
回答
如何阻止facebook
爬虫
导致CPU使用率过高
事实证明,
爬虫
以极高的速度访问我的网站,特别是Facebook。我试图将facebook
爬虫
的爬行延迟添加到robot.txt文件中,如下所示:Disallow:但我还是看到了高使用率的尖峰。这是由于错误的代码,还是有更好的方法来完全停止
爬虫
使用我的服务器的资源这么多? 任何帮助都是非常感谢的。
浏览 0
提问于2018-05-02
得票数 1
回答已采纳
1
回答
什么是评论的反弹攻击?
注释
反
斜杠黑客实际上是如何工作的?我有一个模糊的想法,因为
反
斜杠(出于某种原因),Mac会忽略以下规则。这就是我在这里读到的: #isnotMacIE
5
5
{显示:无;} #isMacIE
5
5
{显示:块;背景色:#060;颜色:#fff;} /*注释
反
斜杠攻击v2 \*/ #isnotMacIE
5
5
{显示:块;背景颜色:#060;颜色:#fff;}}isMacIE
5
5
{显
浏览 0
修改于2022-09-14
得票数 0
1
回答
Micropython: json文件中的字节数组
这些传感器的入口是“b”(b\xe
5
V\xb
5
\x01<:‘“)。这些是字节数组的字符串表示形式。如果我使用它来保存json文件中的入口,我会运行一些问题: 如果我直接存储“b‘( b'(b\xe
5
V\xb
5
\x01<:':’”),在读取json-文件之后,就没有单独的
反
斜杠,并且我得到b'(bxe
5
Vxb
5
x01<:‘inside python,如果我避开像“b’这样的
反
斜杠(b\xe
5</em
浏览 0
提问于2021-05-13
得票数 0
0
回答
PyQt
5
制作雪球网股票数据
爬虫
工具,源码谁有?
qt
、
爬虫
PyQt
5
制作雪球网股票数据
爬虫
工具,源码谁有
浏览 163
提问于2022-06-26
21
回答
数的
反
除数
给定一个正整数n,以任意顺序输出其所有
反
除数.
反
除数是指不把一个数字除以尽可能大的差额的数字。例如,20有
反
除数3,8和13。
反
除数的另一个名称是无偏的非除数。换句话说,1 < m < n是n的一个
反
除数,如果两者都是m是奇数,n % m等于(m-1)/2或(m+1)/2。值得注意的是,1不是任何数字的
反
除数,因为它不满足短语“不除数”。 适用标准的密码-高尔夫规则。以
浏览 0
提问于2022-08-10
得票数 23
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券