当前位置:论坛首页 > Linux面板 > 求助

【待反馈】爬虫爬取网站内容返回的html页面呗注入非法代码

发表在 Linux面板2024-12-26 15:07 [复制链接] 5 177

为了能快速了解并处理您的问题,请提供以下基础信息:
面板、插件版本:8.0.5

系统版本:CentOS Linux release 8.1.1911 (Core)

问题描述:使用爬虫爬取网站内容, 返回的html页面数据错误, 头部标签前边被插入这么个东西  <!-23-10-jsc-->,

怀疑是nginx有什么代理 于是再nginx安装 目录进行查找 没找到这个字符串, 后来就在/www 目录找, 找到了  日志文件也打开了 应该是用2024年7月开始出现这种情况的
相关截图(日志、错误):

3333333.png
使用道具 举报 只看该作者 回复
发表于 2024-12-26 16:19:46 | 显示全部楼层
模仿百度蜘蛛爬取返回的是这样的
<!-23-10-jsc--><a href='?world/2024-12-26/717861.pptx'></a>

<a href='?food/2024-12-26/762067.xml'></a>

<a href='?good/2024-12-26/964293.pptx'></a>

<a href='?auto/2024-12-26/159722.xls'></a>

<a href='?tips/2024-12-26/719472.csv'></a>

<a href='?school/2024-12-26/743520.txt'></a>

<a href='?day/2024-12-26/706903.pptx'></a>

<a href='?and/2024-12-26/700139.txt'></a>

<a href='?music/2024-12-26/545417.csv'></a>

<a href='?advice/2024-12-26/699546.xml'></a>

<a ></a>

<a ></a>

<a href='http;//www.qymmrb.cn//zb_system/jss.php?and21/2024-12-26/205218.doc'></a>

<a ></a>

<a ></a>
使用道具 举报 回复 支持 反对
发表于 2024-12-27 11:49:44 | 显示全部楼层
那你现在还能复现成功吗?如果能的话。联系我qq
使用道具 举报 回复 支持 反对
发表于 2024-12-27 13:32:36 | 显示全部楼层
宝塔技术-小强 发表于 2024-12-27 11:49
那你现在还能复现成功吗?如果能的话。联系我qq

已经添加 Lewis qq名字
使用道具 举报 回复 支持 反对
发表于 2024-12-27 14:25:56 | 显示全部楼层
pbootcms 升级到最新版就可以了。低版本漏洞多。
使用道具 举报 回复 支持 反对
发表于 2024-12-30 16:26:48 | 显示全部楼层
宝塔技术-小强 发表于 2024-12-27 14:25
pbootcms 升级到最新版就可以了。低版本漏洞多。

已经升级到3.2.5了, 不知道后续如何了
使用道具 举报 回复 支持 反对
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

普通问题处理

论坛响应时间:72小时

问题处理方式:排队(仅解答)

工作时间:白班:9:00 - 18:00

紧急运维服务

响应时间:3分钟

问题处理方式:宝塔专家1对1服务

工作时间:工作日:9:00 - 18:30

宝塔专业团队为您解决服务器疑难问题

立即付费处理

工作时间:09:00至24:00

快速回复 返回顶部 返回列表