宝塔用户_wlxvej 发表于 2024-12-26 15:07:13

【待反馈】爬虫爬取网站内容返回的html页面呗注入非法代码

为了能快速了解并处理您的问题,请提供以下基础信息:面板、插件版本:8.0.5
系统版本:CentOS Linux release 8.1.1911 (Core)
问题描述:使用爬虫爬取网站内容, 返回的html页面数据错误, 头部标签前边被插入这么个东西<!-23-10-jsc-->,
怀疑是nginx有什么代理 于是再nginx安装 目录进行查找 没找到这个字符串, 后来就在/www 目录找, 找到了日志文件也打开了 应该是用2024年7月开始出现这种情况的
相关截图(日志、错误):

宝塔用户_wlxvej 发表于 2024-12-26 16:19:46

模仿百度蜘蛛爬取返回的是这样的
<!-23-10-jsc--><a href='?world/2024-12-26/717861.pptx'></a>

<a href='?food/2024-12-26/762067.xml'></a>

<a href='?good/2024-12-26/964293.pptx'></a>

<a href='?auto/2024-12-26/159722.xls'></a>

<a href='?tips/2024-12-26/719472.csv'></a>

<a href='?school/2024-12-26/743520.txt'></a>

<a href='?day/2024-12-26/706903.pptx'></a>

<a href='?and/2024-12-26/700139.txt'></a>

<a href='?music/2024-12-26/545417.csv'></a>

<a href='?advice/2024-12-26/699546.xml'></a>

<a ></a>

<a ></a>

<a href='http;//www.qymmrb.cn//zb_system/jss.php?and21/2024-12-26/205218.doc'></a>

<a ></a>

<a ></a>

宝塔技术-小强 发表于 2024-12-27 11:49:44

那你现在还能复现成功吗?如果能的话。联系我qq

宝塔用户_wlxvej 发表于 2024-12-27 13:32:36

宝塔技术-小强 发表于 2024-12-27 11:49
那你现在还能复现成功吗?如果能的话。联系我qq

已经添加 Lewis qq名字

宝塔技术-小强 发表于 2024-12-27 14:25:56

pbootcms 升级到最新版就可以了。低版本漏洞多。

宝塔用户_wlxvej 发表于 2024-12-30 16:26:48

宝塔技术-小强 发表于 2024-12-27 14:25
pbootcms 升级到最新版就可以了。低版本漏洞多。

已经升级到3.2.5了, 不知道后续如何了
页: [1]
查看完整版本: 【待反馈】爬虫爬取网站内容返回的html页面呗注入非法代码