langflow 代码执行漏洞与工具PythonCodeTool ```markdown 代码执行漏洞与工具PythonCodeTool ```

e4yzc0pl 于 2个月前发布在 Python

关注(0)|答案(5)|浏览(37)

Bug描述

当使用langflow组合LLM应用时，开发者可以使用PythonCodeTool在langchain中实现一个带有StructuredTool的工具。然而，Python代码缺乏验证，代码将直接执行。
一旦LLM应用部署到服务器上，服务器上可以执行任意代码。

async def build(
        self,
        tool_code: str,
        name: str,
        description: str,
        tool_function: List[str],
        return_direct: bool,
        tool_class: Optional[List[str]] = None,
    ) -> Tool:
        local_namespace = {}  # type: ignore
        exec(tool_code, globals(), local_namespace)

复现步骤

1.创建一个新项目。
2.将json文件导入到集合中。
PythonCodeTool.json
在PythonCodeTool中，Tool Code设置为使用os.popen读取/etc/passwd。
为了使用search工具，输入被设置为Search for the result。
同时输入一个有效的OPENAI API密钥和OPENAI BASE。
3.在Playground中运行Flow。在PythonCodeTool中执行代码，我们可以获取服务器上的/etc/passwd内容。

预期行为

由于所有输入都可以由用户控制，因此在执行用户代码时应考虑验证。在使用exec之前，应启用必要的操作并禁止恶意行为。

谁可以帮助？

@ogabrielluiz

操作系统

Ubuntu Linux 22.04

Langflow版本

v1.0.12

Python版本

=3.10

langflow

来源：https://github.com/langflow-ai/langflow/issues/2908

5条答案

按热度按时间

hsgswve41#

要解决Langflow中PythonCodeTool的安全问题，可以在使用exec之前实现验证，以防止执行恶意代码。以下是操作步骤：

使用validate_code函数:此函数将代码解析为抽象语法树(AST),并检查导入错误和函数定义错误。将此验证集成到PythonCodeTool类中。
修改build方法:确保在执行代码之前进行验证。

以下是如何实现这个过程的示例：

步骤1:实现`validate_code`函数

创建一个名为validate.py的文件，内容如下：

import ast
import importlib

def add_type_ignores():
if not hasattr(ast, "TypeIgnore"):
class TypeIgnore(ast.AST):
_fields = ()
ast.TypeIgnore = TypeIgnore

def validate_code(code):
errors = {"imports": {"errors": []}, "function": {"errors": []}}

try:
    tree = ast.parse(code)
except Exception as e:
    errors["function"]["errors"].append(str(e))
    return errors

add_type_ignores()
tree.type_ignores = []

for node in tree.body:
    if isinstance(node, ast.Import):
        for alias in node.names:
            try:
                importlib.import_module(alias.name)
            except ModuleNotFoundError as e:
                errors["imports"]["errors"].append(str(e))

for node in tree.body:
    if isinstance(node, ast.FunctionDef):
        code_obj = compile(ast.Module(body=[node], type_ignores=[]), "<string>", "exec")
        try:
            exec(code_obj)
        except Exception as e:
            errors["function"]["errors"].append(str(e))

return errors

步骤2:将验证集成到`PythonCodeTool`类中

修改PythonCodeTool类，在执行任何代码之前使用validate_code函数：

from typing import Callable, Optional, List
from pydantic.v1 import BaseModel, validator
from langflow.utils import validate_code
from langchain.agents.tools import Tool

class Function(BaseModel):
code: str
function: Optional[Callable] = None
imports: Optional[str] = None

def __init__(self, **data):
    super().__init__(**data)

@validator("code")
def validate_func(cls, v):
    errors = validate_code(v)
    if errors["imports"]["errors"] or errors["function"]["errors"]:
        raise ValueError(f"Code validation errors: {errors}")
    return v

def get_function(self):
    function_name = self.extract_function_name(self.code)
    return self.create_function(self.code, function_name)

class PythonCodeTool(Function, Tool):
name: str = "Custom Tool"
description: str
code: str

def __init__(self, name: str, description: str, code: str):
    self.name = name
    self.description = description
    self.code = code
    self.func = self.get_function()
    super().__init__(name=name, description=description, func=self.func)

async def build(
    self,
    tool_code: str,
    name: str,
    description: str,
    tool_function: List[str],
    return_direct: bool,
    tool_class: Optional[List[str]] = None,
) -> Tool:
    errors = validate_code(tool_code)
    if errors["imports"]["errors"] or errors["function"]["errors"]:
        raise ValueError(f"Code validation errors: {errors}")

    local_namespace = {}
    exec(tool_code, globals(), local_namespace)

    func = local_namespace[tool_function]
    _class = None

    if tool_class:
        _class = local_namespace[tool_class]

    tool = StructuredTool.from_function(
        func=func, args_schema=_class, name=name, description=description, return_direct=return_direct
    )
    return tool

通过集成validate_code函数，可以确保在执行代码之前进行验证，从而防止执行恶意代码1(https://github.com/logspace-ai/langflow/blob/dev/src/backend/base/langflow/utils/validate.py)2(https://github.com/logspace-ai/langflow/blob/dev/src/backend/langflow/utils/validate.py)3(https://github.com/langflow-ai/langflow/blob/dev/src/backend/base/langflow/utils/validate.py)4(https://github.com/langflow-ai/langflow/blob/dev/src/backend/base/langflow/interface/tools/custom.py)5(https://github.com/logspace-ai/langflow/blob/dev/src/backend/langflow/interface/tools/custom.py)。