使用PHP提供文件的最快方法

ctehm74n  于 2022-12-28  发布在  PHP
关注(0)|答案(8)|浏览(218)

我试图组合一个函数,它接收文件路径,识别它是什么,设置适当的头文件,并像Apache那样提供服务。
我这样做的原因是因为我需要在提供文件之前使用PHP处理一些关于请求的信息。

速度至关重要
virtual()不是选项
必须在用户无法控制Web服务器(Apache/nginx等)的共享主机环境中工作

以下是我目前的发现:

File::output($path);

<?php
class File {
static function output($path) {
    // Check if the file exists
    if(!File::exists($path)) {
        header('HTTP/1.0 404 Not Found');
        exit();
    }

    // Set the content-type header
    header('Content-Type: '.File::mimeType($path));

    // Handle caching
    $fileModificationTime = gmdate('D, d M Y H:i:s', File::modificationTime($path)).' GMT';
    $headers = getallheaders();
    if(isset($headers['If-Modified-Since']) && $headers['If-Modified-Since'] == $fileModificationTime) {
        header('HTTP/1.1 304 Not Modified');
        exit();
    }
    header('Last-Modified: '.$fileModificationTime);

    // Read the file
    readfile($path);

    exit();
}

static function mimeType($path) {
    preg_match("|\.([a-z0-9]{2,4})$|i", $path, $fileSuffix);

    switch(strtolower($fileSuffix[1])) {
        case 'js' :
            return 'application/x-javascript';
        case 'json' :
            return 'application/json';
        case 'jpg' :
        case 'jpeg' :
        case 'jpe' :
            return 'image/jpg';
        case 'png' :
        case 'gif' :
        case 'bmp' :
        case 'tiff' :
            return 'image/'.strtolower($fileSuffix[1]);
        case 'css' :
            return 'text/css';
        case 'xml' :
            return 'application/xml';
        case 'doc' :
        case 'docx' :
            return 'application/msword';
        case 'xls' :
        case 'xlt' :
        case 'xlm' :
        case 'xld' :
        case 'xla' :
        case 'xlc' :
        case 'xlw' :
        case 'xll' :
            return 'application/vnd.ms-excel';
        case 'ppt' :
        case 'pps' :
            return 'application/vnd.ms-powerpoint';
        case 'rtf' :
            return 'application/rtf';
        case 'pdf' :
            return 'application/pdf';
        case 'html' :
        case 'htm' :
        case 'php' :
            return 'text/html';
        case 'txt' :
            return 'text/plain';
        case 'mpeg' :
        case 'mpg' :
        case 'mpe' :
            return 'video/mpeg';
        case 'mp3' :
            return 'audio/mpeg3';
        case 'wav' :
            return 'audio/wav';
        case 'aiff' :
        case 'aif' :
            return 'audio/aiff';
        case 'avi' :
            return 'video/msvideo';
        case 'wmv' :
            return 'video/x-ms-wmv';
        case 'mov' :
            return 'video/quicktime';
        case 'zip' :
            return 'application/zip';
        case 'tar' :
            return 'application/x-tar';
        case 'swf' :
            return 'application/x-shockwave-flash';
        default :
            if(function_exists('mime_content_type')) {
                $fileSuffix = mime_content_type($path);
            }
            return 'unknown/' . trim($fileSuffix[0], '.');
    }
}
}
?>
dz6r00yl

dz6r00yl1#

  • 我之前的回答是部分的,而且没有详细记录,下面是一个更新,总结了该回答以及讨论中其他人提供的解决方案。*

解决方案的排序是从最佳到最差,也是从需要对Web服务器进行最大控制的解决方案到需要较少控制的解决方案。似乎没有一种简单的方法可以让一个解决方案既快速又适用于任何地方。

使用X-SendFile头文件

正如其他人所记录的那样,这实际上是最好的方法,其基础是你在php中进行访问控制,然后告诉web服务器来做,而不是自己发送文件。
基本的php代码是:

header("X-Sendfile: $file_name");
header("Content-type: application/octet-stream");
header('Content-Disposition: attachment; filename="' . basename($file_name) . '"');

其中$file_name是文件系统上的完整路径。
这个解决方案的主要问题是它需要得到web服务器的允许,并且要么默认不安装(apache),要么默认不激活(lighttpd),要么需要特定的配置(nginx)。

Apache

在apache下,如果你使用mod_php,你需要安装一个名为mod_xsendfile的模块,然后配置它(如果你允许,可以在apache config或.htaccess中配置)

XSendFile on
XSendFilePath /home/www/example.com/htdocs/files/

使用此模块,文件路径可以是绝对路径,也可以是相对于指定XSendFilePath的路径。
光明日报
mod_fastcgi在使用配置时支持此功能

"allow-x-send-file" => "enable"

该功能的文档位于lighttpd wiki上,它们记录了X-LIGHTTPD-send-file标头,但X-Sendfile名称也有效
恩金斯
在Nginx上你不能使用X-Sendfile头文件,你必须使用他们自己的头文件,命名为X-Accel-Redirect。它是默认启用的,唯一真实的的区别是它的参数应该是一个URI而不是一个文件系统。结果是你必须在你的配置中定义一个标记为内部的位置,以避免客户端找到真正的文件url并直接访问它。他们的维基上有很多这样的东西。

符号链接和位置标题

您可以使用symlinks并重定向到它们,只需在用户被授权访问文件时使用随机名称创建指向文件的符号链接,然后使用以下命令将用户重定向到该文件:

header("Location: " . $url_of_symlink);

显然,您需要一种方法来修剪它们,无论是在调用创建它们的脚本时,还是通过cron(如果您有访问权限,则在计算机上,否则通过一些webcron服务)
在apache下,您需要能够在.htaccess或apache配置中启用FollowSymLinks

通过IP和位置报头进行访问控制

另一个黑客攻击是从php生成apache访问文件,允许显式的用户IP。在apache下,这意味着使用mod_authz_hostmod_accessAllow from命令。
问题是锁定对文件的访问权限(因为多个用户可能同时希望这样做)并不简单,可能会导致一些用户等待很长时间。而且无论如何,您仍然需要修剪文件。
显然,另一个问题是同一IP下的多个人可能会访问该文件。
∮当一切都失败∮
如果你真的没有办法让你的web服务器来帮助你,剩下的唯一解决方案是readfile它在目前使用的所有php版本中都可用,并且工作得很好(但不是很有效)。

合并溶液

总之,如果你想让你的php代码在任何地方都可用,最好的快速发送文件的方法是在某个地方设置一个可配置的选项,并根据web服务器的不同说明如何激活它,也许在你的安装脚本中设置一个自动检测。
这与许多软件中所做的非常相似

  • 清理网址(apache上的mod_rewrite
  • 加密函数(mcrypt php模块)
  • 多字节字符串支持(mbstring php模块)
7gs2gvoe

7gs2gvoe2#

最快的方法:不要这样做,看看x-sendfile header for nginx,其他的web服务器也有类似的东西,这意味着你仍然可以在php中做访问控制等,但是把文件的实际发送委托给一个专门设计的web服务器。
P.S:一想到在nginx上使用这个工具比在php上阅读和发送文件要高效得多,我就不寒而栗。试想一下,如果有100个人在下载一个文件:如果使用php + apache,很慷慨,大概有100* 15 mb = 1.5GB(大概是1.5GB)的内存,Nginx会直接把文件发送到内核,然后直接从磁盘加载到网络缓冲区,速度很快!
P. P. S:而且,使用这种方法,你仍然可以做所有你想要的访问控制,数据库的东西。

l7wslrjt

l7wslrjt3#

这是一个纯PHP的解决方案,我从我的个人框架中改编了以下函数:

function Download($path, $speed = null, $multipart = true)
{
    while (ob_get_level() > 0)
    {
        ob_end_clean();
    }

    if (is_file($path = realpath($path)) === true)
    {
        $file = @fopen($path, 'rb');
        $size = sprintf('%u', filesize($path));
        $speed = (empty($speed) === true) ? 1024 : floatval($speed);

        if (is_resource($file) === true)
        {
            set_time_limit(0);

            if (strlen(session_id()) > 0)
            {
                session_write_close();
            }

            if ($multipart === true)
            {
                $range = array(0, $size - 1);

                if (array_key_exists('HTTP_RANGE', $_SERVER) === true)
                {
                    $range = array_map('intval', explode('-', preg_replace('~.*=([^,]*).*~', '$1', $_SERVER['HTTP_RANGE'])));

                    if (empty($range[1]) === true)
                    {
                        $range[1] = $size - 1;
                    }

                    foreach ($range as $key => $value)
                    {
                        $range[$key] = max(0, min($value, $size - 1));
                    }

                    if (($range[0] > 0) || ($range[1] < ($size - 1)))
                    {
                        header(sprintf('%s %03u %s', 'HTTP/1.1', 206, 'Partial Content'), true, 206);
                    }
                }

                header('Accept-Ranges: bytes');
                header('Content-Range: bytes ' . sprintf('%u-%u/%u', $range[0], $range[1], $size));
            }

            else
            {
                $range = array(0, $size - 1);
            }

            header('Pragma: public');
            header('Cache-Control: public, no-cache');
            header('Content-Type: application/octet-stream');
            header('Content-Length: ' . sprintf('%u', $range[1] - $range[0] + 1));
            header('Content-Disposition: attachment; filename="' . basename($path) . '"');
            header('Content-Transfer-Encoding: binary');

            if ($range[0] > 0)
            {
                fseek($file, $range[0]);
            }

            while ((feof($file) !== true) && (connection_status() === CONNECTION_NORMAL))
            {
                echo fread($file, round($speed * 1024)); flush(); sleep(1);
            }

            fclose($file);
        }

        exit();
    }

    else
    {
        header(sprintf('%s %03u %s', 'HTTP/1.1', 404, 'Not Found'), true, 404);
    }

    return false;
}

这段代码非常高效,它关闭了会话处理程序,这样其他PHP脚本就可以为同一个用户/会话并发运行。(我怀疑这也是Apache默认做的),以便用户可以暂停/继续下载,并通过下载加速器获得更高的下载速度。它还允许您指定最大速度(以Kbps为单位),应通过$speed参数提供下载(部分)。

pokxtpni

pokxtpni4#

header('Location: ' . $path);
exit(0);

让Apache为您完成这项工作。

gj3fmq9x

gj3fmq9x5#

一个更好的实现,带有缓存支持,自定义的http头。

serveStaticFile($fn, array(
        'headers'=>array(
            'Content-Type' => 'image/x-icon',
            'Cache-Control' =>  'public, max-age=604800',
            'Expires' => gmdate("D, d M Y H:i:s", time() + 30 * 86400) . " GMT",
        )
    ));

function serveStaticFile($path, $options = array()) {
    $path = realpath($path);
    if (is_file($path)) {
        if(session_id())
            session_write_close();

        header_remove();
        set_time_limit(0);
        $size = filesize($path);
        $lastModifiedTime = filemtime($path);
        $fp = @fopen($path, 'rb');
        $range = array(0, $size - 1);

        header('Last-Modified: ' . gmdate("D, d M Y H:i:s", $lastModifiedTime)." GMT");
        if (( ! empty($_SERVER['HTTP_IF_MODIFIED_SINCE']) && strtotime($_SERVER['HTTP_IF_MODIFIED_SINCE']) == $lastModifiedTime ) ) {
            header("HTTP/1.1 304 Not Modified", true, 304);
            return true;
        }

        if (isset($_SERVER['HTTP_RANGE'])) {
            //$valid = preg_match('^bytes=\d*-\d*(,\d*-\d*)*$', $_SERVER['HTTP_RANGE']);
            if(substr($_SERVER['HTTP_RANGE'], 0, 6) != 'bytes=') {
                header('HTTP/1.1 416 Requested Range Not Satisfiable', true, 416);
                header('Content-Range: bytes */' . $size); // Required in 416.
                return false;
            }

            $ranges = explode(',', substr($_SERVER['HTTP_RANGE'], 6));
            $range = explode('-', $ranges[0]); // to do: only support the first range now.

            if ($range[0] === '') $range[0] = 0;
            if ($range[1] === '') $range[1] = $size - 1;

            if (($range[0] >= 0) && ($range[1] <= $size - 1) && ($range[0] <= $range[1])) {
                header('HTTP/1.1 206 Partial Content', true, 206);
                header('Content-Range: bytes ' . sprintf('%u-%u/%u', $range[0], $range[1], $size));
            }
            else {
                header('HTTP/1.1 416 Requested Range Not Satisfiable', true, 416);
                header('Content-Range: bytes */' . $size);
                return false;
            }
        }

        $contentLength = $range[1] - $range[0] + 1;

        //header('Content-Disposition: attachment; filename="xxxxx"');
        $headers = array(
            'Accept-Ranges' => 'bytes',
            'Content-Length' => $contentLength,
            'Content-Type' => 'application/octet-stream',
        );

        if(!empty($options['headers'])) {
            $headers = array_merge($headers, $options['headers']);
        }
        foreach($headers as $k=>$v) {
            header("$k: $v", true);
        }

        if ($range[0] > 0) {
            fseek($fp, $range[0]);
        }
        $sentSize = 0;
        while (!feof($fp) && (connection_status() === CONNECTION_NORMAL)) {
            $readingSize = $contentLength - $sentSize;
            $readingSize = min($readingSize, 512 * 1024);
            if($readingSize <= 0) break;

            $data = fread($fp, $readingSize);
            if(!$data) break;
            $sentSize += strlen($data);
            echo $data;
            flush();
        }

        fclose($fp);
        return true;
    }
    else {
        header('HTTP/1.1 404 Not Found', true, 404);
        return false;
    }
}
gjmwrych

gjmwrych6#

如果你有可能添加PECL扩展到你的php,你可以简单地使用来自Fileinfo package的函数来确定内容类型,然后发送正确的头...

nuypyhwy

nuypyhwy7#

这里提到的PHP Download函数在文件真正开始下载之前导致了一些延迟。我不知道这是由于使用了清漆缓存还是什么原因,但对我来说,完全删除sleep(1);并将$speed设置为1024对我很有帮助。现在它工作起来没有任何问题,速度快得要命。也许你也可以修改这个函数。因为我看到网上到处都在用它。

vlju58qv

vlju58qv8#

我编写了一个非常简单的函数,通过PHP和自动MIME类型检测来提供文件:

function serve_file($filepath, $new_filename=null) {
    $filename = basename($filepath);
    if (!$new_filename) {
        $new_filename = $filename;
    }
    $mime_type = mime_content_type($filepath);
    header('Content-type: '.$mime_type);
    header('Content-Disposition: attachment; filename="downloaded.pdf"');
    readfile($filepath);
}

用途

serve_file("/no_apache/invoice243.pdf");

相关问题